https://mp.weixin.qq.com/s/buv3R6AEr5PWhjpniYh_BQ
作者曾介绍过SAP将智能企业愿景推向市场的原因,以及帮助企业应对数字化挑战。
本篇博客的目的,是尝试解释机器学习的基本概念,以及如何在SAP的产品组合中利用它?
智能企业的一个关键要素,是将机器学习算法,注入企业软件业务流程。机器学习算法本身并不是什么新鲜事,但它们最近一直处于非常热门的状态,是因为我们正处于技术突飞猛进,并发展到可以做到大量应用可落地的阶段。
过去的30、50年,企业产生了大量的数据,最近的10年,企业数据产生的越来越快,越来越多。这些数据孕育了数字经济的曙光。如果它们得以有效的训练和处理,将会得到丰厚的回报。为企业带来价值。
1.
什么是机器学习?
机器学习算法的目标是确定一个数学模型,我们称之为函数f(),在y = f(x)中,其中x代表任何现实世界的观察,y代表一些评估,识别或处理由那些x。
有三种主要的机器学习算法类型:监督学习,半监督学习和无监督学习。
监督学习与标记数据一起工作,意味着通过分析训练数据,找出基于真实世界观察(x)的方程y = f(x)来预测/推断某些特定结果(y)。
半监督学习与一些标记数据和许多未标记数据一起工作,这意味着找出方程y = f(x),即使结果值(y)仅为有限的一组观察(x)所知,例如在抽样方案中。
无监督学习仅使用(x)输入数据,这意味着找出隐藏的结构或观察之间的关系(x)。从该分析中自动生成变量(y)。
为了增加另一层复杂性,我们打算定义的函数f()通常受很多变量的影响,彼此之间可能存在依赖关系:y = f(x1,x2,x3,…,xn)。
机器学习算法根据训练数据建立数学模型f(),最终目标是在没有明确编程的情况下进行统计预测或决策。
"训练"模型然后意味着从训练数据集的示例中确定所有(xn)的"正确"值(y)。例如,在监督学习中,机器学习算法通过检查许多标记数据(xn)并试图找到使损失最小化的模型来建立模型。
损失是指示模型预测在单个示例(a bad(y))上有多糟糕的数字。如果模型的预测是完美的,那么损失将为零;否则,损失会很高。训练模型的目的是找到一组具有低损耗的(xn),然后推断出正确的(y)。
下图为训练机器学习模型的机制: