MBML学习笔记1

近年来机器学习技术高速发展,它已经在各个领域得到了广泛的使用。然而对于新手来说,讲机器学习技术应用于实战是相当困难的。他们经常面临一下三个问题:

  • 可选择的技术、算法过多,很多还没学习过
  • 不了解已学习的技术中各算法的使用场景区别
  • 实际问题看起来不好用机器学习解决

在本系列文章中,我们将用新的角度来审视机器学习。它叫做Model-Based Machine Learning,它为解决上方问题而生。

什么是Model-Based Machine Learning?

在过去的几十年中,我们创造过多的机器学习算法,以至于研究者在解决问题时往往倾向于使用自己熟悉的算法,而这些算法很有可能并不是问题的最优解。
而在model-based方法里,我们的解决方案将是为每个问题量身定制的。相比在一般的机器学习过程中,我们将问题转化为适合传统方法处理的模型,Model-Based Machine Learning理论更倾向于为新的问题打造专属的解决方案。 其核心思想为:对于实际问题的一切预测都是以一个model的形式给出。事实上,model就是由大量的假设组成的,只不过以精确的数学方式表达。 Model-based machine learning几乎可以被使用在任何领域,而它的大范围可用性代表着您不需要学习大量的机器学习算法和技巧。
那么为何对于一个模型的假设如此重要?实际上,目前看来机器学习并不能单纯通过学习数据来生成解决方案。极其学习算法往往依赖着各种各样的假设,尽管很多时候这些假设和现实并不怎么符合。不同的算法对应于不同的假设的组合,并且当这些假设隐含在算法中时,衡量哪个算法比较好的工作将极大依赖于人类的经验,这是极其费时的,且一旦没有任何一个算法给出了好的结果,那么寻找一个更好的算法将更加困难。

Models和算法

现在让我们进一步思考model和算法之间的关系。我们可以将传统的机器学习算法看作一个黑箱,我们输入数据它就会输出对应的结果。黑箱中的算法必定包含某种假设,因为正是不同的假设将不同的算法区分开。然而,在一个传统机器学习算法中,这些他所依赖的假设往往是隐含的、不透明的。
而在我们的Model-Based ML中,我们的假设会显示地构成我们地模型,因此我们可以通过调整模型来表现不同的假设。这样就可以做到轻松适应不同的实际需求。更为具体地说,在MBML方案中,解决问题的算法分为两个部分:概率模型和推理算法,而其中推理算法是通用的。

总结

总而言之,MBML是一种新兴的万能机器学习方案。

参考资料


本文章使用limfx的vsocde插件快速发布