贝叶斯算法

贝叶斯概论

贝叶斯要解决的问题

  • 正向概率:假设袋子里有N个白球, M个黑球,你伸手进去摸一把,摸出黑球概率多大?
  • 逆向概率:如果我们事先不知道袋子里黑白求的比例,而是闭着眼睛摸出一个或者多个球,观察取出来的这些球的颜色以后,我们可以就此对袋子里面黑白求的比例做出什么推测?

贝叶斯解决的是逆向概率。

why贝叶斯?

  • 显示世界本身就是不确定的,人类的观察能力也有局限性。
  • 我们日常所观察到的只是事物表面的结果,因此需要提供一个猜测

公式推导

例:

  • 男生占比60%,女生占比40%。
  • 男生全部穿长裤,女生一半长裤一般裙子, 正向概率:随机选取一个学生,他传长裤的概率和穿裙子的概率是多大? 逆向概率:迎面走来一个穿长裤的学生,假如我们只能看见他的下半身,无法直接确定他的性别,能推断出踏实女生的概率多大吗?

假设:学校总共个人 穿长裤的男生

  • 是条件概率,即在boy这个条件下穿长裤的概率,在这里是100%

穿长裤的女生 穿长裤总数+ 即穿长裤的男生+女生

所以

  • =
  • blockformula_editorU*P(Girl)*P(Pants|Girl)/U*P(boy)*P(Pants|Boy)+U*P(Girl)*P(Pants|Girl) 可以发现,跟U总人数是无关的。 分母其实就是穿裤子的人的比例 分子就是

转换成贝叶斯公式

P(A \mid B)=\frac{P(B \mid A) P(A)}{P(B)}

可以把不好求的概率转化为好求的,不好求,那就先求 其中,

  • 是已知B发生的条件下A发生的概率,也称作A的后验概率
  • 是A的先验概率,因为他不考虑任何B方面的因素
  • 是A发生以后,B的条件概率,也可称为B的后验概率,在某些文献会称其为在特定B时,A的似然性[1],因为

  1. 但是在统计学中,“似然性”和“概率”(或然性)有明确的区分:概率,用于在已知一些参数的情况下,预测接下来在观测上所得到的结果;似然性,则是用于在已知某些观测所得到的结果时,对有关事物之性质的参数进行估值,也就是说已观察到某事件后,对相关母数进行猜测。在这种意义上,似然函数可以理解为条件概率的逆反。 ↩︎


本文章使用limfx的vscode插件快速发布