当前位置 博文首页 > 风信子的猫Redamancy的快乐星球:李航统计学习方法 Chapter4 朴

    风信子的猫Redamancy的快乐星球:李航统计学习方法 Chapter4 朴

    作者:[db:作者] 时间:2021-08-22 08:53

    如果想了解更多的知识,可以去我的机器学习之路 The Road To Machine Learning通道

    第4章 朴素贝叶斯法

    1.朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布
    P ( X , Y ) P(X,Y) P(X,Y),然后求得后验概率分布 P ( Y ∣ X ) P(Y|X) P(YX)。具体来说,利用训练数据学习 P ( X ∣ Y ) P(X|Y) P(XY) P ( Y ) P(Y) P(Y)的估计,得到联合概率分布:
    P ( X , Y ) = P ( Y ) P ( X ∣ Y ) P(X,Y)=P(Y)P(X|Y) P(X,Y)P(Y)P(XY)
    概率估计方法可以是极大似然估计或贝叶斯估计。

    2.朴素贝叶斯法的基本假设是条件独立性,

    P ( X = x ∣ Y = c k ) = P ( X ( 1 ) = x ( 1 ) , ? ? , X ( n ) = x ( n ) ∣ Y = c k ) = ∏ j = 1 n P ( X ( j ) = x ( j ) ∣ Y = c k ) \begin{aligned} P(X&=x | Y=c_{k} )=P\left(X^{(1)}=x^{(1)}, \cdots, X^{(n)}=x^{(n)} | Y=c_{k}\right) \\ &=\prod_{j=1}^{n} P\left(X^{(j)}=x^{(j)} | Y=c_{k}\right) \end{aligned} P(X?=xY=ck?)=P(X(1)=x(1),?,X(n)=x(n)Y=ck?)=j=1n?P(X(j)=x(j)Y=ck?)?

    这是一个较强的假设。由于这一假设,模型包含的条件概率的数量大为减少,朴素贝叶斯法的学习与预测大为简化。因而朴素贝叶斯法高效,且易于实现。其缺点是分类的性能不一定很高。

    3.朴素贝叶斯法利用贝叶斯定理与学到的联合概率模型进行分类预测。

    P ( Y ∣ X ) = P ( X , Y ) P ( X ) = P ( Y ) P ( X ∣ Y ) ∑ Y P ( Y ) P ( X ∣ Y ) P(Y | X)=\frac{P(X, Y)}{P(X)}=\frac{P(Y) P(X | Y)}{\sum_{Y} P(Y) P(X | Y)} P(YX)=P(X)P(X,Y)?=Y?P(Y)P(XY)P(Y)P(XY)?
    将输入 x x x分到后验概率最大的类 y y y

    y = arg ? max ? c k P ( Y = c k ) ∏ j = 1 n P ( X j = x ( j ) ∣ Y = c k ) y=\arg \max _{c_{k}} P\left(Y=c_{k}\right) \prod_{j=1}^{n} P\left(X_{j}=x^{(j)} | Y=c_{k}\right) y=argc