使用完全联合分布进行推理 — 不确定性的量化(2)

不确定知识与推理(一)

Posted by Nicodechal on 2019-01-04

全联合分布下概率计算

考虑 3 个布尔变量组成的完全联合分布 P(Cavity,Toothache,Catch)\mathbf{P}(Cavity, Toothache, Catch),得到 cavitycavity 的无条件概率为边缘概率,这个过程称为边缘化求和消元,通用的边缘化规则

P(Y)=zZP(Y,z)=zP(Y,z)\mathbf{P}(\mathbf{Y})=\mathbf{\sum_{z\in Z}}\mathbf{P}(\mathbf{Y}, \mathbf{z}) = \mathbf{\sum_{z}}\mathbf{P}(\mathbf{Y}, \mathbf{z})

根据乘法规则,还可以写为:

P(Y)=zP(Yz)P(z)\mathbf{P}(\mathbf{Y})=\mathbf{\sum_{z}}\mathbf{P}(\mathbf{Y}| \mathbf{z})\mathbf{P}(\mathbf{z})

上式称为条件化规则

条件概率下的条件化规则:

P(Ye)=zP(Y,ze)=zP(Yz,e)P(ze)\mathbf{P}(\mathbf{Y|\mathbf{e}}) = \mathbf{\sum_{z}}\mathbf{P}(\mathbf{Y},\mathbf{z}|\mathbf{e}) = \mathbf{\sum_{z}}\mathbf{P}(\mathbf{Y}| \mathbf{z}, \mathbf{e})\mathbf{P}(\mathbf{z} | \mathbf{e})

通用的推理过程如下,假设查询证据变量值为 e\mathbf{e} 时的 XX 的概率,则有

P(Xe)=αP(X,e)=αyP(X,e,y)\mathbf{P}(X|\mathbf{e})=\alpha\mathbf{P}(X,\mathbf{e})=\alpha\mathbf{\sum_y}\mathbf{P}(X,\mathbf{e},\mathbf{y})

其中 α\alpha 为归一化系数,E\mathbf{E} 为证据变量集合 e\mathbf{e} 为其观察值,Y\mathbf{Y} 为其余未观测的变量。y\mathbf{y}Y\mathbf{Y} 的不同取值。此处需要注意条件为观察值而非变量

独立性

如果变量 XX 和变量 YY 之间独立:

P(XY)=P(X)=P(Y)P(X,Y)=P(Y)P(X)\begin{array}{l} \mathbf{P}(X|Y)=\mathbf{P}(X)=\mathbf{P}(Y) \\ \mathbf{P}(X,Y)=\mathbf{P}(Y)\mathbf{P}(X) \\ \end{array}

贝叶斯规则

对于多值随机变量的情况:

P(Y,X)=P(YX)P(X)\mathbf{P}(Y,X)=\mathbf{P}(Y|X)\mathbf{P}(X)

P(YX)=P(XY)P(Y)P(X)\mathbf{P}(Y|X)= \frac {\mathbf{P}(X|Y)\mathbf{P}(Y)} {\mathbf{P}(X)}

使用归一化:

P(YX)=αP(XY)P(Y)\mathbf{P}(Y|X)=\alpha{\mathbf{P}(X|Y)\mathbf{P}(Y)}

包含背景证据的情况:

P(YX,e)=P(XY,e)P(Ye)P(Xe)\mathbf{P}(Y|X,\mathbf{e})=\frac {\mathbf{P}(X|Y,\mathbf{e})\mathbf{P}(Y|\mathbf{e})} {\mathbf{P}(X|\mathbf{e})}

条件独立性:

P(X,YZ)=P(XZ)P(YZ)P(XY,Z)=P(XZ)\begin{array}{l} \mathbf{P}(X,Y|Z)=\mathbf{P}(X|Z)\mathbf{P}(Y|Z) \\ \mathbf{P}(X|Y,Z)=\mathbf{P}(X|Z) \\ \end{array}

单一原因影响许多结果的完全联合分布为朴素贝叶斯模型:

P(Cause,Effect1,...,Effectn)=P(Cause)iP(EffectiCause)\mathbf{P}(Cause,Effect_1,...,Effect_n)=\mathbf{P}(Cause)\prod_i\mathbf{P}(Effect_i|Cause)