一、 高斯混合模型(Gaussian Mixture models, GMM)
高斯模型
当样本数据 X
是一维数据(Univariate)时,高斯分布遵从下方概率密度函数(Probability
Density Function):
当样本数据
(1)均值表征的是各维变量的中心,其对二维高斯曲面的影响较好理解,它使得整个二维高斯曲面在xoy平面上移动; (2)对于协方差矩阵,对角线上的两个元素,即
和 表征的是x维和y维变量的方差,决定了整个高斯曲面在某一维度上的“跨度”,方差越大,“跨度”越大; (3)协方差矩阵的斜对角线上面的两个元素,即 和 ( = )表征的是各维变量之间的相关性: 说明x与y呈正相关(x越大,y越大),其值越大,正相关程度越大; 呈负相关;否则不相关。
GMM
高斯混合模型可以看作是由 K 个单高斯模型组合而成的模型,这 K
个子模型是混合模型的隐变量(Hidden
variable)。一般来说,一个混合模型可以使用任何概率分布,这里使用高斯混合模型是因为高斯分布具备很好的数学性质以及良好的计算性能。GMM的概率密度函数如下:
高斯混合模型的本质就是融合几个单高斯模型,来使得模型更加复杂,从而产生更复杂的样本。理论上,如果某个混合高斯模型融合的高斯模型个数足够多,它们之间的权重设定得足够合理,这个混合模型可以拟合任意分布的样本。
GMM的贝叶斯理解
在介绍GMM参数估计之前,先改写GMM的形式,改写之后的GMM模型可以方便地使用EM估计参数。GMM的原始形式如下:
上式第二个等号,对
求和,实际上就是 。又因为对某个 ,只要 ,有 ,所以 的项为1,可省略,最终得到第三个等号.
若
二、EM算法估计GMM参数
EM算法(Expectation-Maximization algorithm)分两步,第一步先求出要估计参数的粗略值,第二步使用第一步的值最大化似然函数。因此要先求出GMM的似然函数
给定数据
有的文章中会用这个表示
,有的文章会用
为了估计这三个参数,需要分别求解出这三个参数的最大似然函数。(11)式所有样本连乘得到最大似然函数,对(11)式取对数得到对数似然函数为:
同理求
EM算法:
定义分量数目
, 对每个分量 设置 , 然后计算(12)式的对数似然函数; E step:
根据当前的
计算后验概率 : M step:
根据E step中计算的
再计算新的 计算(12)式的对数似然函数:
检查参数是否收敛或对数似然函数是否收敛,若不收敛,则返回第2步
https://blog.csdn.net/lin_limin/article/details/81048411
https://zhuanlan.zhihu.com/p/30483076
https://www.cnblogs.com/huangyc/p/10125117.html
https://blog.csdn.net/jinping_shi/article/details/59613054