當前位置：首頁 > 编程语言 > python >内容正文

python

高斯混合模型GMM理论和Python实现

發布時間：2025/4/16 python 13 豆豆

生活随笔收集整理的這篇文章主要介紹了高斯混合模型GMM理论和Python实现小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

https://github.com/Sean16SYSU/MachineLearningImplement

簡述

高斯混合模型，就是說用多個高斯函數去描述不同的元素分布。
通過EM方法來迭代生成不同的高斯模型的各個參數。

具體的EM算法的理論網上很多，但推薦各位先看完這個算法思路之后，再去看理論推導就更加好了。

更新方法

$μi′=∑j=1mηji?xj∑j=1mηji\mu_i^{'} = \frac{\sum_{j=1}^m{\eta_{ji} * x_j}}{\sum_{j=1}^m{\eta_{ji}}}$
$Σi′=∑j=1mηji?(xj?μi′)?(xj?μi′)T∑j=1mηji\Sigma_i^{'} = \frac{\sum_{j=1}^m{\eta_{ji} * (x_j - \mu_i^{'}) * (x_j - \mu_i^{'})^T}}{\sum_{j=1}^m{\eta_{ji}}}$
$αi′=∑j=1mηjim\alpha_i^{'} = \frac{\sum_{j=1}^m{\eta_{ji}}}{m}$

m是點數量

ηij=P(zj=i∣xj)\eta_{ij}=P(z_j=i|x_j)

這個概率就是在第

i

個高斯模型下樣本

x_j

的概率

通過這樣不斷地迭代，最后，用這個 $ηij\eta_{ij}$ 來計算最后的聚類結果
即，對于每一個樣本，屬于概率最高的高斯分布的所對應的高斯分布。

Python實現

導入數據

from sklearn import datasets import numpy as np import matplotlib.pyplot as pltiris = datasets.load_iris()

算法實現

from scipy import statsdef GMMs(X, k=3, steps=10):def p(x, mu, sigma):n = len(x)div = (2 * np.pi) ** (n / 2) * (abs(np.linalg.det(sigma)) ** 0.5)expOn = -0.5 * ( np.dot( (x - mu).T, np.dot(np.linalg.inv(sigma), (x - mu)) ) ) return np.exp(expOn) / divdef init(X):_, n = X.shapereturn np.random.rand(k, n), 2 * np.random.rand(k, n, n) + 1, np.random.rand(k)# k個Gausssian distributionmus, sigmas, alphas = init(X)# EM algorithm# E-stepmat = np.zeros((len(X), k))for times in range(steps):for j, x in enumerate(X):temp, tempP = 0, 0for i in range(k):tempP = p(x, mus[i], sigmas[i])temp += tempPmat[j][i] = alphas[i] * tempPmat[j] /= tempfor i in range(k):# updata musmus[i] = np.dot(mat[:, i].T, X) / sum(mat[:, i])# update sigmastemp = np.zeros(sigmas[0].shape)for j in range(len(X)):data = (X[j] - mus[i]).reshape(4, 1)temp += mat[j][i] * np.dot(data, data.T)temp /= sum(mat[:, i])sigmas[i] = tempalphas[i] = sum(mat[:, i]) / len(X)# clusteringAns = np.zeros(len(X))for j, x in enumerate(X):temp, tempP = 0, 0for i in range(k):tempP = p(x, mus[i], sigmas[i])temp += tempPmat[j][i] = alphas[i] * tempPmat[j] /= tempAns[j] = np.argmax(mat[j])return Ans test_y = GMMs(iris.data, steps=20)

畫圖

from sklearn.decomposition import PCA ? X_reduced = PCA(n_components=2).fit_transform(iris.data) plt.scatter(X_reduced[:, 0], X_reduced[:, 1], c=test_y, cmap=plt.cm.Set1)

評估

def evaluate(y, t):a, b, c, d = [0 for i in range(4)]for i in range(len(y)):for j in range(i+1, len(y)):if y[i] == y[j] and t[i] == t[j]:a += 1elif y[i] == y[j] and t[i] != t[j]:b += 1elif y[i] != y[j] and t[i] == t[j]:c += 1elif y[i] != y[j] and t[i] != t[j]:d += 1return a, b, c, ddef external_index(a, b, c, d, m):JC = a / (a + b + c)FMI = np.sqrt(a**2 / ((a + b) * (a + c)))RI = 2 * ( a + d ) / ( m * (m + 1) )return JC, FMI, RIdef evaluate_it(y, t):a, b, c, d = evaluate(y, t)return external_index(a, b, c, d, len(y)) Indexvalue

JC	0.8187638512681605
FMI	0.9003627122239571
RI	0.921766004415011

總結

以上是生活随笔為你收集整理的高斯混合模型GMM理论和Python实现的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： KMeans++算法理论和实现
下一篇： DBSCAN算法理论和Python实现

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

python

高斯混合模型GMM理论和Python实现

簡述

Python實現

總結