Kmeans聚类和聚合聚类是常用的两种聚类方法。Kmeans聚类将数据分成K个簇,每个簇的中心点是该簇内所有点的平均值。聚合聚类则是从每个点开始,将距离最近的两个点合并成一个簇,再将距离最近的两个簇合并,直到只剩下一个簇为止。这里给出Python中使用sklearn库实现Kmeans聚类和聚合聚类的示例。
Kmeans聚类示例代码:
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
# 生成随机数据
X, y = make_blobs(n_samples=1000, centers=3, random_state=0)
# 使用Kmeans聚类
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
# 可视化结果
import matplotlib.pyplot as plt
plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_, cmap='rainbow')
plt.title('Kmeans Clustering')
plt.show()
聚合聚类示例代码:
from sklearn.cluster import AgglomerativeClustering
from sklearn.datasets import make_blobs
# 生成随机数据
X, y = make_blobs(n_samples=1000, centers=3, random_state=0)
# 使用聚合聚类
agg_clustering = AgglomerativeClustering(n_clusters=3)
agg_clustering.fit(X)
# 可视化结果
import matplotlib.pyplot as plt
plt.scatter(X[:, 0], X[:, 1], c=agg_clustering.labels_, cmap='rainbow')
plt.title('Agglomerative Clustering')
plt.show()
上一篇:比较k均值聚类结果与层次聚类结果
下一篇:比较空值