摘要:
本章会介绍用于评估聚类模型的指标SC系数和CH系数,并解释其为什么可以用于聚类模型的评估 一、SC轮廓系数法(Silhouette Coefficient) 轮廓系数法同时考虑簇内的内聚程度(Cohesion)与簇间的分离程度(Separation),具体计算过程如下: 计算每一个样本 \(i\) 阅读全文
posted @ 2026-06-27 17:07
王新文
阅读(29)
评论(0)
推荐(0)
摘要:
本文会介绍SSE的概念以及如何通过SSE这个指标来寻找聚类算法的最优k值 一、误差平方和SSE的定义 \[SSE = \sum_{i=1}^{k}\sum_{p \in C_i} \left| p - m_i \right|^2 \] \(C_i\) 表示簇 \(k\) 表示聚类中心的个数 \(p\ 阅读全文
posted @ 2026-06-27 16:12
王新文
阅读(2)
评论(0)
推荐(0)
摘要:
本章会介绍如何用py实现Kmeans模型 导入相关的库 from sklearn.cluster import KMeans # 聚类的API,采用指定质心来分簇 import matplotlib.pyplot as plt from sklearn.datasets import make_bl 阅读全文
posted @ 2026-06-27 00:05
王新文
阅读(3)
评论(0)
推荐(0)

浙公网安备 33010602011771号