摘要: 本章会介绍用于评估聚类模型的指标SC系数和CH系数,并解释其为什么可以用于聚类模型的评估 一、SC轮廓系数法(Silhouette Coefficient) 轮廓系数法同时考虑簇内的内聚程度(Cohesion)与簇间的分离程度(Separation),具体计算过程如下: 计算每一个样本 \(i\) 阅读全文
posted @ 2026-06-27 17:07 王新文 阅读(29) 评论(0) 推荐(0)
摘要: 本文会介绍SSE的概念以及如何通过SSE这个指标来寻找聚类算法的最优k值 一、误差平方和SSE的定义 \[SSE = \sum_{i=1}^{k}\sum_{p \in C_i} \left| p - m_i \right|^2 \] \(C_i\) 表示簇 \(k\) 表示聚类中心的个数 \(p\ 阅读全文
posted @ 2026-06-27 16:12 王新文 阅读(2) 评论(0) 推荐(0)
摘要: 本章会介绍如何用py实现Kmeans模型 导入相关的库 from sklearn.cluster import KMeans # 聚类的API,采用指定质心来分簇 import matplotlib.pyplot as plt from sklearn.datasets import make_bl 阅读全文
posted @ 2026-06-27 00:05 王新文 阅读(3) 评论(0) 推荐(0)
摘要: 本章会介绍如何使用knn模型进行手写数字识别,该案例的学习重点是放在如何数据处理,并非该模型的应用 介绍:每张图片都是28*28像素组成的,即:我们的csv文件中每一行都有784个像素点,表示图片(每个像素)的颜色,最终构成图像 加载相应的库 import matplotlib.pyplot as 阅读全文
posted @ 2026-06-26 15:35 王新文 阅读(3) 评论(0) 推荐(0)
摘要: 本文会介绍如何利用朴素贝叶斯模型来实现商品评论情感分析,该案例的重点不在于朴素贝叶斯模型,而是在于如何处理文本数据,如何将文本数据转换成模型能看得懂的矩阵形式。 导入相关的库 import numpy as np import pandas as pd import matplotlib.pyplo 阅读全文
posted @ 2026-06-26 10:59 王新文 阅读(0) 评论(0) 推荐(0)
摘要: 本章会介绍如何调用XGBOOST模型API 导入相关的库 import joblib #用于保存模型 import pandas as pd import numpy as np import xgboost as xgb # XGBOOST的库 from collections import Co 阅读全文
posted @ 2026-06-26 10:32 王新文 阅读(1) 评论(0) 推荐(0)
摘要: 本文会介绍机器学习中分类模型的评估方法 提问:分类模型能用准确率来评测吗? 答案:可以,但是结果不准确,拿逻辑回归模型进行举例,其主要用于二分类,即:A类还是B类,弱准确率是97%;不能说97%A类,3%的B类 所以要通过混淆矩阵来测评,即:精确率,召回率,F1,ROC,AUC 一、混淆矩阵的定义 阅读全文
posted @ 2026-06-25 18:09 王新文 阅读(2) 评论(0) 推荐(0)
摘要: 本章会介绍如何使用逻辑回归处理二分类问题 加载相应的库 import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.preprocessing impo 阅读全文
posted @ 2026-06-25 16:57 王新文 阅读(3) 评论(0) 推荐(0)
摘要: 本章会介绍逻辑回归的原理 一、逻辑回归概念 逻辑回归概念 Logistic Regression 逻辑回归虽然带有回归二字,单其实是一种分类模型,把线性回归的输出,作为逻辑回归的输入。其只能处理二分类问题 输出是 \((0, 1)\) 之间的值 二、基本思想 利用线性模型 \(f(x) = \bol 阅读全文
posted @ 2026-06-24 17:29 王新文 阅读(5) 评论(0) 推荐(0)
摘要: 本章会简单介绍一下XGBoost (Extreme Gradient Boosting)的算法原理与核心思想 一、Xgb的构建思想: 1.构建模型的方法是最小化训练数据的损失函数: \[\min_{f \in F} \frac{1}{N} \sum_{i=1}^N L\left(y_i, f\lef 阅读全文
posted @ 2026-06-24 11:34 王新文 阅读(2) 评论(0) 推荐(0)