ML基础

范式 定义
监督学习(Supervised Learning) 训练数据包括正确的结果(标签-label)
无监督学习(Unsupervised Learning) 训练数据不包括正确的结果
半监督学习/混合学习(Semi-supervised Learning) 训练数据包括少量正确的结果
强化学习(Reinforcement Learning) 根据每次结果收获的奖惩进行学习,实现优化
问题名称 定义 所属范式 所属范式原因 示例 常见算法
回归问题 预测连续输出变量,学习输入特征到连续值的映射 监督学习 需要带标签的连续输出数据,学习输入到连续值的映射 根据房屋面积、位置预测房价 线性回归、决策树回归、随机森林、SVR、神经网络
分类问题 预测离散类别标签,将输入数据分配到预定义类别 监督学习 需要带标签的离散类别数据,学习输入到类别标签的映射 判断图片是猫还是狗、识别手写数字(0-9) 逻辑回归、SVM、决策树、随机森林、KNN、神经网络
聚类问题 将无标签数据分组为具有相似特征的簇 无监督学习 无标签数据,根据数据内在结构分组 将客户分组为不同市场群体 K均值聚类、DBSCAN、层次聚类
降维问题 降低数据维度以提取主要特征或便于可视化 无监督学习 无标签数据,降低维度以提取主要特征或便于可视化 将高维数据降到2维以便可视化 PCA、t-SNE、LDA、UMAP
推荐系统 根据用户行为或内容预测用户偏好或推荐相关项目 监督/无监督/混合 可基于评分预测(监督)或用户/物品相似性(无监督)进行推荐 Netflix推荐电影、电商推荐商品 协同过滤、矩阵分解、基于内容的推荐、神经网络
序列预测 预测时间序列或序列数据的下一值或趋势 监督学习/强化学习 通常基于历史数据预测序列(监督),或通过环境交互预测(强化) 预测股票价格、生成自然语言文本 RNN、LSTM、Transformer、ARIMA
异常检测 识别数据中的异常点或不符合正常模式的数据 无监督/半监督学习 无标签数据寻找异常点,或用少量正常数据训练以检测异常 检测信用卡欺诈交易、识别设备故障 孤立森林、One-Class SVM、DBSCAN、GAN

ML基础
https://blog.zzzero.site/2025/ML基础/
作者
ZhouZhou
发布于
2025年7月22日
许可协议