机器学习算法分类
文章目录
- 机器学习算法分类
- 📊 一、按学习范式分类(主流方式)
- 1. 监督学习(Supervised Learning)
- 2. 无监督学习(Unsupervised Learning)
- 3. 半监督学习(Semi-Supervised Learning)
- 4. 强化学习(Reinforcement Learning)
- 🎯 二、按任务目标分类**
- 🧱 三、按模型结构分类
- 1. 线性模型
- 2. 非线性模型
- 3. 神经网络模型
- 💎 总结:分类对比与应用选择
机器学习算法分类
机器学习算法根据不同的分类标准可分为多种类型,以下综合多个来源的权威分类方式,从学习范式、任务目标和模型结构三个核心维度进行系统梳理:
📊 一、按学习范式分类(主流方式)
1. 监督学习(Supervised Learning)
-
特点:使用带标签的训练数据(输入-输出对)学习映射关系,预测新数据的标签。
-
常见算法:
- 分类:逻辑回归、决策树、随机森林、支持向量机(SVM)、朴素贝叶斯、K近邻(KNN)。
- 回归:线性回归、岭回归、Lasso回归、支持向量回归(SVR)。
-
应用场景:垃圾邮件识别、信用评分、疾病诊断。
2. 无监督学习(Unsupervised Learning)
-
特点:处理无标签数据,挖掘数据内在结构或模式。
-
任务类型:
- 聚类:K-means、层次聚类、DBSCAN(用于客户分群、图像分割)。
- 降维:主成分分析(PCA)、t-SNE(用于数据可视化、特征压缩)。
- 关联分析:Apriori(挖掘购物篮规则)。
-
挑战:结果可解释性弱,依赖特征有效性。
3. 半监督学习(Semi-Supervised Learning)
-
特点:结合少量标注数据和大量未标注数据训练模型,降低标注成本。
-
算法:标签传播(Label Propagation)、自训练(Self-training)。
-
适用场景:医学影像分析(标注样本稀缺)。
4. 强化学习(Reinforcement Learning)
-
特点:智能体通过环境交互获取奖励信号,学习最优决策策略。
-
核心框架:马尔可夫决策过程(MDP)、Q学习、深度Q网络(DQN)。
-
应用:自动驾驶、游戏AI(如AlphaGo)、机器人控制。
🎯 二、按任务目标分类**
任务类型 | 目标 | 代表算法 | 典型场景 |
---|---|---|---|
分类(Classification) | 预测离散类别标签 | SVM、决策树、朴素贝叶斯 | 图像识别、欺诈检测 |
回归(Regression) | 预测连续数值 | 线性回归、随机森林回归 | 房价预测、销量分析 |
聚类(Clustering) | 发现数据自然分组 | K-means、DBSCAN | 市场细分、社交网络分析 |
降维(Dimensionality Reduction) | 压缩特征维度保留关键信息 | PCA、t-SNE | 数据可视化、特征工程 |
生成(Generation) | 生成与训练数据相似的新样本 | 生成对抗网络(GAN)、变分自编码器(VAE) | 图像合成、文本生成 |
🧱 三、按模型结构分类
1. 线性模型
假设特征与输出呈线性关系(如线性回归、逻辑回归),计算高效但难以处理复杂非线性问题。
2. 非线性模型
-
核方法:SVM通过核函数映射到高维空间处理非线性。
-
树模型:决策树通过特征分割处理非线性,衍生算法如随机森林、梯度提升树(GBRT)提升精度。
3. 神经网络模型
-
基础结构:多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)。
-
优势:自动提取高层次特征,在图像、语音、自然语言处理中表现卓越。
💎 总结:分类对比与应用选择
分类维度 | 关键区别 | 典型算法选择建议 |
---|---|---|
学习范式 | 数据标签需求与学习目标差异 | 标签完备选监督学习,探索结构选无监督 |
任务目标 | 输出类型(离散/连续/结构) | 分类任务用SVM,回归任务用岭回归 |
模型复杂度 | 线性与非线性问题处理能力 | 简单关系用线性模型,复杂模式用神经网络 |
💡 提示:实际应用中常需组合多种算法(如聚类后分类),并关注数据特性(如高维数据优先降维)。