当前位置: 首页 > ds >正文

【机器学习速记】面试重点/期末考试

自用,有错误欢迎评论区指出

目录

 一、机器学习基础概念

二、机器学习类型分类

三、经典算法与原理

 1. 线性模型

 2. 决策树

3. SVM(支持向量机)

 4. K近邻(KNN)

 5. 贝叶斯分类

 6. 集成学习

四、模型评价指标

五、模型泛化能力与调参

六、特征工程与数据预处理

 七、维度约简与降维方法

 八、强化学习简要介绍

 九、常见面试/复试问答题

1. 什么是过拟合?如何解决?

2. 逻辑回归与SVM的区别?

3. PCA与LDA的区别?

4. 什么是核函数?SVM为何需要核函数?

5. 机器学习与深度学习的区别?

6. XGBoost相比传统GBDT的优势有哪些?

7. Bias-Variance(偏差-方差)权衡是什么意思?

8. 为什么特征要标准化/归一化?

9. 训练集和测试集如何划分?交叉验证的作用?

10. 梯度消失与梯度爆炸的含义?如何缓解?


 一、机器学习基础概念

概念说明
什么是机器学习?机器学习是一门使计算机从数据中学习经验并做出预测或决策的学科。
机器学习 vs 传统编程传统编程:规则 + 数据 → 结果;机器学习:数据 + 结果 → 学习规则。
机器学习三要素模型(Model)、策略(Strategy)、算法(Algorithm)

二、机器学习类型分类

类型特点典型算法
监督学习有标签数据,预测输出线性回归、逻辑回归、SVM、决策树、KNN、神经网络
无监督学习无标签数据,发现结构聚类(K-means)、降维(PCA)
半监督学习小部分有标签,大量无标签数据
强化学习智能体通过与环境交互获得最大奖励Q-learning、DQN、策略梯度等

三、经典算法与原理

 1. 线性模型

  • 线性回归:损失函数是均方误差(MSE),求解方法是最小二乘法。

  • 逻辑回归:用于分类,输出为概率(sigmoid),损失函数是对数似然函数。

 2. 决策树

  • 分裂依据:信息增益(ID3)、信息增益率(C4.5)、基尼指数(CART)

【机器学习】熵-信息增益-ID3-C4.5_. 什么是熵?熵在决策树算法中有什么作用?-CSDN博客

  • 优点:可解释性强;缺点:容易过拟合

3. SVM(支持向量机)

  • 最大间隔分类器,核心是构造间隔最大的超平面

  • 使用核函数解决非线性问题(如 RBF、Poly)

 4. K近邻(KNN)

  • 基于“相似数据点具有相似标签”,没有训练过程,计算开销大

 5. 贝叶斯分类

  • 基于贝叶斯定理,朴素贝叶斯假设特征之间条件独立

 6. 集成学习

  • Bagging(并行):随机森林

  • Boosting(串行):AdaBoost,Gradient Boosting(如XGBoost)


四、模型评价指标

任务类型指标
回归MSE、RMSE、MAE、R²
分类准确率、精确率、召回率、F1分数、AUC-ROC

五、模型泛化能力与调参

问题描述解决方法
过拟合
http://www.xdnf.cn/news/2049.html

相关文章:

  • 【音视频】⾳频处理基本概念及⾳频重采样
  • 企业级智能合同管理解决方案升级报告:道本科技携手DeepSeek打造智能合同管理新标杆
  • (六)机器学习---聚类与K-means
  • 基于AI应用创业IDEA:使用百度搜索开放平台的MCP广场智能推荐MCPServices服务
  • Java 安全:如何防止 DDoS 攻击?
  • 全栈国产化信创适配,构建安全可控的呼叫中心系统
  • uniapp-商城-37-shop 购物车 选好了 进行订单确认3 支付栏
  • 【vue】 实现浏览器自动播放音频的指南
  • MongoDB Shard Cluster
  • MySQL触法器
  • Cadence学习笔记之---原理图设计基本操作
  • 电子电子架构 --- 主机厂视角下ECU开发流程
  • 统计服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
  • 【XR手柄交互】Unity 中使用 InputActions 实现手柄控制详解(基于 OpenXR + Unity新输入系统(Input Actions))
  • MySQL表的操作 -- 表的增删改查
  • Linux 权限修改详解:chmod 命令与权限数字的秘密
  • 算法 | 基于SSA-CNN-LSTM(麻雀算法优化卷积长短期记忆神经网络)的股票价格预测(附完整matlab代码,公式,原理,可用于毕业论文设计)
  • 600W电源的EMC整改心得记录(PFC+LLC)
  • 【Chrony 时间同步双实验实操】从单节点校准到本地 NTP 服务器搭建详解
  • guvcview-源码记录
  • 项目质量管理
  • 风吸式杀虫灯环保优势
  • Coze高阶玩法 | 使用Coze制作思维认知提升视频,效率提升300%!(附保姆级教程)
  • Django之旅:第七节--模版继承
  • Git基本使用(很详细)
  • FWFT_FIFO和Standard_FIFO对比仿真
  • Shell脚本参数处理:位置变量/预定义变量
  • Java对接企业微信实战笔记
  • [原创](现代Delphi 12指南):[macOS 64bit App开发]:如何使用CFStringRef类型字符串?
  • 【vue】【element-plus】 el-date-picker使用cell-class-name进行标记,type=year不生效解决方法