当前位置: 首页 > news >正文

入门概述(面试常问)

🧮 一、机器学习(Machine Learning)

✅ 定义:

让计算机“自动从数据中学习”的方法,而不是手动写规则。

🔨 分类方式:
类型标签有无应用示例
监督学习有标签回归预测、分类任务
无监督学习无标签聚类、降维
半监督学习部分有标签提高训练效率
强化学习奖励驱动游戏、机器人控制
📦 常见模型:
  • 线性回归:预测连续值(如房价)

  • 逻辑回归:做二分类(如是否违约)

  • 决策树:用“条件判断”做分类,容易理解

  • 随机森林:多个决策树组合,效果更稳健

  • KNN:靠“邻居”投票分类,懒惰学习

  • SVM 支持向量机:寻找最优分界线分类

  • KMeans 聚类:自动把数据分成 K 类

  • XGBoost / GBDT:集成模型,用提升树叠加训练,性能好


🤖 二、深度学习(Deep Learning)

✅ 定义:

是机器学习的一个分支,用“人工神经网络”模拟大脑的学习方式,适合处理图像、语音、自然语言等复杂任务。

🧱 基本结构:
  • 神经网络(ANN):输入 → 隐藏层 → 输出

  • 激活函数:如 ReLU、Sigmoid,引入非线性

  • 损失函数:如 MSE、交叉熵,衡量模型效果

  • 优化器:如 SGD、Adam,更新权重参数

🧰 常见网络结构:
  • CNN(卷积神经网络):用于图像识别、目标检测

  • RNN(循环神经网络):处理序列数据,如语音、文本

  • LSTM / GRU:RNN 的改进版,能记住更长信息

  • Transformer:靠“注意力机制”实现并行处理,是 NLP 主力结构

  • BERT / GPT:基于 Transformer 的预训练语言模型,用于理解或生成语言


🧠 三、其他重点概念(易被问到)

  • 过拟合 / 欠拟合:模型过强 or 过弱,对泛化能力影响大

  • 交叉验证:稳定评估模型性能的方式

  • 特征工程:清洗、选择、转换特征,提高模型表现

  • 标准化 / 归一化:让特征数据处于统一尺度,加速训练

  • 集成学习(Ensemble):多个模型组合,提升稳定性

  • 训练 & 推理:训练是学习,推理是“用模型做预测”

http://www.xdnf.cn/news/1296037.html

相关文章:

  • vercel部署上线
  • 【数据分享】351个地级市农业相关数据(2013-2022)-有缺失值
  • 数智先锋 | 告别运维黑盒!豪鹏科技×Bonree ONE构建全栈智能可观测体系
  • 带环链表详解:环形链表检测与入环节点查找
  • 从 Notion 的水土不服到 Codes 的本土突围:研发管理工具的适性之道​
  • Linux下的软件编程——framebuffer(文件操作的应用)
  • 表达式树实战:Unity动态逻辑编程
  • tp5集成elasticsearch笔记
  • Unity中的神经网络遗传算法实战
  • 一篇文章读懂.Net的依赖注入
  • .NET 的 WebApi 项目必要可配置项都有哪些?
  • .Net4.0 WPF中实现下拉框搜索效果
  • 面试题之项目中git如何进行管理
  • 如何启动本机mysql数据库
  • 在mysql> 下怎么运行 .sql脚本
  • XCTF-warmup详细题解(含思考过程)
  • Morph Studio-一站式AI视频创作平台
  • Vue浅学
  • Elasticsearch 中如何配置 RBAC 权限-实现安全的访问控制
  • QT6(创建第一个QT项目)
  • Win10上Qt使用Libcurl库
  • Qt 实现Ymodem协议源码分享
  • MySQL工具包中的其他程序
  • 从概率填充到置信度校准:GPT-5如何从底层重构AI的“诚实”机制
  • 树莓派 4B 上部署 Minecraft PaperMC 1.20.x 的一键部署脚本
  • ASQA: 面向模糊性事实问题的长格式问答数据集与评估框架
  • C#WPF实战出真汁02--登录界面设计
  • 利用 Python 爬虫按图搜索 1688 商品(拍立淘)实战指南
  • Windows批处理脚本自动合并当前目录下由You-get下载的未合并的音视频文件
  • LeetCode 分类刷题:2302. 统计得分小于 K 的子数组数目