当前位置: 首页 > backend >正文

神经网络与深度学习(第二章)

1.机器学习四要素

(1)数据:模型训练的基本

(2)模型:根据任务和数据类型选择合适的模型

(3)学习准则:计算损失

(4)优化算法:根据损失使用梯度下降or反向传播算法更新模型参数,从而优化模型

本质:通过数据训练所选择的模型,然后计算误差,再根据误差进行优化更新模型参数

2.过拟合和欠拟合的含义

过拟合:模型在训练集上学习的“过好”,把噪声和无关特征都学习进去了,导致在测试集上的性能很差,泛化性差

欠拟合:模型在训练集和测试集上的性能都很差,主要因为模型的复杂度过低

3.经验风险和结构风险含义

经验风险:优化时追求训练集误差最小化,容易学习噪声导致过拟合

结构风险:考虑经验风险和模型复杂度,让模型复杂度作为经验风险的约束项,从而避免过拟合,提高模型的泛化能力

4.线性回归

机器学习中的基石模型:用一条直线或超平面去拟合所有的数据,通过最小化均值平方误差更新参数(梯度下降法),对异常值敏感,无法拟合非线性的数据集

5.极大似然估计

选择使当前数据出现概率最大的一组参数作为最优估计

步骤:先得到似然函数L,对L取对数然后对各个参数求偏导使偏导为0得到的参数结构即为参数最优估计

http://www.xdnf.cn/news/10617.html

相关文章:

  • 数字化转型全场景安全解析:从产品到管理的防线构建与实施要点
  • 由浅入深一文详解同余原理
  • 【Android】MT6835 + MT6631 WiFi进入Meta模式出现WiFi_HQA_OpenAdapter failed
  • Higress项目解析(二):Proxy-Wasm Go SDK
  • 车载诊断架构 --- DTC消抖参数(Trip Counter DTCConfirmLimit )
  • 12.1 GUI 事件处理
  • nssctf第二题[SWPUCTF 2021 新生赛]简简单单的逻辑
  • BiliNote部署实践
  • CRC 原理概述
  • NodeJS全栈WEB3面试题——P5全栈集成与 DApp 构建
  • 04powerbi-度量值-筛选引擎CALCULATE()
  • HTTP、WebSocket、SSE 对比
  • hadoop伪分布式配置(单机)
  • 迈向分布式智能:解析MCP到A2A的通信范式迁移
  • 大数据学习(127)-hive日期函数
  • ACTF2025-web-eznote-wp
  • 详解一下RabbitMQ中的channel.Publish
  • 端到端的导航技术NeuPAN论文讲解
  • 从0开始学习R语言--Day15--非参数检验
  • Pytorch知识点2
  • DAY43打卡
  • 嵌入式Linux 期末复习指南(上)
  • 基于 StarRocks + Iceberg,TRM Labs 构建 PB 级数据分析平台实践
  • Qt概述:基础组件的使用
  • 【JAVA后端入门基础001】Tomcat 是什么?通俗易懂讲清楚!
  • 【PCB设计】STM32开发板——产品设计流程及元件选型
  • STM32 笔记 _《GPIO配置从低层走向高层》
  • 4.大语言模型预备数学知识
  • 数据库系统概论(十一)SQL 集合查询 超详细讲解(附带例题表格对比带你一步步掌握)
  • 花卉目标检测数据集介绍(共 12 类,10490 张图像)