当前位置: 首页 > ops >正文

神经网络和机器学习的一些基本概念

记录一些基本概念,不涉及公式推导,因为数学不好,记了也没啥用,但是知道一些基本术语以及其中的关系,对神经网络训练有很大帮助。
可能有些概念不会讲得很详细,但是当你有了这个概念,你就知道往这个方向去获取更详细的信息,不至于连往哪走都不知道。

下面以多元线性回归模型为例
在这里插入图片描述

1.模型
模型训练过程就是利用已知的x和y,求解b的过程,b也称为权重。
虽然没有那么简单,但是训练完成的模型本质上就是一组权重值,如

[b1, b2,b2......]

所谓保存模型,就是把这一组值保存到文件中,需要用的时候,再从文件中读取。
正常的模型文件,还会保存训练中用到的训练库信息,优化器信息,损失函数信息等。

2.训练数据,验证数据,测试数据。
训练数据:用于训练模型的数据。
验证数据:可以看做训练数据的一部分,但是不参与模型训练,其主要作用是用于训练过程中调整超参数(如学习率、正则化系数)或选择最佳模型配置,避免过拟合。
验证数据:用于验证模型训练的好坏。

3.参数和超参数
参数:是模型训练中自动调节的参数,即权重b.
超参数:一般指需要人工手动调节的参数,函数等(但是也可以设置自动调节)。常见的超参数是学习率,损失函数,优化器,网络层数,节点数等等。

4.损失函数
模型训练,求解权重,实际上也是求解损失函数的过程。
对于多元线性回归模型,最常用的损失函数就是最小二乘法。
在这里插入图片描述
在不同模型训练时,损失函数有很多种选择。
损失函数的含义就是找到一组值(权重),使得预测值和实际值之间的距离最小。
当损失函数越小,代表预测值和实际值越接近,

http://www.xdnf.cn/news/16062.html

相关文章:

  • 【Node.js】使用ts-node运行ts文件时报错: TypeError: Unknown file extension “.ts“ for ts 文件
  • 电子设计大赛【摄像头循迹】讲解
  • SpringMVC快速入门之请求与响应
  • 【大模型文生图、文生音频实战Demo】基于Spring AI Alibaba和阿里百炼大模型实现文生图、文生视频
  • WebGIS 中常用公共插件
  • 1688 Agent Russia 丨俄罗斯1688跨境代采系统搭建指南
  • 前端开发 React 状态优化
  • 基于深度学习的图像分类:使用预训练模型进行迁移学习
  • 原创-基于 PHP 和 MySQL 的证书管理系统 第三版
  • Neo4j 框架 初步简单使用(基础增删改查)
  • Neo4j如何修改用户密码?
  • 【Java】Reflection反射(代理模式)
  • Redis能完全保证数据不丢失吗?
  • Spring Cloud Alibaba Sentinel 基本工作原理源码阅读
  • BQ4050RSMR DIOTEC高精度锂电池保护与电量监测芯片 集成保护+计量+通信
  • AWS Lambda IoT数据处理异常深度分析:从告警到根因的完整排查之路
  • 快手DHPS:国内首个实现基于RDMA 通信的可负载均衡高性能服务架构!
  • 设计汽车集群电源
  • 前端资源缓存优化案例:深入探讨 Nginx 配置中的 Cache-Control 头部叠加问题
  • 一次Oracle集群脑裂问题分析处理
  • 耐达讯自动化EtherCAT转RS232:示波器连接的“开挂秘籍”
  • pig cloud框架中引入websocket
  • Android Camera openCamera
  • Node.js 倒计时图片服务部署与 Nginx 反向代理实战总结
  • OneTwoVLA——基于π0实现类π0.5:一个模型中完成原来双系统下的慢思考、快执行,且具备自适应推理能力和自我纠错能力
  • Java 大视界 -- Java 大数据机器学习模型在电商产品销量预测与库存优化管理中的应用(359)
  • OpenCV 零基础到项目实战 | DAY 2:图像预处理全解析
  • 基于JSP的高校寝室综合管理系统/宿舍管理系统
  • 【JavaSE】正则表达式学习笔记
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 主页-最近七天微博发布量实现