当前位置: 首页 > ds >正文

深度学习5(深层神经网络 + 参数和超参数)

深层神经网络简介

        深层神经网络是机器学习中一种重要的模型,它通过增加网络的“深度”(即隐藏层的数量)来提升模型对复杂数据的表示和学习能力。同浅层类似,也分为三个部分:

输入层:接收原始数据(如图像像素、文本向量等)。

隐藏层:由多层组成,每一层包含若干神经元(节点),通过权重和激活函数处理数据。

输出层:生成最终预测结果(如分类概率、回归值等)。

深层神经网络正向传播

深层神经网络反向传播

        原理比较容易理解,与浅层神经网络类似,可以分为多个逻辑回归,进行反向传播


参数和超参数

参数(Parameters)

定义

        模型内部学习得到的变量,通过训练数据自动优化,无需人工设定。

        示例

        神经网络中的权重(Weights)偏置(Bias)

        线性回归中的系数(θ0,θ1θ0​,θ1​)。

特点

        数据驱动:通过反向传播(如梯度下降)从数据中学习。

        数量庞大:深层网络的参数量可达数百万甚至数十亿(如GPT-3有1750亿参数)。

        存储于模型中:训练完成后,参数被保存用于预测。

优化目标

        最小化损失函数(如交叉熵、均方误差)。


2. 超参数(Hyperparameters)

定义

        训练前人为设定的配置,控制模型的学习过程或结构。

        示例

        学习率(Learning Rate):梯度下降的步长。

        批量大小(Batch Size):每次迭代使用的样本数。

        网络结构:层数、每层神经元数量。

        正则化参数:L2惩罚系数(λλ)、Dropout率。

        优化器选择:Adam、SGD等。

特点

        人工依赖:无法直接从数据中学习,需通过经验或调优确定。

        影响全局:超参数的选择直接影响模型收敛速度、泛化能力和最终性能。

        需实验验证:通常通过网格搜索、随机搜索或贝叶斯优化确定。

http://www.xdnf.cn/news/15005.html

相关文章:

  • C++ 网络编程(15) 利用asio协程搭建异步服务器
  • 从数据洞察到设计创新:UI前端如何利用数字孪生提升用户体验?
  • 浏览器与服务器的交互
  • dify 1.5.1版本全面解析——知识库索引、动态参数及结构化输出插件全新登场
  • STM32的 syscalls.c 和 sysmem.c
  • 《C++初阶之类和对象》【经典案例:日期类】
  • RESTful API 安装使用教程
  • 黑马python(二十五)
  • Spring Boot + 本地部署大模型实现:优化与性能提升
  • 基于Linux的Spark本地模式环境搭建实验指南
  • 【github】想fork的项目变为私有副本
  • 项目介绍:LangGPT
  • Android View的绘制原理详解
  • 使用reactor-rabbitmq库监听Rabbitmq
  • Python 量化交易安装使用教程
  • opencv的颜色通道问题 rgb bgr
  • 如何查看自己电脑的CUDA版本?
  • 【深度解析】Seedance 1.0:重新定义 AI 视频生成的工业级标准
  • 《Java修仙传:从凡胎到码帝》第三章:缩进之劫与函数峰试炼
  • python脚本编程:使用BeautifulSoup爬虫库获取热门单机游戏排行榜
  • PHP从字符串到数值的类型转换
  • 三、jenkins使用tomcat部署项目
  • 服务器间接口安全问题的全面分析
  • 模拟热血三国内城安置建筑物
  • 【wps】 excel 删除重复项
  • 【Spring Boot】HikariCP 连接池 YAML 配置详解
  • Tomcat镜像实战:掌握Dockerfile的编写以及发布项目
  • day47-tomcat
  • 《Spring 中上下文传递的那些事儿》Part 4:分布式链路追踪 —— Sleuth + Zipkin 实践
  • Python 闭包(Closure)实战总结