当前位置：首页 > ds >正文

深度学习5(深层神经网络 + 参数和超参数)

ds 2025/7/6 10:29:41

深层神经网络简介

深层神经网络是机器学习中一种重要的模型，它通过增加网络的“深度”（即隐藏层的数量）来提升模型对复杂数据的表示和学习能力。同浅层类似，也分为三个部分：

输入层：接收原始数据（如图像像素、文本向量等）。

隐藏层：由多层组成，每一层包含若干神经元（节点），通过权重和激活函数处理数据。

输出层：生成最终预测结果（如分类概率、回归值等）。

深层神经网络正向传播

深层神经网络反向传播

原理比较容易理解，与浅层神经网络类似，可以分为多个逻辑回归，进行反向传播

参数和超参数

参数（Parameters）

定义

模型内部学习得到的变量，通过训练数据自动优化，无需人工设定。

示例：

神经网络中的权重（Weights）和偏置（Bias）。

线性回归中的系数（θ0,θ1θ0,θ1）。

特点

数据驱动：通过反向传播（如梯度下降）从数据中学习。

数量庞大：深层网络的参数量可达数百万甚至数十亿（如GPT-3有1750亿参数）。

存储于模型中：训练完成后，参数被保存用于预测。

优化目标

最小化损失函数（如交叉熵、均方误差）。

2. 超参数（Hyperparameters）

定义

训练前人为设定的配置，控制模型的学习过程或结构。

示例：

学习率（Learning Rate）：梯度下降的步长。

批量大小（Batch Size）：每次迭代使用的样本数。

网络结构：层数、每层神经元数量。

正则化参数：L2惩罚系数（λλ）、Dropout率。

优化器选择：Adam、SGD等。

特点

人工依赖：无法直接从数据中学习，需通过经验或调优确定。

影响全局：超参数的选择直接影响模型收敛速度、泛化能力和最终性能。

需实验验证：通常通过网格搜索、随机搜索或贝叶斯优化确定。

查看全文

http://www.xdnf.cn/news/15005.html

C++ 网络编程(15) 利用asio协程搭建异步服务器

从数据洞察到设计创新：UI前端如何利用数字孪生提升用户体验？

浏览器与服务器的交互

dify 1.5.1版本全面解析——知识库索引、动态参数及结构化输出插件全新登场

STM32的 syscalls.c 和 sysmem.c

《C++初阶之类和对象》【经典案例：日期类】

RESTful API 安装使用教程

黑马python（二十五）

Spring Boot + 本地部署大模型实现：优化与性能提升

基于Linux的Spark本地模式环境搭建实验指南

【github】想fork的项目变为私有副本

项目介绍：LangGPT

Android View的绘制原理详解

使用reactor-rabbitmq库监听Rabbitmq

Python 量化交易安装使用教程

opencv的颜色通道问题 rgb bgr

如何查看自己电脑的CUDA版本？

【深度解析】Seedance 1.0：重新定义 AI 视频生成的工业级标准

《Java修仙传：从凡胎到码帝》第三章：缩进之劫与函数峰试炼

python脚本编程：使用BeautifulSoup爬虫库获取热门单机游戏排行榜

PHP从字符串到数值的类型转换

三、jenkins使用tomcat部署项目

服务器间接口安全问题的全面分析

模拟热血三国内城安置建筑物

【wps】 excel 删除重复项

【Spring Boot】HikariCP 连接池 YAML 配置详解

Tomcat镜像实战：掌握Dockerfile的编写以及发布项目

day47-tomcat

《Spring 中上下文传递的那些事儿》Part 4：分布式链路追踪 —— Sleuth + Zipkin 实践

Python 闭包（Closure）实战总结