当前位置: 首页 > news >正文

深度学习常见的激活函数

Sigmoid 激活函数

表达式:
S i g m o i d ( x ) = 1 1 + e − x {Sigmoid}(x) = \frac{1}{1 + e^{-x}} Sigmoid(x)=1+ex1
作图:
在这里插入图片描述

  • 定义:将输入值映射到 0 到 1的区间内。
  • 优点:输出值在 0 和 1 之间,适用于二分类问题。
  • 缺点: 当输入值过大或过小时,会出现梯度消失问题。

ReLU 激活函数

表达式:
R e L U ( x ) = { x , 如果  x > 0 0 , 如果  x ≤ 0 {ReLU}(x) = \begin{cases} x, & \text{如果} \ x > 0 \\ 0, & \text{如果} \ x \leq 0 \end{cases} ReLU(x)={x,0,如果 x>0如果 x0
作图:
在这里插入图片描述

  • 定义:将输入值中的负数部分设为 0,正数部分保持不变。
  • 优点:计算简单,高效。在深层网络中能够有效缓解梯度消失问题。
  • 缺点:当输入值为负时,神经元将不更新权重,导致“神经元死亡”问题。

Tanh 激活函数

表达式:
T a n h ( x ) = e x − e − x e x + e − x {Tanh}(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} Tanh(x)=ex+exexex
作图:
在这里插入图片描述

  • 定义:将输入值映射到 -1 到 1 的区间内。
  • 优点: 输出值中心对称,零均值有助于网络收敛。
  • 缺点: 也会出现梯度消失问题。

Linear 激活函数

表达式:
L i n e a r ( x ) = x {Linear}(x) = x Linear(x)=x
作图:
在这里插入图片描述

  • 定义:输出值与输入值保持一致。
  • 应用场景:常用于回归问题的输出层。
  • 缺点:不引入非线性特性,不能解决复杂问题。
激活函数输出范围优点缺点
Sigmoid 0 , 1 0, 1 0,1二分类问题常用梯度消失问题
ReLU [ 0 , + ∞ ) [0, +\infty) [0,+)简单高效可能导致神经元死亡
Tanh ( − 1 , 1 ) (-1, 1) (1,1)零均值,有助于收敛梯度消失问题
Linear ( − ∞ , + ∞ ) (-\infty, +\infty) (,+)适用于回归问题无法引入非线性特性

在这里插入图片描述

Softmax激活函数

假设有一个向量 z = [ z 1 , z 2 , . . . , z n ] z = [z_1, z_2, ..., z_n] z=[z1,z2,...,zn],Softmax 函数的输出是一个概率分布,公式如下:

S o f t m a x ( z i ) = e z i ∑ j = 1 n e z j Softmax(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{n} e^{z_j}} Softmax(zi)=j=1nezjezi

其中:

  • z i z_i zi 是输入向量中的第 i个元素。
  • e 是自然对数的底(约等于 2.718)。
  • 输出的值是一个归一化的概率分布,所有值的总和为 1。
  • Softmax 将输入的 logits 转换为概率值
  • 每个输出值都介于 0 和 1 之间,并且所有输出值的总和为 1,因此它表示一个概率分布。
  • Softmax 的值越大,说明模型越确信这个类别是正确的
http://www.xdnf.cn/news/1077265.html

相关文章:

  • 通过http调用来访问neo4j时报错,curl -X POST 执行指令报错
  • Next.js 安装使用教程
  • Python应用指南:利用高德地图API获取公交+地铁可达圈(三)
  • 【Python】numpy数组常用数据处理(测试代码+api例程)
  • 1.MySQL之如何定位慢查询
  • stm32 单片机主要优点有哪些?
  • 【ArcGIS】矢量数据的叠加分析
  • 在 Docker 容器中使用内网穿透
  • Hadoop、Spark、Flink 三大大数据处理框架的能力与应用场景
  • Modbus协议
  • Python OrderedDict 用法详解
  • Day 3:Python模块化、异常处理与包管理实战案例
  • A模块 系统与网络安全 第三门课 网络通信原理-3
  • 【C++】inline的作用
  • 若依中复制到剪贴板指令的使用v-clipboard
  • js严格模式和非严格模式
  • 【Python基础】13 知识拓展:CPU、GPU与NPU的区别和联系
  • 【科研绘图系列】基于R语言的复杂热图绘制教程:环境因素与染色体效应的可视化
  • SeaTunnel 社区月报(5-6 月):全新功能上线、Bug 大扫除、Merge 之星是谁?
  • 基于Spring Cloud微服务架构的API网关方案对比分析
  • 3.1.1.9 安全基线检查项目九:检查是否设置限制su命令用户组
  • [C#] WPF - 自定义样式(Slider篇)
  • 位运算经典题解
  • ELK日志分析系统(filebeat+logstash+elasticsearch+kibana)
  • Python 库 包 nltk (Natural Language Toolkit)
  • 视频断点续播全栈实现:基于HTML5前端与Spring Boot后端
  • 141.在 Vue 3 中使用 OpenLayers Link 交互:把地图中心点 / 缩放级别 / 旋转角度实时写进 URL,并同步解析显示
  • 【Maven 】 <resources> 配置中排除 fonts/** 目录无效,可能是由于以下原因及解决方案:
  • 计算机网络(二)应用层HTTP协议
  • (LangChain)RAG系统链路向量存储之Milvus(四)