当前位置: 首页 > ops >正文

【16-softmax回归】

softmax回归

softmax回归是对逻辑回归的扩展;

image.png
在这里插入图片描述

softmax回归是逻辑回归的广义形式,当N=2时,softmax回归就是逻辑回归;

基于sigmoid逻辑回归的损失函数和成本函数做推广,推导出softmax回归的损失函数和成本函数

softmax回归成本函数

在这里插入图片描述

对于逻辑回归,输出为0/1,

对于输出为N种类别,这里假设输出为 1- N;所得到的成本函数;

softmax的神经网络

将softmax回归作为激活函数放入神经网络的神经元中。

对于模型而言,只需要将输出层的一个神经元改成n个神经元即可(这里的n指的是输出y的类别数)。然后输出层的每个元的激活函数就是softmax函数;
在这里插入图片描述

softmax函数与之前的激活函数相比(sigmoid, ReLU, 线性),有些不同,主要体现在:
a1-a10:输出层的激活值;z1 = w1·a[2] + b1;z1 -z10 :输出层各神经元的线性函数;

1、对于之前的激活函数(sigmoid, ReLU, 线性),a1仅仅是z1的函数,a2仅仅是z2的函数;而在softmax中,a1不仅仅是z1, 还是z2-z10的函数;所有这些激活值中的每一个都依赖于所有的Z值;

(sigmoid, ReLU, 线性)换句话说,要求得激活值,将激活函数逐个元素地应用在z1 z2上,从而得到a1 a2;

softMax的改进

在计算机中由于存储方式的问题会导致在计算过程中存在浮点误差,比如 1 + 1/10000 - (1 - 1/10000) 和 2/10000的计算结果不同;

可以使用tensorFlow中的优化算法来解决这个问题,

model.compile(loss=BinaryCrossEntropy(from_logits=True))

来判断是否需要计算每一项或是重排后再计算;

http://www.xdnf.cn/news/17710.html

相关文章:

  • AI 赋能的软件工程全生命周期应用
  • springboot+vue实现通过poi完成excel
  • Postman 平替 技术解析:架构优势与实战指南
  • 观察者模式(C++)
  • 【Leetcode hot 100】76.最小覆盖字串
  • 【HarmonyOS】Window11家庭中文版开启鸿蒙模拟器失败提示未开启Hyoer-V
  • SwiftUI 页面弹窗操作
  • 用飞算JavaAI一键生成电商平台项目:从需求到落地的高效实践
  • 使用免费API开发口播数字人
  • [机器学习]07-基于多层感知机的鸢尾花数据集分类
  • c++中的Lambda表达式详解
  • Java基础07——基本运算符(本文为个人学习笔记,内容整理自哔哩哔哩UP主【遇见狂神说】的公开课程。 > 所有知识点归属原作者,仅作非商业用途分享)
  • k8s+isulad 网络问题
  • 如何使用 AI 大语言模型解决生活中的实际小事情?
  • 【P81 10-7】OpenCV Python【实战项目】——车辆识别、车流统计(图像/视频加载、图像运算与处理、形态学、轮廓查找、车辆统计及显示)
  • 网络协议序列化工具Protobuf
  • 4.1vue3的setup()
  • 2019 GPT2原文 Language Models are Unsupervised Multitask Learners - Reading Notes
  • Kotlin Data Classes 快速上手
  • Qt TCP 客户端对象生命周期与连接断开问题解析
  • 解锁Prompt秘籍:框架、技巧与指标全解析
  • Windows 11操作系统 Git命令执行速度慢
  • SpringMVC基本原理和配置
  • 第2节 如何计算神经网络的参数:AI入门核心逻辑详解
  • pytorch学习笔记-加载现有的网络模型(VGG16)、增加/修改其中的网络层(修改为10分类)
  • 云计算-多服务集群部署实战指南:从JumpServer到Kafka、ZooKeeper 集群部署实操流程
  • 70亿参数让机器人“开窍“:英伟达Cosmos Reason如何让AI理解物理世界
  • 分段锁和限流的间接实现
  • 基于51单片机的手机蓝牙控制8位LED灯亮灭设计
  • Day19 C 语言标准 IO 机制