当前位置：首页 > web >正文

LLM中的Loss与Logits详解

web 2025/7/22 6:45:31

LLM中的Loss与Logits详解

自己构建的logits的损失函数，比自带loss效果好很多，建议自己构建；
另外学习率也是十分重要的参数，多次尝试，通过查看loss的下降趋势进行调整；
举例，来回跳跃说明下降率过大，一般从0.0001 开始尝试。
在这里插入图片描述

在深度学习中，logits 和 loss 是两个不同的概念，需要先区分清楚：

logits 是模型输出的原始未归一化分数（如分类任务中未经过 softmax 激活的线性输出）。
loss 是根据模型预测（logits 或概率）与真实标签计算的损失值，用于衡量预测与真实值的差距。

http://www.xdnf.cn/news/9636.html

相关文章：

【leetcode】206. 反转链表

Linux Shellcode开发（Stager Reverse Shell）

简述MySQL优化锁方面你有什么建议？

彰显国产力量|暴雨亮相2025 C3安全峰会

Guava限频器RateLimiter的使用示例

STM32学习第一课--工程建立（云端备份与自我复盘）

ROS2学习(16)------ URDF 机器人建模方法

操作系统 | 第一章：操作系统引论思维导图

解决ssh: connect to host IP port 22: Connection timed out报错（scp传文件指定端口）

Java—多线程

如何使用 poetry 创建虚拟环境，VSCode 如何激活使用 Poetry 虚拟环境（VSCode如何配置 Poetry 虚拟环境）

MVCC原理解析

js 手写promise

专栏更新通知

Python 科学计算有哪些提高运算速度的技巧

力扣——1.两数之和

【论文阅读】User Diverse Preference Modeling by Multimodal Attentive Metric Learning

【笔记】修改abu量化本地部署数据文件夹目录

OpenCV CUDA模块直方图计算------用于在 GPU 上执行对比度受限的自适应直方图均衡类cv::cuda::CLAHE

Python 的 `next()`函数

数字化回归本质：第一性原理驱动的制造业转型与AI+云PLM系统实践

LeetCode-数组技巧题目

影刀RPA-20-高级操作题2

后端思维之高并发处理方案

使用LSTM对销售数据进行预测

简乐 1.4.0 | 非常简洁无损下载畅听全网

聊一聊 C# NativeAOT 多平台下的函数导出

Milvus向量Search查询综合案例实战（下）

Telnet 命令详解

深度学习---注意力机制（Attention Mechanism）