当前位置: 首页 > ai >正文

模型训练相关的问题

与模型训练相关问题

    • 损失函数Cross entropy loss的含义
    • 训练数据有脏数据,怎么处理?
    • loss一直不收敛,怎么排查?
    • 连续值的特征怎么处理后输入到机器学习模型当中

损失函数Cross entropy loss的含义

在深度学习中,可以看作通过概率分布q ( x )(预测概率)表示概率分布p ( x ) (label)
在这里插入图片描述物理意义:可以理解为在相对熵中,一个目标事件已确定(label),求另一个概率分布到目标概率分布的距离

训练数据有脏数据,怎么处理?

判断脏数据的类型,然后对症下药
a) 缺失值:删除、填充、插值。
b) 重复数据:删除。
c) 异常值:删除、修正、保留。
d) 噪声数据:平滑、数据清洗。
e) 类别数据:合并稀有类别、标签一致化。
f) 文本数据:拼写纠正、去除停用词、标准化。
g) 数据标准化/归一化:确保数据具有合适的尺度。

loss一直不收敛,怎么排查?

a) 学习率过大或过小:尝试使用学习率调度器,逐步减少学习率࿰

http://www.xdnf.cn/news/10421.html

相关文章:

  • 个人用户进行LLMs本地部署前如何自查和筛选
  • 14.Wifi模组(ESP8266)
  • LeetCode 热题 100 208. 实现 Trie (前缀树)
  • 724.寻找数组的中心下标前缀和
  • 网页前端开发(基础进阶2)
  • 多线程( Thread)
  • Python训练打卡Day39
  • 电子电路:时钟脉冲与上升沿的详细解析
  • CppCon 2014 学习:ASYNCHRONOUS COMPUTING IN C++
  • ssm 学习笔记day03
  • OVD开放词汇检测 Detic 训练COCO数据集实践
  • 28 C 语言作用域详解:作用域特性(全局、局部、块级)、应用场景、注意事项
  • 【Java学习笔记】枚举
  • 怎么更改cursor chat中的字体大小
  • XCPC 常用技巧
  • Beta分布Dirichlet分布
  • [Python] Python中的多重继承
  • 飞牛fnNAS装机之迷你小主机的利旧
  • SolidWorks软件的安装与卸载
  • 12 Java GUI
  • Word双栏英文论文排版攻略
  • 【解决】【亲测下载obsidian可行】打不开github.com 或者 加速访问 github
  • Pull Request Integration 拉取请求集成
  • Python实现HPSO-TVAC优化算法优化支持向量机SVC分类模型项目实战
  • QT/c++航空返修数据智能分析系统
  • 重读《人件》Peopleware -(15)Ⅱ 办公环境 Ⅷ 撑伞之步:构建理想办公环境(上)
  • 数据中台(大数据平台)之数据安全管理
  • InternVL2.5-多模态大模型评估专业图片
  • Python爬虫:AutoScraper 库详细使用大全(一个智能、自动、轻量级的网络爬虫)
  • 从模式到架构:Java 工厂模式的设计哲学与工程化实践