当前位置: 首页 > web >正文

机器学习-03(机器学习任务攻略)

对于训练出来的模型不满意:

1.检查训练所使用的数据 

训练数据的Loss 过大

model bias(模型过于简单,模型偏差)

所求出的任何\theta,带入函数之后都不能使Loss变得足够低。可以让Loss变低的函数不在求出的函数集合之中。

解决方法:重新设计模型,增加层数,使其更有弹性。比如可以增加输入的特征。

最佳化问题(Optimization Issue)处理的不好

因为目前使用的gradient descent没有给出最佳的函数。

解决方法: 

当训练数据的Loss不够低时,如何判断是以上情况的哪种?

通过比较不同的模型,得知目前的模型是否足够大,层数是否够多。

56层的弹性一定比20层大,故一定是最佳化的问题。不是过拟合或者模型偏差的问题。

从小的(层数少的)模型入手,过渡到层数更多的模型。如果层数多的模型比层数小的模型的Loss还要大,那么就是最佳化出现了问题。

训练数据的Loss已经变小

测试数据的Loss小

此结果是我们想要的结果

测试数据的Loss大
overfitting问题(过拟合)

过拟合是指模型在训练数据上表现非常好,但在测试数据上表现较差。这通常是因为模型过于复杂,学习了训练数据中的噪声和细节,而未能提取数据的普遍规律,导致泛化能力差。

只有训练数据Loss小,但是测试数据Loss大才是过拟合问题。

极端的例子:

解决方法:

1.增加训练资料(训练数据)

2.不要让模型具有太大的弹性,给予其一些限制。 比如说给其较少的参数,在深度学习方面可以给其较少的神经元数目(但不能给太多的限制)

 

mismatch(数据不匹配)问题

训练资料和测试资料分布不同,增加训练资料不能解决此问题。

http://www.xdnf.cn/news/14900.html

相关文章:

  • JavaScript的初步学习
  • 接口幂等性
  • ArcGISPro应用指南:ArcGISPro制图全流程详解
  • 缺少关键的 MapReduce 框架文件
  • 使用Python Watchdog库实现文件系统监控
  • 双向链表的实现
  • 深度剖析数据降维,PCA、LDA、NMF、LLE主流数据降维算法原理与代码实践
  • 分布式部署下如何做接口防抖---使用分布式锁
  • 站在 Java 程序员的角度如何学习和使用 AI?从 MVC 到智能体,范式变了!
  • 清除浮动/避开margin折叠:前端CSS中BFC的特点与限制
  • springMvc的简单使用:要求在浏览器发起请求,由springMVC接受请求并响应,将个人简历信息展示到浏览器
  • pdf 合并 python实现(已解决)
  • springboot切面编程
  • 【Java面试】RocketMQ的设计原理
  • 【数字后端】- tcbn28hpcplusbwp30p140,标准单元库命名含义
  • 按月设置索引名的完整指南:Elasticsearch日期索引实践
  • 嵌入式软件面经(四)Q:请说明在 ILP32、LP64 与 LLP64 三种数据模型下,常见基本类型及指针的 sizeof 值差异,并简要解释其原因
  • 提示技术系列——程序辅助语言模型
  • HCIA-实现VLAN间通信
  • 智能物流革命:Spring Boot+AI实现最优配送路径规划
  • 红黑树:高效平衡的秘密
  • Spring生态在Java开发
  • Android Native 之 init初始化selinux机制
  • 【Note】《深入理解Linux内核》 Chapter 5 :内存地址的表示——Linux虚拟内存体系结构详解
  • 【RHCSA-Linux考试题目笔记(自用)】servera的题目
  • mac Maven配置报错The JAVA_HOME environment variable is not defined correctly的解决方法
  • 「ECG信号处理——(20)基于心电和呼吸的因果分析模型」2025年7月2日
  • 【Python】Python / PyCharm 虚拟环境详搭建与使用详解
  • U+平台配置免密登录、安装Hadoop配置集群、Spark配置
  • FIRST携手Fortinet推出全新CORE计划,致力于提升全球网络能力