当前位置：首页 > web >正文

机器学习-03（机器学习任务攻略）

web 2025/7/4 16:59:22

对于训练出来的模型不满意：

1.检查训练所使用的数据

训练数据的Loss 过大

model bias（模型过于简单，模型偏差）

所求出的任何 $\theta$ ，带入函数之后都不能使Loss变得足够低。可以让Loss变低的函数不在求出的函数集合之中。

解决方法：重新设计模型，增加层数，使其更有弹性。比如可以增加输入的特征。

最佳化问题（Optimization Issue）处理的不好

因为目前使用的gradient descent没有给出最佳的函数。

解决方法：

当训练数据的Loss不够低时，如何判断是以上情况的哪种？

通过比较不同的模型，得知目前的模型是否足够大，层数是否够多。

56层的弹性一定比20层大，故一定是最佳化的问题。不是过拟合或者模型偏差的问题。

从小的（层数少的）模型入手，过渡到层数更多的模型。如果层数多的模型比层数小的模型的Loss还要大，那么就是最佳化出现了问题。

训练数据的Loss已经变小

测试数据的Loss小

此结果是我们想要的结果

测试数据的Loss大

overfitting问题（过拟合）

过拟合是指模型在训练数据上表现非常好，但在测试数据上表现较差。这通常是因为模型过于复杂，学习了训练数据中的噪声和细节，而未能提取数据的普遍规律，导致泛化能力差。

只有训练数据Loss小，但是测试数据Loss大才是过拟合问题。

极端的例子：

解决方法：

1.增加训练资料（训练数据）

2.不要让模型具有太大的弹性，给予其一些限制。比如说给其较少的参数，在深度学习方面可以给其较少的神经元数目（但不能给太多的限制）

mismatch（数据不匹配）问题

训练资料和测试资料分布不同，增加训练资料不能解决此问题。

查看全文

http://www.xdnf.cn/news/14900.html

JavaScript的初步学习

接口幂等性

ArcGISPro应用指南：ArcGISPro制图全流程详解

缺少关键的 MapReduce 框架文件

使用Python Watchdog库实现文件系统监控

双向链表的实现

深度剖析数据降维，PCA、LDA、NMF、LLE主流数据降维算法原理与代码实践

分布式部署下如何做接口防抖---使用分布式锁

站在 Java 程序员的角度如何学习和使用 AI？从 MVC 到智能体，范式变了！

清除浮动/避开margin折叠：前端CSS中BFC的特点与限制

springMvc的简单使用:要求在浏览器发起请求，由springMVC接受请求并响应，将个人简历信息展示到浏览器

pdf 合并 python实现（已解决）

springboot切面编程

【Java面试】RocketMQ的设计原理

【数字后端】- tcbn28hpcplusbwp30p140，标准单元库命名含义

按月设置索引名的完整指南：Elasticsearch日期索引实践

嵌入式软件面经（四）Q：请说明在 ILP32、LP64 与 LLP64 三种数据模型下，常见基本类型及指针的 sizeof 值差异，并简要解释其原因

提示技术系列——程序辅助语言模型

HCIA-实现VLAN间通信

智能物流革命：Spring Boot+AI实现最优配送路径规划

红黑树：高效平衡的秘密

Spring生态在Java开发

Android Native 之 init初始化selinux机制

【Note】《深入理解Linux内核》 Chapter 5 ：内存地址的表示——Linux虚拟内存体系结构详解

【RHCSA-Linux考试题目笔记（自用）】servera的题目

mac Maven配置报错The JAVA_HOME environment variable is not defined correctly的解决方法

「ECG信号处理——（20）基于心电和呼吸的因果分析模型」2025年7月2日

【Python】Python / PyCharm 虚拟环境详搭建与使用详解

U+平台配置免密登录、安装Hadoop配置集群、Spark配置

FIRST携手Fortinet推出全新CORE计划，致力于提升全球网络能力