当前位置: 首页 > ds >正文

Python Day49 学习(日志Day19复习)

补充:调整超参数的原因

补充:关于“验证集”

验证集(Validation Set)是机器学习中非常重要的一个概念。它的主要作用如下:


1. 模型调参

在训练模型时,很多算法有“超参数”需要手动设置,比如决策树的最大深度、KNN的K值、LightGBM的学习率等。我们不能直接用测试集来调这些参数,否则会导致“作弊”——模型对测试集有了“提前了解”,评估结果就不真实。
验证集就是用来在训练过程中测试不同参数效果,帮助你选择最优参数的


2. 防止过拟合

如果只用训练集来训练和评估模型,模型可能会记住训练集的所有细节,导致在新数据上表现很差(过拟合)。
验证集可以帮助你发现模型是否过拟合:

  • 如果模型在训练集上表现很好,但在验证集上表现很差,说明模型过拟合了。

3. 模型选择

有时你会尝试多种不同的模型(比如决策树、随机森林、LightGBM等),需要选出表现最好的那个。
验证集的评估结果可以帮助你公平地比较不同模型的优劣,选择最合适的模型。


4. 训练集、验证集、测试集的区别

  • 训练集(Train Set):用来训练模型,模型“学习”用的数据。
  • 验证集(Validation Set):用来调参和选择模型,模型“考试”用的数据,但不是最终成绩。
  • 测试集(Test Set):只在最后评估模型的泛化能力,模拟模型在真实新数据上的表现。

手写笔记复习

今日复习到这里,明日继续,加油!!!@浙大疏锦行

http://www.xdnf.cn/news/13856.html

相关文章:

  • 【Java多线程从青铜到王者】阻塞队列(十)
  • 欧拉系统openEuler-24.03忘记密码,如何改密码
  • Python训练营-Day29-复习日
  • 修改FFMpeg的日志函数av_log,使其在记录日志时能显示调用该函数的位置(文件名和行号)
  • Metastore 架构示意图和常用 SQL
  • 前端加密当日
  • 力扣前缀和
  • 河南农担携手Gitee企业版:构建农业金融数字化研发新基建
  • 网络层协议:IP
  • qt初识--02
  • 移动电储能工作原理及SOC约束解析
  • 光谱相机叶绿素荧光成像技术的原理
  • Vue 组件通信
  • Jenkins 配置信息导出 的详细说明(中英对照)
  • 如何用AI赋能学习
  • OpenCV CUDA模块图像变形------对图像进行 尺寸缩放(Resize)操作函数resize()
  • Elasticsearch:使用 ES|QL 进行地理空间距离搜索
  • Linux612 chroot_list开放;FTP服务ftp:get put,指定上传路径报错553;ftp查看文件夹权限
  • 28-Oracle 23ai Fast Ingest(Memoptimized Rowstore)高频写入
  • 西电【信息与内容安全】课程期末复习笔记
  • jupyter notebook的相关知识及可能遇到的问题
  • LeetCode 2917.找出数组中的K-or值
  • Shell 脚本:系统管理与任务自动化的利器
  • docker compose安装Prometheus、Grafana
  • ubuntu网络连接失败 + mobaxterm拖拽文件出错等问题解决方法
  • CQL3D编译指南
  • PPIO 上线 Qwen3-Embedding 系列模型
  • C++学习-入门到精通【19】杂项汇总
  • 企业级人员评价系统Web端重构实战:前端架构效能升级
  • 【11408学习记录】考研数学核心突破:矩阵本质、系统信息与向量空间基