当前位置: 首页 > ai >正文

Sklearn 机器学习 数值标准化

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:数值标准化实战指南(含 CSV 读取与训练测试处理)

在机器学习中,特征的数值标准化(Normalization/Standardization) 是模型训练前非常重要的预处理步骤,尤其在使用如 SVM、KNN、逻辑回归等对特征尺度敏感的算法时更是关键。

💡 术语说明:在实际使用中,NormalizationStandardization 虽常被混用,但两者含义略有不同:

  • Standardization 指将数据转换为标准正态分布(均值为0,标准差为1);
  • Normalization 通常指将数据缩放到特定区间(如 [0,1]);

本文统一使用“数值标准化”泛指特征尺度调整的所有方法,具体方法将在文中分别说明。


📌 一、什么是数值标准化?

数值标准化是将特征数据缩放到统一的尺度上,常见方法包括:

  • Z-score 标准化(StandardScaler)
    将每一维特征转换为均值为 0,标准差为 1 的分布:

    z = x − μ σ z = \frac{x - \mu}{\sigma} z=σxμ

    其中 $\mu$ 为特征均值,$\sigma$ 为标准差。

  • 最小-最大缩放(MinMaxScaler)
    将特征压缩到指定区间(如 [0, 1]):

    x ′ = x − x min ⁡ x max ⁡ − x min ⁡ x' = \frac{x - x_{\min}}{x_{\max} - x_{\min}} x

http://www.xdnf.cn/news/16126.html

相关文章:

  • HTTP/1.0、HTTP/1.1 和 HTTP/2.0 主要区别
  • LeetCode 2322:从树中删除边的最小分数
  • M3295NL专为千兆以太网设计,支持100/1000Mbps全双工通信M3295支持4对5类UTP电缆
  • 【C++】标准模板库(STL)—— 学习算法的利器
  • 力扣20:有效的括号
  • 【Java工程师面试全攻略】Day12:系统安全与高可用设计
  • Spring Cloud OpenFeign 常用注解_笔记
  • SpringCloud【Sentinel】
  • mac llama_index agent算术式子计算示例
  • AUTOSAR进阶图解==>AUTOSAR_SWS_BSWGeneral
  • [202103][Docker 实战][第2版][耿苏宁][译]
  • Vue3实现视频播放弹窗组件,支持全屏播放,音量控制,进度条自定义样式,适配浏览器小窗播放,视频大小自适配,缓冲loading,代码复制即用
  • 机器学习入门与经典knn算法表文解析
  • USRP X440
  • C++抽象类完全指南
  • 加密算法-----BCrypt
  • 负载均衡-LoadBalance
  • 【数组的定义与使用】
  • 排序查找算法,Map集合,集合的嵌套,Collections工具类
  • 【独立工具】小红书图片采集软件
  • pytest官方Tutorial所有示例详解(二)
  • Python循环结构
  • 【数据结构】二叉树进阶算法题
  • AI服务器给一体成型电感带来多大的市场空间
  • C++开发---奥比中光(Orbbec)的ob库
  • 【CMake】CMake 常用语法总结
  • 到底可不可以用jion?jion如何优化?
  • 力扣-152.乘积最大子数组
  • 自己开发VUE之web网页打包技术毕业论文——仙盟创梦IDE
  • 【科研绘图系列】R语言绘制双侧坐标轴的条形图