当前位置：首页 > news >正文

要导入StandardScaler类进行数据标准化，请使用以下语句：

news 2025/8/17 13:00:52

要导入StandardScaler类进行数据标准化，请使用以下语句：

from sklearn.preprocessing import StandardScaler

使用步骤详解

创建实例
scaler = StandardScaler()
拟合数据（计算均值和标准差）
scaler.fit(X_train)
说明：X_train是训练集特征矩阵，形状为(n_samples, n_features)

转换数据（应用标准化）

X_train_std = scaler.transform(X_train)  # 标准化训练集
X_test_std = scaler.transform(X_test)     # 用训练集的参数标准化测试集

关键特性

标准化公式：
$\frac{x - \mu}{\sigma}$
其中 $μ\mu$ 是均值， $σ\sigma$ 是标准差。
作用：将数据转换为均值为0、标准差为1的分布，消除量纲影响。
注意事项：测试集必须使用训练集计算的 $μ\mu$ 和 $σ\sigma$ ，避免数据泄露。

示例代码

import numpy as np
from sklearn.preprocessing import StandardScaler# 生成示例数据（3个样本，2个特征）
data = np.array([[1.0, 2.0], [3.0, 1.0], [2.0, 3.0]])# 标准化
scaler = StandardScaler()
scaler.fit(data)                # 计算均值和标准差
transformed_data = scaler.transform(data)  # 应用转换print("原始数据:\n", data)
print("标准化后:\n", transformed_data)
print("均值:", scaler.mean_)     # 输出: [2.0, 2.0]
print("标准差:", np.sqrt(scaler.var_))  # 输出: [0.82, 0.82] (近似)

常见问题解答

Q: 为什么测试集要使用训练集的参数？
A: 确保生产环境中的数据与训练时采用相同的转换规则，避免模型偏差。

Q: 标准化和归一化（MinMaxScaler）的区别？
A: 标准化保留异常值信息，归一化将数据压缩到[0,1]区间。标准化更适用于服从高斯分布的数据。

http://www.xdnf.cn/news/1311499.html

相关文章：

VS Code配置MinGW64编译ALGLIB库

《C语言程序设计》笔记p10

【数据分享】上市公司供应链成本分摊数据（2007-2024）

【数据结构】-2- 泛型

leetcodehot100 矩阵置零

基于Spring Boot 4s店车辆管理系统租车管理系统停车位管理系统智慧车辆管理系统

谷歌手机刷机和面具ROOT保姆级别教程

利用 Java 爬虫按图搜索淘宝商品（拍立淘）实战指南

《解耦的艺术：Python 观察者模式在 GUI 与事件驱动中的实战》

cPanel Python 应用部署流程

【自动化运维神器Ansible】Ansible逻辑运算符详解：构建复杂条件判断的核心工具

Scala面试题及详细答案100道（11-20）-- 函数式编程基础

C#单元测试(xUnit + Moq + coverlet.collector)

RK3568 NPU RKNN（四）：RKNN-ToolKit2性能和内存评估

springboot集成websocket

SpringBoot 集成Ollama 本地大模型

RH134 访问网络附加存储知识点

【图论】分层图 / 拆点

计算机存储器分类和层次结构详解

PyTorch生成式人工智能——使用MusicGen生成音乐

探索粒子世界：从基础理论到前沿应用与未来展望

Python-深度学习（一）

机器学习核心概念精要：从定义到评估

C++STL标准模板库详解

sql链接的url中serverTimezone的作用

Unity 游戏提升 Android TargetVersion 相关记录

深入了解 swap：作用、局限与分区建立