当前位置: 首页 > news >正文

2.1.2

#读取一个Excel文件,并将读取到的数据存储在变量data中

data = pd.__________('大学生低碳生活行为的影响因素数据集.xlsx')

---

data = pd.read_excel('大学生低碳生活行为的影响因素数据集.xlsx')

注意:下载excel表格,安装库pip install openpyxl -i  https://pypi.tuna.tsinghua.edu.cn/simple

#处理数据集中的缺失值

initial_row_count = data.__________[0]
data = data.__________()

final_row_count = data.shape[0]

---

initial_row_count = data.shape[0]

data = data.dropna()

代码解释:根据下面一行“final_row_count = data.shape[0]”填写空白位置。

#处理重复行

duplicate_count = data.duplicated().sum()
data = data.__________()

---

duplicate_count = data.duplicated().sum()
data = data.drop_duplicates()

代码解释:duplicates重复,drop删除。drop_duplicates,删除重复行

data[numerical_features] = scaler.__________(data[numerical_features])

----

data[numerical_features] = scaler.fit_transform(data[numerical_features])

代码解释:

selected_features = [
    '1.您的性别○男性   ○女性', '2.您的年级○大一   ○大二   ○大三   ○大四', '3.您的生源地○农村   ○城镇(乡镇)   ○地县级城市  ○省会城市及直辖市', '4.您的月生活费○≦1,000元   ○1,001-2,000元   ○2,001-3,000元   ○≧3,001元',
    '5.您进行过绿色低碳的相关生活方式吗?', '6.您觉得“低碳”,与你的生活关系密切吗?',
    '7.低碳生活是否会成为未来的主流生活方式?', '8.您是否认为低碳生活会提高您的生活质量?'
]
X = data[__________]

# 创建目标变量

y = __________['__________']

---

X = data[selected_features]

# 创建目标变量

y = data['低碳行为积极性']

代码解释:

(5)根据业务需求和数据特性,选择对低碳生活行为预测最有用的特征,将“低碳行为积极性”设为目标变量并标注。选择以下特征

# 数据划分

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 保存处理后的数据

cleaned_data = pd.concat([X, y], axis=1)
cleaned_data.__________('2.1.2_cleaned_data.csv', index=False)

---

leaned_data.to_csv('2.1.2_cleaned_data.csv', index=False)

http://www.xdnf.cn/news/518635.html

相关文章:

  • WaterStamp —— 一个实用的网页水印生成器开发记
  • 系统启动时开启选择内核菜单
  • ctf 基础
  • tauri2项目动态添加 Sidecar可行性方案(运行时配置)
  • 机器学习-人与机器生数据的区分模型测试 - 模型融合与检验
  • 关于机器学习的实际案例
  • C++学习:六个月从基础到就业——C++20:概念(Concepts)
  • ZZW-OCCT
  • OpenAI深夜发布Codex:AI编程里程碑式突破
  • 一:操作系统之操作系统结构
  • VS Code 开启mcp控制本地的redis
  • React 19中如何向Vue那样自定义状态和方法暴露给父组件。
  • 【方法论】金字塔内部的结构
  • 一文讲清 AWS IAM涉及的核心概念!
  • 【HALCON】 算子详解:create_local_deformable_model_xld 的全方位解读
  • 程序代码篇---ESP32的数据采集
  • 2025.5.12-2025.5.18:开始练习英语口语
  • AGI大模型(25):LangChain提示词模版
  • 辨析Spark 运行方式、运行模式(master)、部署方式(deploy-mode)
  • 网络流算法
  • Hugo安装Stack主题
  • 网络I/O学习(一)
  • freertos智能时钟开发环境详细搭建指南:从零开始的freertos智能时钟学习之路
  • 180KHz 60V 5A开关电流升压/升降压型DC-DC转换器XL4019升降压芯片
  • 最新最热门的特征提取方式:CVOCA光学高速复值卷积
  • 【JavaWeb】JDBC
  • React响应事件中onClick={handleClick} 的结尾有没有小括号的区别
  • [ctfshow web入门] web119
  • C++实现伽罗华域生成及四则运算(二)
  • 小记录111