当前位置: 首页 > ds >正文

Python Day8

@浙大疏锦行 PythonDay8.

内容:

  • 字典(字典对)
    • dict_test = dict(name='zhangsan', age=18)
  • 标签编码(离散特征 && 有顺序)
  • 连续特征的归一化和标准化处理

代码:

# Question 1 dic
dict = {'Alice': 100, 'Bob': 200, 'Charlie': 300}# Question 2 label-Code and 连续变量编码
import pandas as pd
import numpy as np# 独热编码
def one_hot(data, columns):data = pd.get_dummies(data=data, columns=columns)return data
# 标签编码
def label_encoder(data, columns):if len(columns)  == 0:  # 处理异常情况return datavalue_index = list(range(len(columns))) # [1 2 3 4 5 6]mapping = dict(zip(columns, value_index))data[columns] = data[columns].map(mapping)return data
# 归一化
def min_max(data, columns):if len(columns)  == 0:  # 处理异常情况return datafor column in columns:column_data = data[column]min_val = column_data.min()max_val = column_data.max()column_data = (column_data - min_val) / (max_val - min_val)data[column] = column_datareturn datadata = pd.read_csv("./data/heart.csv")
discrete_columns = []
continuous_columns = []
for column in data.columns:if data[column].dtype == 'object':discrete_columns.append(column)else:continuous_columns.append(column)data = min_max(data, continuous_columns) # 归一化
# data = one_hot(data, discrete_columns) # 独热编码
data = label_encoder(data, discrete_columns) # 标签编码print(data.head())

http://www.xdnf.cn/news/15163.html

相关文章:

  • 第6章应用题
  • C++内存泄露排查
  • 基于DeepSeek构建的openGauss AI智能优化助手:数据库性能提升新利器
  • 数据分析-名词
  • react16-react19都更新哪些内容?
  • 爬虫-数据解析
  • RapidRAW RAW 图像编辑器
  • claude code调用(免费白嫖100额度)
  • 【Java】【力扣】【字节高频】3.无重复字符的最长字串
  • 一条Redis命令是如何执行的?
  • Selenium+Pytest自动化测试框架实战前言#
  • Rust #[] 语法
  • SQL注入与防御-第六章-3:利用操作系统--巩固访问
  • CentOS/RHEL LVM 磁盘扩展完整教程
  • 虚拟化技术,容器技术和Docker
  • SQL Server 2008R2 到 2012 数据库迁移完整指南
  • 什么是幂等
  • ARM单片机滴答定时器理解与应用(一)(详细解析)
  • 专题一_双指针_查找总价格为目标值的两个商品
  • 飞算 JavaAI 智能编程助手 - 重塑编程新模态
  • 阿里开源WebSailor:超越闭源模型的网络智能体新星
  • NFS文件存储
  • 【Linux | 网络】socket编程 - 使用UDP实现服务端向客户端提供简单的服务
  • Vue响应式原理一:认识响应式逻辑
  • 【51单片机累计的时间为1分30秒时蜂鸣器叫】2022-7-29
  • VR重现红军过雪山:一场穿越时空的精神洗礼​
  • uniapp AndroidiOS 定位权限检查
  • 图像处理中的凸包检测:原理与实现
  • Protable 问题记录
  • 神经网络简介