当前位置: 首页 > ops >正文

Python Day40 学习(复习学习日志Day5-7)

重新对信贷数据集进行了填补空缺值的操作

自己写的时候,还是出现了问题:

首先是忘记了要定义一下data, 通过data =pd.read_csv('data.csv')可以将读取到的数据保存到变量data中,方便后续进行数据分析。

其次,是漏掉了

c = data.columns.tolist()

这行代码的作用是:把DataFrame的所有列名提取出来,转换成一个列表,赋值给变量c。

  • data.columns 得到的是一个包含所有列名的Index对象。
  • .tolist() 方法把这个Index对象转换成普通的Python列表。
  • 这样,c 就是一个包含所有列名的列表,比如:['A', 'B', 'C', ...]

这样做的好处是,后面可以用for i in c:来遍历每一列,方便批量处理每一列的数据。

复习日志Day5,Day6,Day7的内容

补充:关于括号中逗号的使用

在 pd.get_dummies(data, columns=['Home Ownership']) 这样的函数调用中,括号里的逗号是用来分隔不同的参数的。

详细解释

  • 在 Python 的函数调用中,括号里可以传递多个参数,每个参数之间用逗号 , 分隔。
  • 比如:函数名(参数1, 参数2, 参数3, ...)
  • 在 pd.get_dummies 这个函数里:
    • 第一个参数 data 是要处理的数据(DataFrame)。
    • 第二个参数 columns=['Home Ownership'] 是一个关键字参数,指定要进行独热编码的列。
  • 如果你还要加其他参数,比如 drop_first=True,也要用逗号分隔。

勘误:须先填补缺失值再进行独热编码

补充:关于drop_first = True

手写笔记复习

今日复习到这里,明日继续,加油!@浙大疏锦行​​​​​​​

http://www.xdnf.cn/news/10574.html

相关文章:

  • make_unique
  • 基于LangChain的AI助手开发:从零到上线
  • 案例:TASK OA
  • Pycharm的终端无法使用Anaconda命令行问题详细解决教程
  • 兰亭妙微十六年高水准交互设计公司
  • php 各版本下载
  • 探索大语言模型(LLM):RSE流程详解——从文档中精准识别高相关片段
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Form Wave(表单label波动效果)
  • 力扣刷题(第四十五天)
  • navicate菜单栏不见了怎么办
  • cursor如何开启自动运行模式
  • PH热榜 | 2025-05-31
  • Docker常用命令详解与高效记忆指南
  • Android Studio历史版本下载地址汇总
  • 【软件测试】web自动化:Pycharm+Selenium+Firefox(一)
  • 【动画】unity中实现骨骼蒙皮动画
  • 使用FastAPI构建车牌检测识别服务
  • 「Python教案」字符串格式化操作
  • hooks组件-useState
  • 散列表(哈希表)
  • 函数调用的机器级实现(二):栈帧的访问与切换机制
  • 【笔记】为 Python 项目安装图像处理与科学计算依赖(MINGW64 环境)
  • 用wireshark抓包分析学习USB协议
  • 浅写弱口令与命令爆破
  • Cursor 编辑器介绍:专为程序员打造的 AI 编程 IDE
  • Python项目结构
  • 录屏不再难,从功能到体验深度测评
  • MPTCP 聚合吞吐
  • LRU和LFU缓存策略
  • ESP32系列AT固件快速开发——Wi-Fi MQTT