当前位置: 首页 > news >正文

数据的获取与读取篇---常见的数据格式CSV

        数据分析师最喜欢的数据格式是CSV,与JSON一样,CSV也是纯文本文件,也就是说文字内容不存在粗体、下划线、字号、颜色等特征。

CSV的概念

        CSV,全称是Comma-Separated Values,表示逗号分隔值,如果把逗号对齐,CSV的结构基本上就是一个表格。想要看逗号对齐的效果,可以用Excel等表格软件打开CSV文件,就能直接看到CSV以表格形式的样子

CSV的内容结构

       CSV文件的第一行通常作为表头(列名),但也可以没有表头,直接从数据开始。表格头下面每一条数据都是独占一行,因此将CSV文件内容直接转换成DataFrame后,CSV的行和DataFrame的行之间能够直接对应上,而且每行数据里所包含的值的数量是相同的,即逗号分隔符的数量也必须一样。

        若哪一行多了或少了说明那不是一个合格有效的CSV。若某个数据值里面正好包含英文逗号怎么办?这种情况下,可以用引号把那整个值包围起来,里面的逗号就不会被当成充当分隔符的逗号了。若值内包含引号,需用双引号转义(如""内部引号""),且外层引号需闭合。若某个值为空缺,空缺值可用相邻逗号(,,)、空字符串("")或特定标记(如NULL)表示,具体取决于解析工具。

CSV概念总结

        总之,CSV本身是一个非常规整的二维结构,

http://www.xdnf.cn/news/663085.html

相关文章:

  • uv使用教程
  • Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible
  • 【STM32开发板】电源设计原理
  • Typescript学习教程,从入门到精通,TypeScript 名称空间与模块语法知识点及案例(14)
  • 前缀和实现题目:区域和检索 - 数组不可变
  • 第2章(新)Day2 - Python基础入门
  • 【图论 并集查找】P3671 [USACO17OPEN] Where‘s Bessie? S|普及+
  • python打卡训练营打卡记录day37
  • 自驾总结Module(综述)
  • CN 第二章 应用层-判断题
  • uniapp-商城-70-shop(3-商品列表,点击规格,进行属性选择)
  • AI巡检系统适合多大面积的餐厅?
  • lc hot 100之:找到所有数组中消失的数字
  • SQL:合并查询(UNION)
  • DL00347-基于人工智能YOLOv11的安检X光危险品刀具检测含数据集
  • 报文完整性与数字签名
  • 【修电脑的小记录】打不开某个网站
  • Linux `ls` 命令深度解析与高阶应用指南
  • Mysql数据库之日志与备份
  • 论坛系统自动化测试实战
  • SpringAI--RAG知识库
  • Windows中安装Neo4j图数据库的配置
  • 数据架构:零售业数字化转型的“隐形引擎”
  • 什么是软件验收测试,出验收测试报告的软件检测机构推荐
  • MySQL问题:数据库有哪些存储引擎,它们有什么区别?
  • Jenkins部署
  • 小型电磁脉冲干扰(EMP)的原理及组成
  • L1-111 大幂数 - java
  • day37打卡
  • 二、网络安全常见编码及算法-(1)