当前位置: 首页 > ai >正文

使用excel 工具做数据清洗

数据分析中有个很重要的预处理步骤,叫做「数据清洗」。

简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。

1、缺失数据

如果某处缺了一两个数据,最简单的方法就是 —— 扔了它。

别笑!

这的确是正规的数据清洗手段,在表格不大、不完整数据较少的情况下,完全可以这样做。

「比如 2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的~」

[Excel 如何数据清洗]

但这样可能将潜在信息删除,也可能导致数据分析出现较大偏差。

所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。
❶ 空值变 0 值

【Ctrl+G】定位,【定位条件】,选择【空值】,【确定】,最后输入 0。
在这里插入图片描述
在这里插入图片描述
2、重复数据

至于重复数据,在之前的「数据核对」篇中已经讲过了,这里就不再赘述。

点此回顾「数据核对」

很多时候,我们在基础的 Excel 应用中就完成了「数据清洗」的步骤。

3.错误数据

函数错误值,比如#DIV / 0!、#N / A! 之类,只要在公式外套上 IFERROR 就行:
在这里插入图片描述

首页 > Office之家>Office学院
Excel 如何数据清洗
秋叶Excel 2025/2/8 13:09:13 责编:梦泽
评论:0

原文标题:《Excel 里把人“逼疯”的杂乱数据,原来 1 分钟就能整理好!》

锵锵!大家好哇~ 我是最近在研究数据分析的卫星酱~

数据分析中有个很重要的预处理步骤,叫做「数据清洗」。

简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。

光讲概念也太难理解了,卫某今天就直接用实例,给大家看看数据清洗,到底是怎么个事儿~
1、缺失数据

如果某处缺了一两个数据,最简单的方法就是 —— 扔了它。

别笑!

这的确是正规的数据清洗手段,在表格不大、不完整数据较少的情况下,完全可以这样做。

「比如 2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的~」

[Excel 如何数据清洗]

但这样可能将潜在信息删除,也可能导致数据分析出现较大偏差。

所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。

❶ 空值变 0 值

【Ctrl+G】定位,【定位条件】,选择【空值】,【确定】,最后输入 0。

[Excel 如何数据清洗]

❷ 统计学方法

但很多时候不能这样粗暴地填充。

实际应用常选择统计学方法,比如平均值,来填充缺失的数据。

[Excel 如何数据清洗]

当然,根据数据实际类型,也可能使用中间值、最大值、最小值或者其他更复杂的函数值。

像这个预测函数,就怪好用的。

[Excel 如何数据清洗]
2、重复数据

至于重复数据,在之前的「数据核对」篇中已经讲过了,这里就不再赘述。

点此回顾「数据核对」

很多时候,我们在基础的 Excel 应用中就完成了「数据清洗」的步骤。

数据分析的门槛,真的没我们想象的那么高~
3、错误数据

函数错误值,比如#DIV / 0!、#N / A! 之类,只要在公式外套上 IFERROR 就行:

[Excel 如何数据清洗]

另一种错误数据,就没那么好对付了……

「比如等级只有「A / B / C」三种,有个单元格却出现了「D」的;或者要求填写「√」,偏偏有人写「☑」的……」

这种除了在一开始设置数据验证,就只有用查找、计数、条件格式等偏门方法了

这种错误数据「D」,可以用【查找】或【筛选】直接定位它。
而「感觉上不对」的数据,就比较难找到了:
在这里插入图片描述

首页 > Office之家>Office学院
Excel 如何数据清洗
秋叶Excel 2025/2/8 13:09:13 责编:梦泽
评论:0

原文标题:《Excel 里把人“逼疯”的杂乱数据,原来 1 分钟就能整理好!》

锵锵!大家好哇~ 我是最近在研究数据分析的卫星酱~

数据分析中有个很重要的预处理步骤,叫做「数据清洗」。

简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。

光讲概念也太难理解了,卫某今天就直接用实例,给大家看看数据清洗,到底是怎么个事儿~
1、缺失数据

如果某处缺了一两个数据,最简单的方法就是 —— 扔了它。

别笑!

这的确是正规的数据清洗手段,在表格不大、不完整数据较少的情况下,完全可以这样做。

「比如 2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的~」

[Excel 如何数据清洗]

但这样可能将潜在信息删除,也可能导致数据分析出现较大偏差。

所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。

❶ 空值变 0 值

【Ctrl+G】定位,【定位条件】,选择【空值】,【确定】,最后输入 0。

[Excel 如何数据清洗]

❷ 统计学方法

但很多时候不能这样粗暴地填充。

实际应用常选择统计学方法,比如平均值,来填充缺失的数据。

[Excel 如何数据清洗]

当然,根据数据实际类型,也可能使用中间值、最大值、最小值或者其他更复杂的函数值。

像这个预测函数,就怪好用的。

[Excel 如何数据清洗]
2、重复数据

至于重复数据,在之前的「数据核对」篇中已经讲过了,这里就不再赘述。

点此回顾「数据核对」

很多时候,我们在基础的 Excel 应用中就完成了「数据清洗」的步骤。

数据分析的门槛,真的没我们想象的那么高~
3、错误数据

函数错误值,比如#DIV / 0!、#N / A! 之类,只要在公式外套上 IFERROR 就行:

[Excel 如何数据清洗]

另一种错误数据,就没那么好对付了……

「比如等级只有「A / B / C」三种,有个单元格却出现了「D」的;或者要求填写「√」,偏偏有人写「☑」的……」

这种除了在一开始设置数据验证,就只有用查找、计数、条件格式等偏门方法了

这种错误数据「D」,可以用【查找】或【筛选】直接定位它。

[Excel 如何数据清洗]

而「感觉上不对」的数据,就比较难找到了:

[Excel 如何数据清洗]

▲ 误差过大,不是测量误差可以解释的

这时我们就只能因地制宜,想办法定位它,例如用 IF 函数筛选大于 36.13 的数据。

找到之后按照「缺失数据」的办法处理它就是了。

http://www.xdnf.cn/news/7165.html

相关文章:

  • 盲盒一番赏小程序系统发展:创新玩法激发市场活力
  • 使用 Whisper 生成视频字幕:从提取音频到批量处理
  • 【数据仓库面试题合集④】SQL 性能调优:面试高频场景 + 调优策略解析
  • java.io.IOException: Broken pipe \ 你的主机中的软件中止了一个已建立的连接
  • 树莓派python_can
  • HDMI 屏幕 电脑HDMI HDMI采集卡的关系
  • 2025年渗透测试面试题总结-各厂商二面试题02(题目+回答)
  • BGP local preference选路 AS-Path
  • 【网络编程】十二、两万字详解 IP协议
  • 仓颉开发语言入门教程:搭建开发环境
  • 路由器实战操作
  • React集成百度【JSAPI Three】教程(001):快速入门
  • 云原生环境下的事件驱动架构:理念、优势与落地实践
  • 【MySQL基础】MySQL基础:MySQL基本操作与架构
  • C++ 与 Python 内存分配策略对比
  • 一发入魂:极简解决 SwiftUI 复杂视图未能正确刷新的问题(下)
  • Grafana当前状态:SingleStat面板
  • ArcGIS Pro 3.4 二次开发 - 框架
  • 【VBA/word】批量替换字体大小
  • 基于亚博K210开发板——安全散列算法加速器测试
  • LangChain4j入门(五)聊天记忆持久化
  • 用算术右移实现逻辑右移及用逻辑右移实现算术右移
  • 3.4/Q2,Charls最新文章解读
  • Day 24 训练
  • 2009-2025计算机408统考真题及解析
  • Java——创建多线程的四种方式
  • (二十一)Java集合框架源码深度解析
  • 渗透测试核心技术:信息收集与扫描
  • Java开发经验——阿里巴巴编码规范实践解析3
  • 报告精读:华为2024年知行合一通信行业数据治理实践指南报告【附全文阅读】