数据的获取与读取篇---获取数据
获取数据
数据分析流程
数据获取 → 读取数据 → 评估数据 → 清洗数据 → 整理数据 → 分析数据 → 可视化数据
获取数据的方法
数据是数据分析流程的原料,首先是获得原料才有后面的步骤。获取数据的方法有哪些呢?获取数据又可以分为获取私密数据和获取公开数据。
获取私密数据:
获取私密数据没有通用的方法,举个例子:公司数据库里存储的交易数据,外部无法获得。你如果是公司的员工,要拿到这个数据可能要给程序员提需求或是自行写查询语句来提取。总之方法取决于具体情况。
获取公开数据:
- 直接下载,这是最简单的方法,有网络即可。网络上有一些提供公开数据集的网站,例如:
- 飞桨(百度旗下深度学习平台)数据集:开放数据集- 飞桨AI Studio星河社区 - 人工智能学习与实训社区
- 天池(阿里云旗下开发者竞赛平台):天池数据集_阿里系唯一对外开放数据分享平台-阿里云天池
- 和鲸社区(数据科学开源社区&