当前位置: 首页 > news >正文

告别excel:AI 驱动的数据分析指南

数据在职场中处处可见,比如汇报、写简历、做决策,就是简单的发放一个问卷调研,也要从调研结果有所洞察。可以说数据分析是打工人的必备技能了。

我在刚入职场的时候,不懂数据分析,不知道这玩意是干啥用的,感觉离自己很远。后来当了产品,要做决策,要规划下个版本,下半年做什么?为了让决策更科学,就要主动去收集信息。

比如产品的运营、销售情况、用户的需求反馈、用户行为数据等等,通常是自己来定义想要的指标,去企业内部的业务系统,或找相关业务的运营或开发拿到数据,在excel内制作图表。必要时还要设计的美观的可视化看板做汇报。

如果有经历过,就知道这个过程相当的消磨时间,特别是在excel里处理上千条内容,确定指标,绘制可视化图表,有时候一做就是一整天。

通常数据分析会涉及到的流程是:

1.数据收集与整合 :从各种来源收集原始数据,并将其整合到一个统一的数据集中

2.数据预处理与清洗 :处理缺失值、异常值,确保数据的质量和一致性

3.数据分析与挖掘 :设定指标、分析维度,挖掘数据中的规律和趋势

4.数据可视化与呈现 :通过图表和报告将分析结果转化为直观易懂的形式

这个流程对标准的数据分析产品和非标准的业务分析都同样适用,每一步都必不可少。虽然过程复杂耗时,但我们现在有了更好的解决方案。

对于上述四个步骤中,数据预处理、分析挖掘和可视化呈现都可以交给AI完成。比如下面效果👇

都是在获取到要分析的内容,结合数据分析看板生成提示词。

提示词1:数据预处理与清洗 发送要清洗的数据文件,或内容,让AI输出excel,甚至你不知道要清洗哪些字段,也可以告诉AI让他自己选择清洗。

我需要对以下数据进行清洗和预处理。请帮我分析这些数据,识别需要清洗的问题(如缺失值、异常值、重复项、格式不一致等),并进行相应的清洗处理。请执行以下任务:
1. 分析数据结构和字段类型
2. 识别并处理缺失值
3. 检测并处理异常值和离群点
4. 移除重复记录
5. 标准化和规范化数据格式
6. 根据数据特点,自行判断并执行其他必要的清洗步骤请以表格形式展示清洗前后的数据对比,并解释您采取的每一步清洗措施及其原因。如果有多个清洗步骤,请分别展示每个步骤的结果。

提示词2:数据分析与挖掘

发送excel、或文本内容,让AI列出可以分析的指标、分析维度,以及可以制作的图表,然后选择合适的指标、维度进行制作

我需要对以下数据进行全面的分析与挖掘。请帮我分析这些数据,提供可行的分析方向和可视化建议。请执行以下任务:
## 第一阶段:数据概览与分析可能性
1. 分析数据结构、字段类型和基本统计特征
2. 列出所有可能的分析指标(如总和、平均值、增长率、占比等)
3. 提供可行的分析维度(如时间维度、地域维度、产品维度、客户维度等)
4. 建议适合这些数据的图表类型(如折线图、柱状图、饼图、热力图、散点图等)## 第二阶段:具体分析执行
基于上述分析,请选择最有价值的3-5个分析方向,并为每个方向:
1. 计算相关指标
2. 按照合适的维度进行分组或筛选
3. 创建对应的数据可视化图表
4. 提供对分析结果的解读和洞察## 第三阶段:总结与建议
1. 总结数据中发现的主要趋势和模式
2. 提出基于数据分析的行动建议或决策支持
3. 指出可能需要进一步分析的方向

提示词3:数据可视化与呈现:

在获取到要分析的内容后,结合下面提示词,发送文本/Excel/PDF给大模型,就可以获取到数据分析看板

强大的代码生成能力,可制作HTMl代码,制作可交互的数据看板

# HTML数据看板生成器## 核心任务:
请分析我提供的数据源 (\[文本/Excel/PDF] - 请指明文件类型并简述内容),提取关键洞察和量化数据。构建一个单一、自包含的HTML文件,以专业、交互友好且视觉吸引人的数据看板形式展示这些信息。## 关键要求:
1.  数据处理与转换:* 清晰阐述将原始输入数据转换为适用于可视化的结构化 JavaScript 对象/数组的逻辑。* 选择3-5个核心指标,使用适合数据类型的图表(折线图、柱状图、饼图等)* 仔细阅读内容,找出可量化的数据、关键趋势、公司案例或观点。2.  可视化与交互性 (ECharts 核心):* 主要库: 使用 ECharts 5.x 进行所有图表绘制。* 图表选型: 采用最能代表数据特性和洞察的 ECharts 图表类型(如折线图、柱状图、饼图/环形图、散点图、热力图等)。* 图表精细化: 图表必须精细调整,包含清晰的标题、坐标轴、标签、内容丰富的提示框 (Tooltip) 和可交互的图例 (Legend)。为数据密集的图表实现 `dataZoom`(区域缩放)。包含 `toolbox`(工具栏)以支持常用操作(保存图片、数据视图)。* 目的性交互: 除默认交互外,考虑简单的筛选器、动态排序(若看板中包含表格数据)或图表联动 (ECharts `connect`) 是否能显著增强数据探索性,并在单文件上下文中可行时实现。3.  代码结构与技术 (单一HTML文件):* HTML: 语义化的 HTML5 结构。为不同的看板区域(如KPI、主图表、详细分解)和图表元素使用明确的 `div` 容器。* CSS:* 在 `<style>` 标签内嵌入 CSS,或少量使用内联样式。* 采用功能优先的CSS方法论(例如,用于边距、内边距、Flexbox/Grid布局、排版),以实现简洁、可维护且响应式的设计,避免外部框架依赖。* JavaScript:* 模块化: 将 JavaScript 分解为定义良好的函数(例如 `processData()`、`createChart1Options()`、`renderChart1()`、`updateDashboardSection()`)。以此模拟组件化方式,提升代码清晰度。* 数据流: 清晰定义数据从处理到图表配置项及渲染的流程。* 动态内容: 如果能简化结构,使用 JavaScript 动态生成重复性元素(如信息卡片或列表项)的 HTML。* 事件处理: 确保 ECharts 实例在 `window.resize` 时能正确 `resize()` (考虑防抖优化性能)。4.  设计与用户体验:* 主题与风格: \[建议一个:现代简约风、科技暗黑模式、商务专业风,或根据数据内容选择]。* 布局: 简洁、响应式,确保在不同设备(桌面、平板、移动端)上的可读性。关键信息应突出显示。* 色板: 使用专业且易于访问的调色板。如果涉及品牌颜色,\[请提供HEX色值]。## 期望输出:
一个单一、完整的HTML文件,并且:
* 能在现代浏览器中无错直接运行。
* 完全响应式且视觉效果优良。
* 有效运用 ECharts 进行富有洞察力的数据可视化和交互。
* 包含结构良好且有注释的 HTML、CSS 和 JavaScript 代码。

如果你不会写提示词,还可以用PromptIDE-提示词开发工具帮你写提示词,以自动补全SQL为例。

假设我们有一个订单明细表(t_order_detail)包含order_id(订单id)、goods_id(商品id)、dept_id(门店id)、num(销量)、price(单价)、order_time(销售时间),我们需要某时间段内贡献门店80%销售额的商品。

ezgif-1aa19464d09aed.gif

生成的提示词如下:

# 角色: 
SQL查询专家## 背景: 
用户需要根据提供的字段及需求编写SQL查询语句。这可能是因为用户需要从数据库中提取特定数据以支持业务决策、生成报告或进行数据分析。用户可能对SQL语法不熟悉,或者需要优化现有的查询语句。## 注意:
1、用户希望通过SQL查询快速获取所需数据,因此查询语句需要高效且准确。
2、用户可能对数据库结构不熟悉,因此需要清晰的字段描述和表关系说明。
3、用户可能希望查询语句能够灵活应对不同的数据需求,因此需要具备一定的通用性和可扩展性。## 技能:
1、精通SQL语法,能够编写复杂的查询语句。
2、熟悉数据库结构设计,能够理解表之间的关系。
3、具备优化查询性能的能力,能够编写高效的SQL语句。
4、能够根据业务需求设计查询逻辑,确保查询结果符合业务要求。## 目标:
1、根据用户提供的字段及需求,编写准确的SQL查询语句。
2、确保查询语句能够高效执行,避免性能瓶颈。
3、提供查询语句的解释,帮助用户理解查询逻辑。
4、根据用户反馈,优化查询语句以满足不断变化的需求。## 约束:
1、查询语句必须符合SQL语法规范。
2、查询语句必须基于用户提供的字段和表结构。
3、查询语句应尽量避免复杂的嵌套查询,以提高可读性和执行效率。
4、查询语句应考虑到数据库的性能,避免全表扫描等低效操作。## 输入:
<字段描述>请补充需要查询的字段名称及其描述</字段描述><表结构>请补充相关表的名称及其字段结构</表结构><查询需求>请补充具体的查询需求</查询需求>## 输出:
1、生成的SQL查询语句。
2、查询语句的解释,包括查询逻辑和字段说明。
3、查询语句的性能优化建议(如有必要)。
4、针对用户需求的进一步建议或扩展查询示例。## 工作流:
1、分析用户提供的字段描述,明确需要查询的字段。
2、分析用户提供的表结构描述,理解表之间的关系。
3、根据用户提供的查询需求描述,设计查询逻辑。
4、编写SQL查询语句,并确保其符合语法规范和性能要求。
5、提供查询语句的解释和优化建议,帮助用户理解和使用查询结果。

接下来我们把我们的需求补充完整后发给大模型:

image.png

生成的数据如下

WITH SalesData AS (SELECT dept_id AS 门店,goods_id AS 商品,SUM(num * price) AS 累计销售额,ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY SUM(num * price) DESC) AS 排名FROM t_order_detailWHERE order_time >= '2025-02-01' AND order_time < '2025-03-01'GROUP BY dept_id, goods_id
)
SELECT 门店,商品,累计销售额,排名
FROM SalesData
WHERE 累计销售额 >= (SELECT PERCENTILE_CONT(0.8) WITHIN GROUP (ORDER BY 累计销售额) FROM SalesData AS sd WHERE sd.门店 = SalesData.门店)
ORDER BY 门店 DESC, 商品 DESC;

除此之外,我们还可以用数据工坊一键生成数据分析报告。

举个例子:我们有一份销售数据,需要输出一份数据分析报告。只需要短短几步就可以完成。

上传数据,生成数据分析维度。

image.png

精调维度,生成数据分析报告。

image.png

短短几分钟,AI 不仅能够快速生成漂亮、有效的数据可视化图表,还能通过人工智能算法,提供更有价值的数据洞察,比如识别数据中的异常模式、相关性和趋势等。让数据可视化不再只是展示,而是洞察的催化剂。

image.png

同样对于生成的数据分析报告中的文字和图表还是可以进行精调。

数据分析师而言,AI 时代的到来同样蕴藏着巨大的发展红利。

那些率先理解 AI、掌握 AI、并能将其成功应用于实际工作中的人,将成为行业的佼佼者。

让我们与AI共同进步。

附:AI工具链接

提示词开发工具|巨人肩膀

数据工坊|巨人肩膀

http://www.xdnf.cn/news/979723.html

相关文章:

  • elementui使用Layout布局-对齐方式
  • input+disabled/readonly问题
  • Vue3 + TypeScript + Element Plus 表格行按钮不触发 row-click 事件、不触发勾选行,只执行按钮的 click 事件
  • Explore Image Deblurring via Encoded Blur Kernel Space论文阅读
  • 时序数据库IoTDB数据模型建模实例详解
  • Jmeter中变量如何使用?
  • MySQL 三表 JOIN 执行机制深度解析
  • 基础数论一一同余定理
  • Qt 动态插件系统QMetaObject::invokeMethod
  • 【docker】docker registry搭建私有镜像仓库
  • 开源 java android app 开发(十二)封库.aar
  • SD-WAN 技术如何助力工业物联网(IIoT)数据传输?深度解析传统方案对比与应用实践
  • Chrome 优质插件计划
  • 智慧农业物联网实训中心建设方案
  • 趋境科技英特尔生态沙龙举办,打通大模型私有化“最后一公里”
  • 当简约美学融入小程序 UI 设计:开启高效交互新篇
  • 【Java学习日记38】:C语言 fabs 与 Java abs 绝对值函数
  • element plus的el-form重置无效
  • CavityPlus: 北大团队研发的综合性蛋白质结合位点检测及功能分析网络服务器
  • 【python】预测投保人医疗费用,附insurance.csv数据集
  • 嵌入式系统内核镜像相关(三)
  • React 状态管理指南:Redux 原理与优化策略
  • 避坑:启动sdk-c demo master需要注意的事情
  • 【AI】模型vs算法(以自动驾驶为例)
  • 基于React Native的HarmonyOS 5.0休闲娱乐类应用开发
  • 多分类性能评估方法
  • 企业级RAG系统架构设计与实现指南(基于Java技术栈)
  • uniapp 腾讯云 COS 访问控制实战(细粒度权限管理)
  • 撤销Git合并操作方法总结
  • 七牛云域名配置与CNAME解析