当前位置: 首页 > backend >正文

使用 LLM助手进行 Python 数据可视化

在数据科学中,数据可视化是一项至关重要的任务,旨在揭示数据背后的模式和洞察,并向观众传达这些信息。然而,在编程语言(如 Python)中创建有洞察力的图表有时可能会耗时且复杂。本文介绍了一种借助 AI 助手(如 DeepSeek 大模型)来更高效地构建基于代码的数据可视化方法。通过两个实际应用场景,我们将为您提供利用 AI 工具创建吸引人的数据可视化的提示和建议。

场景一:零售月度销售趋势可视化

假设您是一名零售分析师,想要可视化公司不同产品类别的月度销售趋势,以识别季节性模式。您有一个包含过去两年各类别(如电子产品、服装和家居用品)月度销售数据的数据集。如果没有数据,可以使用以下代码生成一个可管理的数据集:

import pandas as pd
import numpy as np# 设置随机种子以确保可重复性
np.random.seed(42)# 示例月度销售数据集(24个月),添加随机性
data = {'Month': pd.date_range(start='2022-01-01', periods=24, freq='M'),'Electronics': [5000 + i * 200 + (i % 12) * 150 + np.random.randint(-500, 500) for i in range(24)],'Clothing': [7000 + i * 180 + (i % 12) * 130 + np.random.randint(-400, 400) for i in range(24)],'Home Goods': [4500 + i * 170 + (i % 12) * 100 + np.random.randint(-300, 300) for i in range(24)],
}df = pd.DataFrame(data).melt(id_vars="Month", var_name="Category", value_name="Sales")

用户提示词可能会是这样的内容:
“基于所附的数据集,创建一个基于 Python 的折线图,展示过去两年内每个产品类别(电子产品、服装、家居用品)的每月销售趋势。为每个类别使用不同的颜色以便于比较,并添加标题和图例。”

import matplotlib.pyplot as plt
import numpy as npplt.figure(figsize=(12, 6))
for category in df['Category'].unique():subset = df[df['Category'] == category]plt.plot(subset['Month'], subset['Sales'], label=category)
plt.title("Monthly Sales Trends by Category")
plt.xlabel("Month")
plt.ylabel("Sales ($)")
plt.legend(title="Product Category")
plt.grid(True)
plt.show()

执行后,可视化结果将显示出来。

图

场景二:按年龄组可视化患者康复率

现在,假设您是一名健康研究员,已经收集了不同年龄组的康复率数据,并希望创建一个交互式条形图来可视化和识别各组之间的差异。假设您有数据,并希望 AI 助手帮助您生成用于交互式 Plotly 可视化的必要代码。Plotly 是一个多语言可视化工具箱,非常适合为报告和仪表板构建交互式可视化。

例如,您有一个包含不同年龄组平均康复率的小数据集:

Age Group,Recovery Rate
20-24,87
25-29,82
30-34,91
35-39,88
40-44,77
45-49,73
50-54,69
55-59,65
60-64,60
65-69,58
70-74,54
75+,50

用户提示词可能如下所示:

“我有一个包含不同年龄组详细康复率数据的 CSV 文件。你能帮我创建一个交互式条形图吗?我希望每个条形在悬停时显示康复率,最高值用不同的颜色表示。请从 CSV 读取数据,并在图表中包含标记的轴和标题。”

在这种情况下,尽管用户没有明确说明,AI 助手可能会假设需要从外部 CSV 文件加载数据到 Pandas DataFrame 中,然后再进行数据可视化。您可能会得到如下代码:

import pandas as pd
import plotly.graph_objects as go# 从 CSV 加载数据(如果您更喜欢手动创建数据,请替换这部分)
df = pd.read_csv('recovery_rates.csv')# 创建交互式条形图
fig = go.Figure(data=[go.Bar(x=df['Age Group'],y=df['Recovery Rate'],marker_color=['blue' if rate < df['Recovery Rate'].max() else 'green' for rate in df['Recovery Rate']],text=df['Recovery Rate'],textposition='auto')]
)# 布局自定义
fig.update_layout(title="Patient Recovery Rates by Age Group",xaxis_title="Age Group",yaxis_title="Recovery Rate (%)",yaxis_range=[0, 100]
)# 显示交互式图表
fig.show()

执行后,您将得到一个美观的交互式图表。

图

总结

通过本文的两个应用场景,我们展示了如何借助 AI 助手高效地创建基于 Python 代码的交互式和吸引人的数据可视化。这些技巧无疑将加速您的数据科学项目工作流程,将自定义可视化参数的负担留给 AI 助手。希望这些方法能为您的项目带来启发!

http://www.xdnf.cn/news/2378.html

相关文章:

  • 为什么选择 Spring Boot? 它是如何简化单个微服务的创建、配置和部署的?
  • 强化学习机器人路径规划——Sparrow复现
  • 【项目篇之消息序列化】仿照RabbitMQ模拟实现消息队列
  • 毕业设计-基于深度学习的入侵检测系统
  • SpringCloud组件——OpenFeign
  • Windows怎样使用curl下载文件
  • 【C到Java的深度跃迁:从指针到对象,从过程到生态】第四模块·Java特性专精 —— 第十四章 集合框架:告别手写链表的苦役
  • 构建AI大模型应用的LangChain之核心功能
  • C++:STL—容器
  • C++指针(三)
  • 《数据库系统工程师》-B站-视频截图整理-2021-23
  • 2025.04.26-淘天春招笔试题-第三题
  • 机器人学入门 (刚体空间 - 正/逆运动学 - 轨迹规划) 笔记 0.1 (台大机器人学-林沛群)
  • File,IO流,字符集
  • 2025.04.26-饿了么春招笔试题-第一题
  • 基于javaweb的SSM投票管理系统设计与实现(源码+文档+部署讲解)
  • qobject与event事件应用
  • 碰撞检测的艺术:Pygame中的Rect与像素级检测
  • 第三方测试机构如何保障软件质量并节省企业成本?
  • Unity text 表情和超链接解决方案。
  • 贝叶斯算法学习
  • 微服务架构下 MySQL 大表分库分表方案
  • 记录前端vue3封装一个modal弹框
  • 【思维】GCD
  • 巧用 Element - UI 实现图片上传按钮的智能隐藏
  • RK3568 Debian调试记录
  • PROFINE转EtherCAT网关模块实现西门子PLC与欧姆龙NJ系列PLC协议转换实战
  • 用Xshell8配置密钥登陆
  • 正则表达式三剑客之——grep和sed
  • 04-谷粒商城笔记