当前位置: 首页 > ai >正文

python pyecharts 数据分析及可视化

一、任务要求:

任务一:药品消费趋势分析
【任务说明】
现有某医疗机构 10 年的药品销售数据,请根据任务要求完成数
据分析。
【任务要求】
读取所需数据集后对数据进行必要的清洗,分析中成药和西药在
这 10 年中销售占比以及销售额的变化情况,绘制出堆叠面积图并用
Django 框架渲染到前端页面,绘图要求如下:
1.使用 PyEcharts 库绘制堆叠面积图;
2.使用 Django 框架在前端页面中渲染展示堆叠面积图;

二、代码部分:

import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import Line# 读取数据
data_mpv_sale = pd.read_excel(r'./MPV销量数据2012-2021(1).xlsx')# 去重和排序
data_mpv_sale2 = data_mpv_sale.drop_duplicates(subset=['采集时间', '排名'], keep='last')
data_mpv_sale2 = data_mpv_sale2.sort_values(by=['采集时间', '排名'])
print(f"")
print(f"data_mpv_sale2:\n{data_mpv_sale2}")# 转换采集时间为日期格式,便于比较
data_mpv_sale2['采集时间'] = pd.to_datetime(data_mpv_sale2['采集时间'], format='%Y%m')# # 过滤2017年之后的数据
# data_mpv_sale3 = data_mpv_sale2[data_mpv_sale2['采集时间'] > '2017-01-01']
data_mpv_sale3 = data_mpv_sale2# 新增车型_厂商列
data_mpv_sale3['车型_厂商'] = data_mpv_sale3['车型'] + '_' + data_mpv_sale3['厂商']# 创建年份和月份列
data_mpv_sale3['年份'] = data_mpv_sale3['采集时间'].dt.year
data_mpv_sale3['月份'] = data_mpv_sale3['采集时间'].dt.month
print(f"data_mpv_sale3:\n{data_mpv_sale3}")# 定义季度函数
def jidu(month):
"""根据月份返回季度"""
if month <= 3:
return 1
elif month <= 6:
return 2
elif month <= 9:
return 3
else:
return 4# 应用季度函数
data_mpv_sale3['季度'] = data_mpv_sale3['月份'].apply(jidu)# 新增年份_季度列
data_mpv_sale3['年份_季度'] = data_mpv_sale3['年份'].astype(str) + '年' + data_mpv_sale3['季度'].astype(str) + '季度'# 汇总销量数据
sale_season = data_mpv_sale3.groupby(by=['车型_厂商', '年份_季度'])['销量'].sum()# 获取销量前20的车型
sale_total20 = data_mpv_sale3.groupby(by=['车型_厂商'])['销量'].sum().sort_values(ascending=False)[:20].index.valuesprint(f"sale_total20:\n{sale_total20}")# 定义时间列表
year = [2017, 2018, 2019, 2020, 2021]
season = [1, 2, 3, 4]
list_time = [f'{y}年{s}季度' for y in year for s in season if not (y == 2021 and s >= 3)]
print(f"list_time:\n{list_time}")# 创建字典存储销量
sale_dict = {}
for c in sale_total20:
sale_dict[c] = [int(sale_season.get((c, t), 0)) for t in list_time]
print(f"sale_dict:\n{sale_dict}")# 创建折线图
c = (
Line(init_opts=opts.InitOpts(width='800px', height='400px'))
.add_xaxis(xaxis_data=list_time)
.set_global_opts(
tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
yaxis_opts=opts.AxisOpts(type_="value", axistick_opts=opts.AxisTickOpts(is_show=True),
splitline_opts=opts.SplitLineOpts(is_show=True)),
xaxis_opts=opts.AxisOpts(type_="category", boundary_gap=False),
datazoom_opts=opts.DataZoomOpts(),
)
)# 绘制销量曲线
for name, sale_list in sale_dict.items():
c.add_yaxis(
series_name=name,
stack="总量", # 堆积
y_axis=sale_list,
areastyle_opts=opts.AreaStyleOpts(opacity=0.5),
label_opts=opts.LabelOpts(is_show=False), # 隐藏数据标签
is_smooth=True, # 平滑曲线
)# 渲染图表
c.render_notebook() # 如果在Jupyter中运行
# 或者
c.render('mpv_sales_trend.html') # 保存为HTML文件

三、运行结果:

http://www.xdnf.cn/news/14638.html

相关文章:

  • 环境太多?不好管理怎么办?TakMll 工具帮你快速切换和管理多语言、多版本情况下的版本切换。
  • Axure版AntDesign 元件库-免费版
  • 一分钟了解Transformer
  • 云蝠智能VoiceAgent——大模型时代语音交互新纪元
  • 基于STM32的智能书房系统的设计
  • 鸿蒙实时音视频流处理框架开发实战——基于HarmonyOS 4.0与分布式软总线的低延时高可靠架构
  • 【机器学习第二期(Python)】优化梯度提升决策树 XGBoost
  • 【论文解读】Decision Transformer:用序列建模重新定义强化学习
  • 疏锦行Python打卡 DAY 41 简单CNN
  • Vue SPA 路由跳转无法回到顶部问题排查与解决
  • OceanBase向量检索在货拉拉的探索和实践
  • 【深度学习新浪潮】什么是上下文工程?
  • 大语言模型(LLM)初探:核心概念与应用场景
  • HarmonyOS 5分布式数据库有哪些性能指标?
  • 分布式系统 - 分布式缓存及方案实现
  • 【CUDA调优指南】合并访存
  • 基于R语言的亚组分析与森林图绘制1
  • 3 大语言模型预训练数据-3.2 数据处理-3.2.2 冗余去除——1.SimHash算法处理冗余信息的核心原理
  • Git常用操作详解
  • “Ubuntu 18.04.6 LTS“ 配置网卡静态IP
  • python的kivy框架界面布局方法详解
  • 【Pandas】pandas DataFrame asfreq
  • 【android bluetooth 协议分析 10】【AVRCP详解1】【PlaybackStateCompat类如何查看】
  • 系统性能优化-5 选择合适的锁
  • Golang单例实现
  • 如何将FPGA设计验证效率提升1000倍以上(1)
  • Vue 英雄列表搜索与排序功能实现
  • Python训练营-Day40-训练和测试的规范写法
  • 鸿蒙开发深入解析:Data Ability 数据共享机制全面指南
  • FPGA基础 -- Verilog 验证平台之 **cocotb 验证 `阶乘计算模块(factorial)` 的例子**