当前位置: 首页 > news >正文

【59 Pandas+Pyecharts | 淘宝华为手机商品数据分析可视化】

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 数据信息
    • 2.3 数据去重
    • 2.4 提取付款人数
    • 2.5 计算销量
    • 2.6 发货地址处理
  • 🏳️‍🌈 3. Pyecharts数据可视化
    • 3.1 各系列手机销售占比
    • 3.2 各价格区间手机销量
    • 3.3 各省手机发货量地图
    • 3.4 手机发货量TOP10城市
    • 3.5 店铺累计手机销售额TOP10
    • 3.6 旗舰店手机销量占比
    • 3.7 商品标题词云
  • 🏳️‍🌈 4. 可视化项目源码+数据

大家好,我是 👉 【Python当打之年(点击跳转)】

本期将利用Python分析「华为手机数据集」 ,看看:各系列手机销售占比、各价格区间手机销量分布、各省手机发货量地图、手机发货量TOP10城市、店铺累计手机销售额TOP10、旗舰店手机销量占比等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas — 数据处理
  • Pyecharts — 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_excel('./华为手机.xlsx')

在这里插入图片描述

2.2 数据信息

df.info()

在这里插入图片描述

2.3 数据去重

df = df.drop_duplicates()

2.4 提取付款人数

df1['付款人数'] = df1['付款人数'].fillna('0人付款')
df1 = df1[df1['付款人数'].str.contains('付款')]
df1['num'] = [re.findall(r'\d+', i)[0] for i in df1['付款人数']]

2.5 计算销量

df1['销售额'] = df1['num'] * df1['价格']
df1['销售额'] = df1['销售额'].astype('int')

2.6 发货地址处理

df1['省份'] = df1['发货地址'].str.split(' ').apply(lambda x:x[0])
df1['城市'] = df1['发货地址'].str.split(' ').apply(lambda x:x[1])

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各系列手机销售占比

def get_pie():pie1 = (Pie().add('',datas,center=['50%', '55%'],).set_global_opts(visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color),title_opts=opts.TitleOpts(title='1-华为各系列手机销售占比',subtitle=subtitle,pos_top='2%',pos_left="center",)))

在这里插入图片描述

  • Mate(53.79%)、 Pura(16.78%)、Nova(7.05%)、畅享(22.38%)

3.2 各价格区间手机销量

def get_line():line = (Line().add_xaxis(x_data).add_yaxis('', y_data).set_global_opts(title_opts=opts.TitleOpts(title='2-各价格区间手机销量',subtitle=subtitle,pos_top='2%',pos_left="center",),))

在这里插入图片描述

  • 1000-2000元区间手机购买人数最多,超过30万人付款,其次是2000-3000元区间,付款人数也超过了20万,1000-3000元区间销量占比超过了60%

3.3 各省手机发货量地图

在这里插入图片描述

  • 上图可以看出:发货地主要集中在广东、江苏、浙江、上海、山东、北京、河北等地

3.4 手机发货量TOP10城市

def get_bar():chart = (Bar().add_xaxis(x_data).add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right')).set_global_opts(title_opts=opts.TitleOpts(title='4-手机发货量TOP10城市',subtitle=subtitle,pos_top='2%',pos_left='center',),))

在这里插入图片描述

  • 深圳(401397)、东莞(151210)、北京(69626)、杭州(45744)、广州(32577)、上海(24253)、唐山(13116)、济南(13112)、揭阳(6450)、宁波(6017)

3.5 店铺累计手机销售额TOP10

在这里插入图片描述

  • 华为官方旗舰店(101740万)、苏宁易购官方旗舰店(15698万)、喵速达电器官方旗舰店(6274万)、华为蓝阳专卖店(5697万)、信息港数码专营店(4843万)

3.6 旗舰店手机销量占比

在这里插入图片描述

  • 旗舰店手机销量占比:61.62%

3.7 商品标题词云

def get_wordcloud():wordcloud = (WordCloud().add("",data_pair=datas, word_size_range=[20, 80]).set_global_opts(title_opts=opts.TitleOpts(title='7-商品标题词云',subtitle=subtitle,pos_top='2%',pos_left="center",title_textstyle_opts=opts.TextStyleOpts(color=lab_color, font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color),))

在这里插入图片描述

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

http://www.xdnf.cn/news/981523.html

相关文章:

  • 深度解读谷歌Brain++液态神经网络:重塑动态智能的流体计算革命
  • Gogs:一款极易搭建的自助 Git 服务
  • [Java恶补day22] 240. 搜索二维矩阵Ⅱ
  • React第六十节 Router中createHashRouter的具体使用详解及案例分析
  • android studio向左向右滑动页面
  • Babylon.js引擎
  • MMDG++:构筑多模态人脸防伪新防线,攻克伪造攻击与场景漂移挑战
  • java面向对象高级部分
  • 大数据服务器和普通服务器之间的区别
  • LDStega论文阅读笔记
  • 【基于阿里云上Ubantu系统部署配置docker】
  • RawTherapee:专业RAW图像处理,免费开源
  • 【AI智能体】Coze 数据库从使用到实战操作详解
  • Docker Compose完整教程
  • day51python打卡
  • AI时代的行业重构:机遇、挑战与生存法则
  • Spring Boot + MyBatis日志前缀清除方法
  • Grounding Language Model with Chunking‑Free In‑Context Retrieval (CFIC)
  • mysql如何快速生成测试大数据库
  • Java高频面试之并发编程-27
  • TensorZero:开源 LLM 应用优化与可观测性平台
  • SpringBoot 前后台交互 -- CRUD
  • 前端模块化的过去和未来
  • spider分享--图片
  • 如何使用deepseek满血版
  • 语音合成之二十 VITS模型详解与MeloTTS实现
  • PCB设计教程【大师篇】STM32开发板原理图设计(接口部分)
  • 基于生成对抗网络(GAN)的图像生成与编辑:原理、应用与实践
  • CTFshow-PWN-栈溢出(pwn52)
  • 【Docker基础】Docker核心概念:容器(Container)详解