当前位置: 首页 > ds >正文

【62 Pandas+Pyecharts | 智联招聘大数据岗位数据分析可视化】

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 数据信息
    • 2.3 数据去重
    • 2.4 薪资处理
  • 🏳️‍🌈 3. Pyecharts数据可视化
    • 3.1 各城市平均薪资
    • 3.2 岗位数量前20的城市
    • 3.3 岗位学历占比
    • 3.4 不同学历平均薪资
    • 3.5 岗位工作经验占比
    • 3.6 不同工作经验平均薪资
    • 3.7 不同行业平均薪资
    • 3.8 不同企业类型数量
    • 3.9 公司规模占比
    • 3.10 岗位词云
  • 🏳️‍🌈 4. 可视化项目源码+数据

大家好,我是 👉 【Python当打之年(点击跳转)】

本期我们利用Python分析「智联招聘大数据岗位数据集」,看看:各招聘城市平均薪资分布、招聘岗位数量分布、岗位学历要求、岗位经验要求、不同学历不同工作经验平均薪资分布等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas— 数据处理
  • Pyecharts— 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_excel('datas.xlsx')

在这里插入图片描述

2.2 数据信息

df.info()

在这里插入图片描述

2.3 数据去重

df = df.drop_duplicates()

2.4 薪资处理

def split_salary(salary, method):low_salary_1 = 0.0high_salary_1 = 0.0salary_t = salary.split('·')[0] if '-' in salary_t: low_salary = salary_t.split('-')[0]high_salary = salary_t.split('-')[1] if '万' in salary_t:low_salary_1 = float(low_salary) * 10000high_salary_1 = float(high_salary.replace('万','')) * 10000                     elif '元' in salary_t: low_salary_1 = float(low_salary)high_salary_1 = float(high_salary.replace('元',''))if method == 'low':returnint(low_salary_1)elif method == 'high':returnint(high_salary_1)

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各城市平均薪资

def get_chart():chart = (Map(i).add('',data_pair=datas,maptype='china-cities',is_map_symbol_show=False,).set_global_opts(visualmap_opts=opts.VisualMapOpts(pos_left = '3%',pos_bottom='20%',range_color=range_color),legend_opts=opts.LegendOpts(is_show=False),title_opts=opts.TitleOpts(title="1-各城市平均薪资",subtitle=subtitle,pos_left='center', pos_top='2%',title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),))

在这里插入图片描述

  • 东部地区平均薪资要明显高于中西部地区,沿海地区平均薪资更高。

3.2 岗位数量前20的城市

def get_chart():chart = (Bar().add_xaxis(x_data).add_yaxis('', y_data).set_global_opts( visualmap_opts=opts.VisualMapOpts(range_color=range_color),title_opts=opts.TitleOpts(title='2-岗位数量前20的城市',pos_top='2%',pos_left = 'center',title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),))

在这里插入图片描述

  • 从招聘岗位上看上海、西安、成都、天津、重庆、武汉、北京、长沙、杭州、郑州等城市较其他城市更多。

3.3 岗位学历占比

在这里插入图片描述

  • 本科学历要求占比最高,占比高达67%,其次是大专类约19%,硕士类约8%。

3.4 不同学历平均薪资

在这里插入图片描述

  • 不同学历薪资方面来看,平均薪资和学历关系比较明显,博士平均薪资27K、硕士平均薪资16K、本科平均薪资13K。

3.5 岗位工作经验占比

def get_chart():chart = (Pie().add('',datas,radius=['40%', '70%'],).set_global_opts(title_opts=opts.TitleOpts(title="5-岗位工作经验占比",pos_top='2%',pos_left = 'center',title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color),))

在这里插入图片描述

  • 3-5年工作经验需求数量最多,占比约30%,其次是1-3年占比约25%,不限工作经验的岗位数量约占24%,和1-3年占比相当,5-10年工作经验的岗位也达到了15%。

3.6 不同工作经验平均薪资

在这里插入图片描述

  • 不同工作经验平均薪资来看,工作经验和平均薪资基本呈正相关的关系,10年工作经验平均薪资30K,5-10年工作经验19K,3-5年工作经验13K。

3.7 不同行业平均薪资

在这里插入图片描述

  • 从招聘行业薪资上看:汽车后市场、专用设备制造、新闻/出版、在线医疗、建材、人力资源服务、基金、船舶/航空/航天/火车制造、装饰装修、橡胶和塑料制品等行业的平均薪资相对较高。

3.8 不同企业类型数量

在这里插入图片描述

3.9 公司规模占比

在这里插入图片描述

3.10 岗位词云

def get_chart():chart = (WordCloud().add('',words,word_size_range=[20,50]).set_global_opts(title_opts=opts.TitleOpts(title='10-岗位词云',pos_top='2%', pos_left="center",title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,range_color=range_color)))

在这里插入图片描述

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

http://www.xdnf.cn/news/14242.html

相关文章:

  • 如何VMware虚拟机扩容磁盘,有很详细图文
  • Blazor Web Assembly - 使用Power Automate Desktop来跟踪一下Blazor页面的内存使用情况
  • 动态规划:求最长回文子串
  • OpenMMlab导出MaskFormer/Mask2Former实例分割模型并用onnxruntime和tensorrt推理
  • DB2连接池监控与挂起连接释放指南
  • Win32OpenSSL工具下载地址
  • Electron截取响应体
  • @Validation 的自定义校验实现, Spring Boot 和 java
  • 实现网页中嵌入B站视频播放器:解决high_quality=1 失效的问题
  • struct stat结构体
  • NY230NY233美光固态闪存NY237NY246
  • 【Transformer拆解】-2. 位置编码(Positional Encoding)
  • 一个密码实现库crypto-work
  • Pandas数据工程深度解析
  • 四数之和-力扣
  • XSS (Reflected)-反射型XSS
  • 晶振常见封装工艺及其特点
  • 深入讲解 Ollama 的源码
  • 【Java多线程从青铜到王者】定时器的原理和实现(十一)
  • Spring依赖注入源码学习:基于XML配置的DI源码解析
  • PGCP:用于比较基因组学的植物基因组综合数据库-文献精读144
  • 信息学奥赛一本通 1543:【例 3】与众不同
  • ubuntu之坑(十四)——安装FFmpeg进行本地视频推流(在海思平台上运行)
  • UVM同步的方法
  • RPT:预训练新范式,用强化学习做预训练!
  • 生成式AI如何与RPA融合?
  • Cursor-1.0安装Jupyter-Notebook,可视化运行.ipynb文件中Python分片代码
  • 使用麒麟V10操作系统的KVM服务,但麒麟V10存在高危漏洞无法修复?
  • 【运维】iDRAC、Lifecycle Controller、Unified Server Configurator 的区别
  • 【1/2, 2/3, 3/5, 5/8, 8/13, ...写一个函数,计算以下数列的前10项之和,在主函数中调用该函数并输出结果。】2022-5-19