当前位置: 首页 > news >正文

Python 数据分析:计算,分组统计2,df.groupby()和grouped.agg()。听故事学知识点怎么这么容易?

目录

  • 1 代码示例
  • 2 欢迎纠错
  • 3 免费爬虫
  • 4 论文写作/Python 学习智能体

1 代码示例

  直接上代码。

def grpby1():data = {"地区": ["江东", "江东", "江南", "江东", "江南", "江北", "江北", "江东", "江南", "江北"],"产品类型": ["手机", "笔记本", "手机", "笔记本", "手机", "手机", "笔记本", "笔记本", "手机", "笔记本"],"销售额": [4950, 7940, 5327, 8563, 6976, 4712, 11247, 7489, 6741, 10238],"订单量": [4, 3, 5, 2, 4, 3, 5, 6, 2, 4]}df = pd.DataFrame(data)# print("原始数据:\n", df)"""地区 产品类型  销售额  订单量0  江东     手机    4950       41  江东   笔记本    7940       32  江南     手机    5327       53  江东   笔记本    8563       24  江南     手机    6976       45  江北     手机    4712       36  江北   笔记本   11247       57  江东   笔记本    7489       68  江南     手机    6741       29  江北   笔记本   10238       4"""df1 = df.groupby(["地区", "产品类型"])# print(df1)"""得到“可迭代对象”。<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000000000627250>这样理解:先按(by)地区、再按产品类型分组(group),连起来就是动词:groupby。按地区得到三类结果:江东、江南、江北。按产品类型得到两类结果:手机、笔记本。所以可迭代对象有不重不漏的 6 个组:江东手机、江东笔记本;江南手机、江南笔记本;江北手机、江北笔记本。可是我就想看看这个对象到底是个啥,怎么办?"""df2 = df1.apply(list)# print(df2)"""地区  产品类型江东  手机      [地区, 产品类型, 销售额, 订单量]笔记本    [地区, 产品类型, 销售额, 订单量]江北  手机      [地区, 产品类型, 销售额, 订单量]笔记本    [地区, 产品类型, 销售额, 订单量]江南  手机      [地区, 产品类型, 销售额, 订单量]dtype: object"""df2 = df1.groups# print(df2)"""{('江东', '手机'): [0], ('江东', '笔记本'): [1, 3, 7], ('江北', '手机'): [5], ('江北', '笔记本'): [6, 9], ('江南', '手机'): [2, 4, 8]}""""""('江南', '手机'): [2, 4, 8]2/4/8 说的是,原 df 数据中,行索引分别为 2/4/8 的,提到了江南手机。""""""后期只聚合“销售额”和“订单量”,可以先简化下数据。"""grouped = df1[["销售额", "订单量"]]"""为什么这么写?可以参考:Python 数据分析:DataFrame,抽行、抽列、抽行列。df[] / df.loc[] / df.iloc[],位置索引 / 标签索引,切片 / 不切片。听故事学知识点怎么这么容易?-CSDN博客https://blog.csdn.net/libofsdnu/article/details/148809320?spm=1011.2415.3001.5331""""""开始聚合吧!"""result = grouped.agg({"销售额": ["sum", "mean"],  # 总销售额和平均销售额"订单量": "count"           # 订单总数})# print(result)"""销售额               订单量sum          mean  count地区 产品类型江东 手机       4950   4950.000000      1笔记本    23992   7997.333333      3江北 手机       4712   4712.000000      1笔记本    21485  10742.500000      2江南 手机      19044   6348.000000      3""""""计算逻辑​:​销售额.sum()​​:同地区同产品的销售额总和​销售额.mean()​​:同地区同产品的平均单笔销售额​订单量.count()​​:订单记录数。指销售次数、交易笔数!看('江东', '手机'): [0],笔数为 1 ,成交量(列为为“订单量”)为 4 。这里容易理解错,认为结果应该是 4 而非 1 ,其实应该就是 1 ,即在数据中只发生了 1 次。那我如果就想要订单的总数量而不是发生的笔数,怎么办?"""result = grouped.agg({"订单量": "sum"})# print(result)"""订单量地区 产品类型江东 手机           4笔记本        11江北 手机           3笔记本         9江南 手机          11""""""这就对了,是吧?count 是笔数,想想:('江东', '手机'): [0];sum 是总量。"""extended_result = grouped.agg({"销售额": ["sum", "mean", "max"],  # 总和、均值、最大值"订单量": ["sum", "std"]         # 总笔数、标准差})print(extended_result)"""销售额                      订单量sum          mean    max    sum       std地区 产品类型江东 手机       4950   4950.000000   4950      4       NaN  ← 只有 1 个样本数据,标准差没法算笔记本    23992   7997.333333   8563     11  2.081666江北 手机       4712   4712.000000   4712      3       NaN  ← 只有 1 个样本数据,标准差没法算笔记本    21485  10742.500000  11247      9  0.707107江南 手机      19044   6348.000000   6976     11  1.527525"""
grpby1()

2 欢迎纠错

  欢迎纠错,随时更新。
  联系方式:评论、私信,或 企鹅 :179 0042 182 。
  码字不易,如觉得还可以,请给个免费的 zan 和 soucang ,让我有动力继续写下去。

3 免费爬虫

https://affiliate
.bazhuayu
.com
/M8lKUC

4 论文写作/Python 学习智能体

https://chatglm.cn/share/WF2C5ree


  • 以下关于 Markdown 编辑器

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

++ 新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法1 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

++ 功能快捷键

撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

++ 合理的创建标题,有助于目录的生成

直接输入1次+,并按下space后,将生成1级标题。
输入2次+,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

++ 如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

++ 插入链接与图片

链接: link.

图片: Alt

带尺寸的图片: Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

++ 如何插入一段漂亮的代码片

去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

++ 生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

++ 创建一个表格
一个简单的表格是这么创建的:

项目Value
电脑$1600
手机$12
导管$1

+++ 设定内容居中、居左、居右
使用:---------:居中
使用:----------居左
使用----------:居右

第一列第二列第三列
第一列文本居中第二列文本居右第三列文本居左

+++ SmartyPants
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPEASCIIHTML
Single backticks'Isn't this fun?'‘Isn’t this fun?’
Quotes"Isn't this fun?"“Isn’t this fun?”
Dashes-- is en-dash, --- is em-dash– is en-dash, — is em-dash

++ 创建一个自定义列表
Markdown
: Text-to-HTML conversion tool

Authors
John
Luke

++ 如何创建一个注脚

一个具有注脚的文本。2

++ 注释也是必不可少的

Markdown将文本转换为 HTML

++ KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ(n)=(n−1)!∀n∈N\Gamma(n) = (n-1)!\quad\forall n\in\mathbb NΓ(n)=(n1)!nN 是通过欧拉积分

Γ(z)=∫0∞tz−1e−tdt.\Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.

你可以找到更多关于的信息 LaTeX 数学表达式here.

++ 新的甘特图功能,丰富你的文章

2014-01-072014-01-092014-01-112014-01-132014-01-152014-01-172014-01-192014-01-21已完成 进行中 计划一 计划二 现有任务Adding GANTT diagram functionality to mermaid
  • 关于 甘特图 语法,参考 这儿,

++ UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:

张三李四王五你好!李四, 最近怎么样?你最近怎么样,王五?我很好,谢谢!我很好,谢谢!李四想了很长时间, 文字太长了不适合放在一行.打量着王五...很好... 王五, 你怎么样?张三李四王五

这将产生一个流程图。:

链接
长方形
圆角长方形
菱形
  • 关于 Mermaid 语法,参考 这儿,

++ FLowchart流程图

我们依旧会支持flowchart的流程图:

Created with Raphaël 2.3.0开始我的操作确认?结束yesno
  • 关于 Flowchart流程图 语法,参考 这儿.

++ 导出与导入

+++ 导出
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

+++ 导入
如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. mermaid语法说明 ↩︎

  2. 注脚的解释 ↩︎

http://www.xdnf.cn/news/1404541.html

相关文章:

  • 告别图片处理焦虑:用imgix实现智能、实时且高效的视觉媒体交付(含案例、截图)
  • 一键掌控三线资源:极简 Shell 脚本实现 CPU·磁盘·内存可视化巡检
  • SRE命令行兵器谱之二:lsof - 解密“端口被占用”与“文件句柄泄漏”的终极侦探
  • MySQL-事务(下)-MySQL事务隔离级别与MVCC
  • 2021-11-10 C++不变初心数
  • ans1语法的一个例子nt5inf.cat
  • 详解Vue2、Vue3与React的Diff算法
  • TuringComplete游戏攻略(2.2存储器)
  • spark.sparkContext.broadcast() 与 org.apache.spark.sql.functions.broadcast 的区别
  • Docker实战避坑指南:从入门到精通
  • 神经网络激活函数:从ReLU到前沿SwiGLU
  • 分分合合,门模块方案又兴起了
  • 用更少的数据识别更多情绪:低资源语言中的语音情绪识别新方法
  • Vue生命周期、工程化开发和脚手架、组件化开发
  • hubert模型代码分析
  • 聚中原·贸全国·达世界,2026郑州台球展8月15至17举办
  • 深入解析Nginx常见模块1
  • 世界模型的典型框架与分类
  • 如何提高存储过程的可维护性
  • wav2vec2.0模型代码分析
  • vite Rendering 10 pagesReferenceError: document is not defined
  • OpenCV 图像形态学操作与边缘检测实战指南
  • 深刻理解软硬件链接
  • 【MogDB】在刚发布的银河麒麟v11上安装MogDB
  • Unity游戏打包——GooglePlay手动传包
  • 微服务架构中的 “双保险“:服务保护与分布式事务解决方案实战
  • 配置vsc可用的C语言环境
  • 【开题答辩全过程】以 基于WEB的茶文化科普系统的设计与实现为例,包含答辩的问题和答案
  • AI融合高等教育:从通识到专业 - 学科+AI人才培养白皮书(下)
  • 防火墙技术(三):状态检测和会话机制