当前位置: 首页 > ops >正文

一句话明白:什么是统计?什么是概率?

4daa1e492208baeb15598c6d1d99d707.jpeg

有一次我“老婆”听我在讲课,讲的是《学习统计对你人生的重要意义是什么?》。讲完课后,我给她说,统计概率真的很重要,然后balaba。

她只淡淡的回了我一句,我竟无言对:虽然我知道你说的很对,但是什么是统计概率呢?对我有什么帮助呢?

当我长篇大论的解释给她听时,她已经不耐烦了:我不是要听你这些晦涩难懂的名称,你应该用生活中的例子讲我听,毕竟我是小白。如果你跟我讲化妆品什么牌子好,我倒是能立马明白。(女人啊)

这句话彻底击中了我的痛点,想让没学过,没有任何基础的人明白什么是统计,什么是概率,确实不容易。难道没有办法了吗?

直到我反复查资料,然后根据我的生活经历,有一天这么跟她聊的时候,她立马明白了什么是统计,什么是概率。还说要好好学习这个“最赚钱的思维”工具呢。我是怎么和她聊的呢?

猴子:老婆,我给你讲个笑话吧。

老婆:如果不好笑,小心我的无影脚。

猴子:某次生物课考试,有一道题是看动物的脚,猜该动物的名称,一考生实在是不会做,愤怒的把试卷撕掉就往外走,老师看见了,抓住他大声说道:“你哪个班的,这么嚣张”。学生把裤腿一提,说道:“你猜啊,你猜啊!”

这个笑话虽然你很早听过,但是很多人却没看懂这个学生绝对是个统计高手。(忽悠,接着忽悠)。

统计就是给你黑盒子里面装着猫和狗,只让你看到他们的腿,然后让你猜哪个腿是猫的。

fd658a8d6da611c079506b0b06db9644.jpeg

你可能会问,这怎么猜?

在统计里会总结过去的数据,然后对这些数据进行总结归纳。就像刚才的例子,我们要判断出哪个腿属于猫。需要收集所有猫的腿(也就是过去的数据),然后总结这些腿的特征(总结归纳)。当图片里的腿出现时,你可以根据之前的总结归纳来判断出这腿是不是猫的腿。

当然,你也不会无聊到判断哪只腿是猫,哪只腿是狗的(更多时候我还是喜欢看美女的腿,,窃喜)。举个更加实际的例子,在医院会对过去有糖尿病的所有病人进行归纳总结(建立模型),当有一个新的病人入院时,就可以用之前的归纳总结来判断该病人是否患糖尿病,然后就可以对症下药了。统计里常说的“分类”就是这个过程。

所以,统计是对过去数据进行“总结归纳”。可以用下图表示:

2fe296cafef955df45f960b4ff544dd9.png

那什么是概率呢?

概率是用数值来表示事情发生的可能性大小。举个例子小马去创业了去找投资人王思聪要钱。王思聪可不是傻X。然后就派猴子我去调查小马过去的经历(看他有什么创业的条件),然后预测他可能成功的概率是多大。经过深入调查我发现小马他爸是马云(给定条件),得出小马创业概率成功率是99%(预测未来)。

如果我们用猫和狗这个例子来举例,就是给了你猫和狗的行为特征(给定条件),然后预测猫和狗明天撕逼的可能性多大。

所以,概率是给定条件,对“数据”进行预测,可以用下图来表示:

b26bd0e8707862609aec088a70f47ddf.png

用简单的话来总结:

统计=回顾过去,进行归纳总结

概率=给定条件,对未来进行预测

用稍微专业一点的话来总结:

统计=样本(回顾过去的数据)归纳出总体(总结)

概率率=总体(给定条件)对样本进行预测

用“专家”的话来解释,就是:

Lary Wasserman 在 《All of Statistics》 的序言里有说过概率论和统计推断的区别:

  • The basic problem of statistical inference is the inverse of probability:Given the outcomes, what can we say about the process that generated the data?

  • The basic problem that we study in probability is: Given a data generating process, what are the properities of the outcomes?

有很多人,给出了这个图,其实理解起来还是比较费劲的。在有前面的理解基础上,再看这个图,你就更容易理解了。

下图翻译:

统计学:根据手中信息,猜猜桶里有啥?(样本归纳总结出总体)

概率论:根据桶中信息,猜猜手里有啥?(总体对样本进行预测)

f0f0cc630bdcf21db3743370af00dd90.png

参考资料:

1)https://http://betterexplained.com/articles/a-brief-introduction-to-probability-statistics/

2)《学习统计概率的重要意义是什么》音频课程无法上传,可以在我的微信公众号:猴子聊知识,中回复“意义”获取。

我是猴子,中科院硕士/前IBM高级软件工程师/豆瓣8分《数据分析思维》作者,我和知乎知学堂出品的「数据分析训练营」即将开课,3天带你掌握数据分析实用技巧,包含课程+实战带练,工作提效、升职加薪必备神器!

报名还有独家Excel自学资料领取,点击文末阅读原文开启数据分析升职加薪密码!

Python机器学习:适合新手的8个项目

面试被经常问的SQL窗口函数!

一张图看懂数据分析、机器学习、深度学习、人工智能的关系

只要会复制粘贴,令人眼前一亮的创意图表你也能制作出来

541b7842c71978efb08d0757d72b652b.jpeg

 ⬇️点击「阅读原文」

 免费报名 数据分析训练营

http://www.xdnf.cn/news/11399.html

相关文章:

  • 华为交换机基本命令
  • iTunes Connect 基本使用说明
  • dfsdf
  • JPA使用指南 javax.persistence的注解配置
  • Young For You - 歌词
  • Android TV开发之VerticalGridView
  • DataBus(数据同步组件)
  • mysql中使用逻辑判断,20.5-20.9 shel:l脚本中的逻辑判断,文件目录属性判断,if特殊用法 ,case判断...
  • centos 下安装ati显卡驱动方法
  • Java开源工具库使用之性能测试JMH
  • windows 2000 系统安装和配置
  • 【SQL注入】(1)原理,框架
  • elk logstash 详解
  • 网站建设经验分享:如何进行网站内容更新与维护?
  • 缓冲区(buffer)与缓存(cache)
  • 关于 ByteHouse 你想知道的一切,看这一篇就够了
  • 软件开发面试题(C#语言,.NET框架)
  • TextMate 小小心得
  • windows socket函数详解
  • WDA学习(25):DateNavigator使用
  • Android 三方APP调用系统隐藏API
  • 什么是可视化编程?为什么它如此重要?
  • 电脑C盘不知不觉满了?学会这6种解决方法!
  • 51 单片机基础
  • 手把手教你Apache2.4 + PHP8.39的安装(windows)及避坑问题点
  • 字节跳动-后台开发岗 面经
  • Model、Map、ModelAndView、HttpServletRequest区别
  • 更好的Java虚拟机Zing: 更好的性能,无停顿,更快的启动
  • 腾讯云 AI 代码助手保姆级使用教程
  • Sql-server 2008的安装