当前位置: 首页 > ds >正文

【数据挖掘笔记】兴趣度度量Interest of an association rule

        在数据挖掘中,关联规则挖掘是一个重要的任务。兴趣度度量是评估关联规则的重要指标,以下是三个常用的兴趣度度量:支持度、置信度和提升度。

支持度(Support)

计算方法

支持度表示包含项集的事务占总事务的比例,用于衡量项集的普遍性。其计算公式为:

 

对于关联规则 X→Y,其支持度计算公式为

含义及理解

        支持度反映了项集或关联规则在整个数据集中的出现频率,用于衡量实用性,简单来说就是出现的越频繁,说明越实用。就好比明星粉丝越多,说明他在群众中收到的支持就越大,有一天他逃难收到的帮助可能性就越大。

置信度(Confidence)

计算方法

        置信度表示在包含前项 X 的事务中,同时包含后项 Y 的比例,用于衡量关联规则的可靠性。其计算公式为:

含义及理解

置信度反映了关联规则的可信程度。本质上是条件概率,满足条件下得到结果的可靠性。

提升度(Lift)

计算方法

        提升度表示关联规则中前项和后项之间的关联强度,用于衡量关联规则的关联性。其计算公式为:

含义及理解

        提升度反映了关联规则中前项和后项之间的关联程度。但是很显然这太抽象了,有没有更通俗易懂的理解呢主包?有的!比如你买茶和咖啡,买茶后买咖啡的概率是0.75,但是单独买咖啡的概率是0.9,提升度就小于1,因为大家本来就爱买咖啡,但是买茶之后买咖啡的人数比例还减少了,说明喝茶的人中有一部分人发现了喝咖啡不健康,所以那部分人少了,所以买茶人群中的买咖啡比例才会从0.9减少到了0.75。

  • 如果提升度大于1,说明前项和后项之间存在正关联,即前项的出现会增加后项出现的可能性;
  • 如果提升度小于1,说明前项和后项之间存在负关联,即前项的出现会降低后项出现的可能性;
  • 如果提升度等于1,说明前项和后项之间相互独立,没有关联。
http://www.xdnf.cn/news/6465.html

相关文章:

  • AI大模型学习二十四、实践QEMU-KVM 虚拟化:ubuntu server 25.04 下云镜像创建Ubuntu 虚拟机
  • [6-8] 编码器接口测速 江协科技学习笔记(7个知识点)
  • ES常识8:ES8.X如何实现热词统计
  • 微服务概述
  • 量子隧穿:PROFINET到Ethernet ip的无损耗协议转换方案转
  • 【寻找Linux的奥秘】第五章:认识进程
  • salesforce如何导出所有字段
  • SQL注入---05--跨站注入
  • 解决Mongoose “Cannot overwrite model once compiled“ 错误的完整指南
  • pytest多种断言类型封装为自动化断言规则库
  • 宝元LNC数控数据采集方式、跨平台采集通讯方案介绍
  • 每日算法-250515
  • 联合建模组织学和分子标记用于癌症分类|文献速递-深度学习医疗AI最新文献
  • Kafka快速安装与使用
  • 2900. 最长相邻不相等子序列 I
  • 【鸿蒙开发】性能优化
  • GPT-4o 遇强敌?英伟达 Eagle 2.5 视觉 AI 王者登场
  • Python中常用的数据类型
  • 特种设备事故背后,叉车智能监控系统如何筑牢安全防线
  • DeepSeek 赋能物联网:从连接到智能的跨越之路
  • Python类的力量:第五篇:魔法方法与协议——让类拥有Python的“超能力”
  • 【C语言】初阶数据结构相关习题(二)
  • 判断数据的所有属性是否都是基本类型
  • 鸿蒙OSUniApp制作动态筛选功能的列表组件(鸿蒙系统适配版)#三方框架 #Uniapp
  • 青少年编程与数学 02-019 Rust 编程基础 14课题、并发编程
  • 网络安全EN18031-1,EN18031-2,EN18031-3三个标准对应的测试项目
  • google-Chrome常用插件
  • 费曼技巧实践
  • YOLO v3:目标检测领域的质变性飞跃
  • 如何快速入门-衡石科技分析平台