当前位置: 首页 > news >正文

nDCG(归一化折损累计增益) 是衡量排序质量的指标,常用于搜索引擎或推荐系统

nDCG(归一化折损累计增益) 是衡量排序质量的指标,常用于搜索引擎或推荐系统。核心思想是:排名越靠前的高质量结果,对整体评分的贡献越大,但后续结果的贡献会逐渐“打折”。最终通过对比实际排序与理想排序的得分,得到一个0到1之间的值(越接近1,排序越好)。


通俗解释:

假设你搜索“苹果”,搜索引擎返回5个结果。nDCG的作用是:

  1. 给高质量结果加分(比如相关度高的排在前面)。
  2. 给靠后的结果打折(比如第5名的结果即使相关,贡献也变小)。
  3. 对比“实际排序”和“完美排序”的得分,最终给出一个0~1的评分(1表示完美)。

数值举例(假设相关度分3档:0不相关,1一般,2非常相关)

场景:
  • 实际排序:结果的相关度依次为 [2, 1, 2, 0, 1]
  • 理想排序(按相关度从高到低排列):[2, 2, 1, 1, 0]

计算步骤:
  1. 计算DCG(实际排序的得分)

    • 公式:每个结果的增益除以它的位置的对数值(位置从1开始)。
    • 计算:
      DCG = 2/log₂(2) + 1/log₂(3) + 2/log₂(4) + 0/log₂(5) + 1/log₂(6)= 2/1 + 1/1.585 + 2/2 + 0 + 1/2.585≈ 2 + 0.63 + 1 + 0 + 0.39≈ 4.02
      
  2. 计算IDCG(理想排序的得分)

    • 理想排序的DCG即为IDCG:
      IDCG = 2/log₂(2) + 2/log₂(3) + 1/log₂(4) + 1/log₂(5) + 0/log₂(6)= 2/1 + 2/1.585 + 1/2 + 1/2.322 + 0≈ 2 + 1.26 + 0.5 + 0.43≈ 4.19
      
  3. 归一化得到nDCG

    nDCG = DCG / IDCG = 4.02 / 4.19 ≈ 0.96
    

结论:

  • nDCG≈0.96,接近1,说明实际排序接近理想情况。
  • 如果实际排序完全乱序(比如把不相关的结果排第一),nDCG会接近0。
http://www.xdnf.cn/news/232363.html

相关文章:

  • ES搜索知识
  • 智能文档挖掘新纪元:MinerU如何突破内容提取的界限
  • Qwen 2.5 VL多模态模型的应用
  • VS Code 插件Git History Diff 使用
  • 【java】输入
  • Windows11安装Docker
  • git分支分叉强制更改为线性
  • 美团优选小程序 mtgsig 分析 mtgsig1.2
  • C++语法系列之前言
  • 三轴云台之摄像模组篇
  • el-tabs与table样式冲突导致高度失效问题解决(vue2+elementui)
  • Maven插件学习(五)—— 将项目构建生成的 OSGi Bundles(或 Features)发布到一个 P2 仓库
  • Nginx核心
  • VMware Workstation 创建虚拟机并安装 Ubuntu 系统 的详细步骤指南
  • C++后端服务器开发:侵入式与非侵入式程序结构解析
  • 鸿蒙 应用开发 项目资源结构及资源访问
  • AI重构家居营销新范式:DeepSeek如何破解行业流量与转化困局?
  • 大模型优化利器:RLHF之PPO、DPO
  • 深入掌握CSS背景图片:从基础到实战
  • 深入探讨Facebook隐私政策的演变
  • 运维仙途 第2章 日志深渊识异常
  • 【Linux调整FTP端口】
  • 软件分析师-第三遍-章节导图-15
  • 量化交易之数学与统计学基础2.4——线性代数与矩阵运算 | 矩阵分解
  • 数据结构每日一题day14(链表)★★★★★
  • 读论文笔记-LLaVA:Visual Instruction Tuning
  • 中央网信办部署开展“清朗·整治AI技术滥用”专项行动
  • 网络基础-----C语言经典题目(12)
  • ActiveMQ 可靠性保障:消息确认与重发机制(一)
  • [实战] Petalinux驱动开发以及代码框架解读