当前位置: 首页 > news >正文

推荐系统学习笔记(十)多目标排序模型

用户-笔记的交互

对于每篇笔记,系统会记录:曝光次数/点击次数/点赞次数/收藏次数/转发次数

计算公式:

点击率 = 点击次数/曝光次数

点赞率 = 点赞次数/点击次数

收藏率 = 收藏次数/点击次数

转发率 = 转发次数/点击次数

排序模型融合这些预估分数做排序。

多目标模型

模型结构

场景特征包括用户所在的时间、地点等,比如候选物品在不同的城市、季节以及节假日影响,用户对其有完全不同的兴趣程度

这里的神经网络模型可以根据任务自行选择。

损失函数:

训练

困难:类别不平衡

例如,点击vs未点击,收藏vs未收藏。显然,负样本的数量要远远多于正样本。常见的解决方案是进行负样本降采样(down-sampling):

1. 保留一小部分负样本,让正负样本数量平衡;
2. 减少了负样本数量,节约计算。

预估值校准

在模型输出各个指标预估值之后,需要先进行预估值校准,才能做后续的排序。主要原因在于:

举个例子:

设正样本、负样本数量为  和

真实点击率:(期望)

对负样本做降采样,抛弃一部分负样本。使用  个负样本, 是采样率。

预估点击率:(期望)

由于负样本变少,预测点击率大于真实点击率。

预估值校准就是希望通过函数调整预估值,使得其能与真实值一致,根据上述两个点击率的等式可得对点击率预估值的校准公式为

推导过程如下:

 

 

 

 

 

 

 

 

 

http://www.xdnf.cn/news/1271827.html

相关文章:

  • 《软件测试与质量控制》实验报告五 功能自动化测试
  • SpringSecurity过滤器链全解析
  • 学习:JS[8]本地存储+正则表达式
  • 心灵笔记:思考三部曲
  • 谷歌搜索 sg_ss 逆向分析
  • 计算机网络:深入了解CIDR地址块如何利用VLSM进行子网划分的过程
  • 算法_python_牛客华为机试笔记_01
  • C++算法练习:单词识别
  • 应急响应复现
  • 传输线模拟经验谈
  • 新手入门:Git 初次配置与 Gitee 仓库操作全指南 —— 从环境搭建到代码推送一步到位
  • 编辑距离-二维动态规划
  • Kotlin初体验
  • git命令详解
  • 百度网盘如何做到下载速度最快?OpenSpeedy绿色安装版下载,开源免费网盘加速
  • react 常用组件库
  • Day37--动态规划--52. 携带研究材料(卡码网),518. 零钱兑换 II,377. 组合总和 Ⅳ,57. 爬楼梯(卡码网)
  • Poetry与UV——现代Python依赖管理的革新者
  • Linux 安装 JDK 8u291 教程(jdk-8u291-linux-x64.tar.gz 解压配置详细步骤)​
  • 深入理解 Gin 框架的路由机制:从基础使用到核心原理
  • 蓝牙技术概览
  • imx6ull-驱动开发篇16——信号量与互斥体
  • 练习uart和摄像头内核驱动开发测试
  • 【Python 高频 API 速学 ⑦ · 完结篇】
  • Netbsd安装使用
  • Vue3的简单学习
  • java练习题:数字位数
  • Python(6) -- 数据容器
  • I2CHAL库接口
  • MCU-基于TC397的启动流程