当前位置：首页 > news >正文

RecSys:多目标模型和MMOE

news 2025/8/17 18:51:28

排序01：多目标排序模型

模型结构

该模型将以下特征作为输入，输出多个指标的预估结果：

系统对每篇笔记记录以下行为数据：
- 曝光次数（Number of impressions）
- 点击次数（Number of clicks）
- 点赞次数（Number of likes）
- 收藏次数（Number of collects）
- 转发次数（Number of shares）

基于这些数据计算以下指标：

指标名称	计算公式	说明
点击率（CTR）	点击次数/曝光次数	基础转化指标
点赞率	点赞次数/点击次数	需有点击才会产生
收藏率	收藏次数/点击次数	深度互动指标
转发率	转发次数/点击次数	重要扩散指标（能为平台带来新流量）

排序机制：

模型同时预估点击率、点赞率、收藏率、转发率等多个分数
通过加权融合这些分数（权重通过A/B测试调优）
根据融合分数进行排序和截断

模型架构和输入：

用户特征：用户ID和用户画像
物品特征：物品ID、物品画像（包括作者信息）
统计特征：
- 用户统计：过去30天的曝光量、点击量、点赞量等
- 物品统计：过去30天的曝光量、点击量、点赞量等
场景特征：
- 时间特征（是否节假日等）
- 地理位置特征（用户与物品的地理关联性）

在这里插入图片描述

模型训练

损失函数设计：

单个指标使用交叉熵损失,总指标使用加权和
$CrossEntropyLoss = - (y(\log p_i) + (1 - y)\log(1 - p_i)$
总的损失： $∑i=14αiCrossEntropyLoss(yi,pi)\sum_{i =1}^4 \alpha_i CrossEntropyLoss(y_i,p_i)$
对损失函数求梯度，做梯度下降更新参数

在这里插入图片描述

关键问题：降采样与校准

问题背景：

正负样本严重不平衡（典型比例）：
- 点击率：10次点击 vs 90次无点击
- 收藏率：10次收藏 vs 90次无收藏

解决方案：

负采样降采样（Down-sampling）
- 保留部分负样本（如从90个负样本中保留10个）
- 使正负样本数量平衡
- 显著减少计算量
预估值校准
- 定义：
  - 真实点击率： $Ptrue=n+n++n−P_{true} = \frac{n_+}{n_+ + n_-}$
  - 采样后预估点击率： $Ppred=n+n++αn−P_{pred} = \frac{n_+}{n_+ + \alpha n_-}$ （ $α\alpha$ 为采样率）
- 校准公式：
  $Ptrue=α⋅Ppred(1−Ppred)+α⋅PpredP_{true} = \frac{\alpha \cdot P_{pred}}{(1-P_{pred}) + \alpha \cdot P_{pred}}$
- 实际应用：
  - 模型输出原始预估点击率
  - 通过校准公式调整后用于排序

排序02：MMOE模型（Multi-gate Mixture-of-Experts）

模型特点：

多目标排序框架
使用多个独立专家网络（参数不共享）
通过门控机制动态组合专家特征

核心架构：

专家层（Experts）：多个独立的神经网络
门控网络（Gates）：
- 每个任务对应一个门控网络
- 通过softmax生成专家权重
任务塔（Towers）：每个任务有独立的输出层

极化问题（Polarization）：

现象：门控网络可能过度依赖少数专家（如权重变为[0,0,1]）
解决方案：
- 对softmax输出应用dropout（10%丢弃率）
- 强制每个任务利用多个专家特征
- 提升模型鲁棒性

在这里插入图片描述

应用建议：

MMOE不一定在所有场景都有效
需要根据业务特点进行调整
可参考YouTube的改进方案

参考文献：

He X, et al. Practical lessons from predicting clicks on ads at Facebook. In: The 8th International Workshop on Data Mining for Online Advertising.
Ma J, et al. Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts. In: KDD 2018.
Zhao Z, et al. Recommending What Video to Watch Next: A Multitask Ranking System. In: RecSys 2019.
王树森推荐系统公开课

http://www.xdnf.cn/news/1313767.html

相关文章：

Oracle数据库文件管理与空间问题解决指南

GaussDB 数据库架构师修炼(十三)安全管理(3)-行级访问控制

测试18种RAG技术，找出最优方案(四)

用Pygame开发桌面小游戏：从入门到发布

衡石使用指南嵌入式场景实践之仪表盘嵌入

【FreeRTOS】队列集

聊聊智慧这个东西之三：从食物的毒性、偏性聊起

布隆过滤器的原理及使用

ubuntu网络共享

银行间交易IMIX协议加密相关

JetPack系列教程（八）：PDF库——让Android应用也能优雅“翻页”

androidstudio内存大小配置

《从混乱到有序：AI 如何一步步梳理数据质量难题》文章提纲

LIN-TestWait函数解析

【Html网页模板】赛博朋克数据分析大屏网页

【开发技巧】VS2022+QT5+OpenCV4.10开发环境搭建QT Creator

如何解决pip安装报错ModuleNotFoundError: No module named ‘opencv-python’问题

从希格斯玻色子到 QPU：C++ 的跨维度征服

电路方案分析（二十二）适用于音频应用的25-50W反激电源方案

从频繁告警到平稳发布：服务冷启动 CPU 风暴优化实践01

Centos7.9安装Dante

深度解析Java synchronized关键字及其底层实现原理

《WINDOWS 环境下32位汇编语言程序设计》第2章准备编程环境

深入剖析 TOTP 算法：基于时间的一次性密码生成机制

IOMMU多级页表查找的验证

【计算机网络架构】混合型架构简介

39.离散化与哈希

模型训练监控：TensorBoard与Weights Biases (WB) 使用详解