当前位置: 首页 > ops >正文

【论文阅读】PEPNet

目录

  • METHODOLOGY
    • 模型结构
      • Gate Neural Unit(Gate NU)
      • Embedding Personalized Network(EPNet)
      • Parameter Personalized Network(PPNet)
    • 工程优化策略
  • 参考文献

在这里插入图片描述
快手23年kdd的一篇文章,涉及到多场景多任务的预估。看之前同事有在模型中使用这个方法,读论文学习一下。
文章链接:https://arxiv.org/abs/2302.01115

METHODOLOGY

模型结构

在这里插入图片描述
模型主要分为三部分:

  • 门控神经单元 gate Neural Unit
  • 嵌入个性化网络 EPNet
  • 参数个性化网络 PPNet

Gate Neural Unit(Gate NU)

受LHUC而设计的门控神经单元,作为PPNet和EPNet的基本组成单位

  • LHUC:LHUC专注于学习说话者特定的隐藏单元贡献,它通过用个性化的贡献来扩展模型的隐藏层来提高语音识别的准确性。【即不同的说话者会有相应的门控单元,用于放缩dnn的隐藏层,从而提升语音识别准确性】
  • Gate NU:由两层神经网络组成,其中γ设置为2
    在这里插入图片描述在这里插入图片描述
    Gate NU 旨在用不同的个性化语义(比如user id、item id等等)来处理更多先前的信息,以注入模型进行更个性化的建模。

Embedding Personalized Network(EPNet)

  • 输入:domain端的特征,比如domain id,每个域中用户行为和物品曝光的计数等。组合上常规的特征嵌入表示(停止梯度传播的)
  • 输出:经过Gate NU后的结果
    在这里插入图片描述
    得到的结果和 一般特征嵌入表示EEE进行个性化转化,通过做元素乘积的方式。这样实现在不同域中对一般特征的个性化筛选。
    在这里插入图片描述

Parameter Personalized Network(PPNet)

核心思想:修改多任务学习中的DNN参数,建立针对每个用户兴趣的DNN模型。
输入:user、item、作者角度的feature(先验知识)。连接上经过EPNet调整过的特征嵌入表示。
输出:经过Gate NU后的结果
在这里插入图片描述
对于每一个任务的DNN tower,在DNN的每一层输出上都通过element-wise的方式结合PPNet的输出,也就是PPNet会有DNN layer num个(or 层?),来匹配每一层的输出形状,如图中蓝色所示。
在这里插入图片描述

工程优化策略

  • 特征消除策略:设计一个无冲突和记忆效率的全局共享嵌入式表(GSET)。大致思想是这个结构会通过特征得分消除机制,来避免低频feature进入和退出系统,使得特征embedding的空间占有率始终保持一个稳定的阈值范围内。
  • 在线同步策略:两种同步在线模型所需嵌入的策略:1)为每个特征设置数量限制,以防止任何单个特征的嵌入过度同步。2)设置嵌入的过期时间,仅同步到期的嵌入,不同步未达到指定更新频率的嵌入。
  • 离线训练策略:在短视频场景中,嵌入的更新频率高于DNN参数,尤其是ID特征。因此训练时 嵌入层和上层DNN网络采用不同的优化方法和更新策略。

参考文献

  1. https://www.jiqizhixin.com/articles/2021-02-03-6
  2. https://zhuanlan.zhihu.com/p/617478217
  3. https://zhuanlan.zhihu.com/p/4183820183
http://www.xdnf.cn/news/18924.html

相关文章:

  • amis上传组件导入文件接口参数为base64格式的使用示例
  • 计算机三级嵌入式填空题——真题库(22)原题附答案速记
  • 强化学习与注意力机制的AlignSAM框架解析
  • 微算法科技(NASDAQ:MLGO)推出创新型混合区块链共识算法,助力物联网多接入边缘计算
  • [n8n] 工作流数据库管理SQLite | 数据访问层-REST API服务
  • Paimon——官网阅读:Flink 引擎
  • 前端javascript在线生成excel,word模板-通用场景(免费)
  • AbMole小课堂丨详解野百合碱在动物肺动脉高压、急性肺损伤、静脉闭塞肝病造模中的原理及应用
  • Go 语言常用命令使用与总结
  • 微信小程序对接EdgeX Foundry详细指南
  • 云计算学习100天-第31天
  • 从零开始的云计算生活——第五十三天,发愤图强,kubernetes模块之Prometheus和发布
  • 【SpringAI】快速上手,详解项目快速集成主流大模型DeepSeek,ChatGPT
  • 【TEC045-KIT】基于复旦微 FMQL45T900 的全国产化 ARM 开发套件
  • Uniapp中自定义导航栏
  • 如何将iPhone上的隐藏照片传输到电脑
  • Flask测试平台开发实战-第二篇
  • 服务器核心组件:CPU 与 GPU 的核心区别、应用场景、协同工作
  • 麒麟操作系统挂载NAS服务器
  • React中优雅管理CSS变量的最佳实践
  • 【动态规划】子数组、子串问题
  • 保姆级教程 | 在Ubuntu上部署Claude Code Plan Mode全过程
  • 设计模式相关面试题
  • 2025年KBS SCI1区TOP,矩阵差分进化算法+移动网络视觉覆盖无人机轨迹优化,深度解析+性能实测
  • 前端异常监控,性能监控,埋点,怎么做的
  • Android 开发 - 数据共享(数据共享、内容提供者实现、动态权限申请)
  • 深度学习篇---模型参数保存
  • [肥用云计算] Serverless 多环境配置
  • PCM转音频
  • 面试之HashMap