推荐系统学习笔记(八)其他召回通道
本节介绍几个有用但重要性不高的召回通道
1. 几种简单召回通道
召回通道 | 原理 | 索引 | 召回 |
GeoHash召回 | 用户可能对附近的事感兴趣,对用户的经纬度的编码 | GeoHash→优质笔记列表(按时间倒排) | 无个性化召回(所以选择推荐优质笔记) |
同城召回 | 用户可能对同城的事感兴趣 | 城市→优质笔记列表(按时间倒排) | 无个性化召回 |
作者召回 | 用户可能对关注的作者发布的笔记感兴趣 | 用户→关注的作者 作者→发布的笔记(按时间倒排) | 用户→关注的作者→最新的笔记 |
有交互的作者召回 | 用户对某篇笔记感兴趣,对该作者的其他笔记也可能感兴趣 | 用户→有交互的作者(按时间倒排) | 用户→有交互的作者→最新的笔记 |
相似作者召回 | 如果用户喜欢某作者,那么用户喜欢相似的作者(类似ItemCF) | 作者→相似作者(k个)(按时间倒排) | 用户→感兴趣的作者(n)→相似作者(nk)→最新的笔记(nk) |
2. 缓存召回
💭核心思想:复用前n次推荐精排的结果
背景:精排的结果有一大半未曝光,被浪费
操作:精排前50,但是未曝光的,缓存起来,作为一条召回通道
⚠️ 缓存大小固定,需要退场机制
- 一旦笔记成功曝光,就从缓存退场;
- 如果超过缓存大小,就移除最先进入缓存的笔记;
- 笔记最多被召回若干次,达到这个次数就退场;
- 每篇笔记最多保存若干天,达到这个天数就退场;
- 想让低曝光笔记缓存更长时间,基于曝光次数设置退场规则。