LLM4rec-rednote
小红书有几亿用户、每天新增海量图文/视频笔记。怎么才能让每个用户刷到的内容既“懂我”(符合兴趣)又“惊喜我”(发现新东西),同时还要保证小创作者也有曝光?传统推荐方法有点力不从心了。
解决方案:
引入大语言模型(LLM,如GPT这类“超级大脑”) 和多模态理解(能同时看懂文字和图片/视频),给推荐系统装上“智慧引擎”,让它变得更聪明!
关键:
- 传统推荐的“短板”:为啥不够用?
- “看不懂”内容精髓: 传统模型主要看标签(比如“美妆”、“旅行”)和用户历史行为(你点过啥赞)。它很难真正理解一篇笔记里文字的情感和图片的意境(比如“氛围感穿搭”具体是啥感觉?)。
- “猜不透”用户心思: 只能根据你过去的行为推荐相似的(你看过猫视频就使劲推猫)。它很难推理你潜在的、没表达出来的兴趣(比如你看猫,可能也会喜欢萌宠漫画?)。
- “冷落”新笔记/新用户: 新笔记没人互动,系统不知道推给谁(冷启动问题);新用户没行为记录,系统一脸懵(“猜你喜欢”猜不准)。
- “困住”用户在信息茧房: 一直推你已知爱看的,你很难发现新领域(比如从美妆跨界到露营?)。
-
小红书怎么用大模型(LLM)升级推荐?
-
升级1:让系统“真懂”内容(多模态内容理解)
- 怎么懂? 训练强大的多模态模型(如
SigLip
),它能同时分析:- 文字: 理解笔记标题、正文在说什么(语义、情感)。
- 图片/视频: 识别画面里的物体、场景、风格(比如一张照片是“法式慵懒风”还是“日系清新”?)。
- 好处:
- 对笔记的理解更精准、更深入,不再只看表面标签。
- 能抓住内容的核心价值和氛围感,匹配更合适的用户。
- 解决新笔记冷启动: 新笔记一发布,系统就能通过“看图看字”理解它是什么,结合话题/标签圈选,快速找到种子用户(最可能感兴趣的人)推送。效果好再通过
Lookalike
技术扩散给相似兴趣人群。
- 怎么懂? 训练强大的多模态模型(如
-
升级2:让系统“会猜”用户心思(用户兴趣推理)
- 怎么猜? 用自研的
tomato-7B
大模型(类似一个推理能力超强的分析师):- 输入: 你的基本信息(年龄、性别、城市)+ 已知兴趣(历史点赞/收藏的话题、类目)。
- 输出: 潜在兴趣点 + 推理过程 + 置信度(有多大把握)。
- 例子: 系统知道你:
- 25岁,女,上海
- 长期爱看“阅读”、“搞笑视频”,最近迷上“漫画”
- 模型推理:
- 可能对“新书推荐”感兴趣(因为爱阅读)。
- 可能对“搞笑漫画”感兴趣(因为爱漫画+爱搞笑)。
- 可能对“美妆技巧”感兴趣(25岁女性普遍兴趣)。
- 好处:
- 突破信息茧房: 主动推荐你可能感兴趣但从未接触过的内容(如推理出的“美妆技巧”、“露营”)。
- 丰富推荐多样性: 不再只依赖历史行为,加入推理出的新兴趣点。
- 怎么猜? 用自研的
-
升级3:让系统“更会互动”(互动目标建模与优化)
- 超长序列建模: 记住你很久以前喜欢过什么(比如半年前收藏的旅行攻略),让推荐更有“历史底蕴”。
- 实时行为捕捉: 你刚刚点赞/收藏/划走某个笔记?系统秒级感知!5分钟内就能调整后续推荐(比如你连点3个露营视频,马上多推点)。
- 多目标平衡: 用复杂模型(如多目标CGC模型)同时优化多个目标:不仅要你点(CTR),还要你看久(时长)、评论、收藏… 避免只顾点击率推“标题党”。
- 强化学习(RL): 像训练游戏AI一样训练推荐系统!有个“RL Agent”观察你的实时状态(兴趣、情绪?),决定:
- 现在推这个露营笔记,用户大概率会喜欢(点击/互动)吗?
- 如果推了且你真互动了,下次加大力度推类似内容。
- 如果推了你没反应,说明可能推错了,减少试探或换个方向。
- 目标是最大化你长期的满意度和互动总量。
-
- 小红书推荐的独特“价值观”
- 平权分发: 50%以上流量给千粉以下小创作者! 不让大V垄断流量。大模型理解内容价值的能力,让小众优质笔记也能被发现(不再只靠粉丝量)。
- 圈层与社交: 用图模型分析“内容-用户-作者”关系,形成兴趣“圈层”。让你更容易发现同好(比如喜欢同一小众穿搭风格的人),促进社区互动。
- 整体效果:更智能、更人性化的推荐
- 对你:
- 推荐内容更懂你心意(甚至猜到你自己都没意识到的兴趣)。
- 惊喜感更强,能发现更多有趣的新领域。
- 刷到的内容质量更高、更对口。
- 对创作者:
- 新手有机会!优质内容即使粉丝少也能被系统“慧眼识珠”。
- 内容匹配更精准,更容易找到目标受众。
- 对平台:
- 用户停留时间更长、互动更多,平台更活跃。
- 社区氛围更好(内容多样、创作者生态健康)。
- 对你:
小红书给推荐系统装上了“大模型大脑”和“多模态眼睛”,让它能真正看懂笔记内涵、猜透你潜在心思、实时调整策略。结果就是你刷到的内容更懂你、更有趣、更惊喜,新手创作者也更有机会被看见,彻底告别“信息茧房”和“流量垄断”!