推荐系统背后链路: 解码小红书冷启动流量算法
2024-02-23 19:57:29 1 举报
AI智能生成
推荐系统背后链路:解码小红书冷启动流量算法
作者其他创作
大纲/内容
推荐<br>系统<br>链路<br>
<font color="#a23735"><b>1 召回:</b></font>⽤多条通道,取回⼏千篇笔记。<br><font color="#a23735"><b>2 粗排:</b></font>⽤⼩规模神经⽹络,给⼏千篇笔记打分,<br>选出分数最⾼的⼏百篇。<br><font color="#a23735"><b>3 精排:</b></font>⽤⼤规模神经⽹络,给⼏百篇笔记打分。<br><font color="#a23735"><b>4 重排:</b></font>做多样性抽样、规则打散、插⼊广告和运营笔记<br>
社区UGC<br>冷启动<br>
什么是社区UGC<br>物品冷启动?<br>
• ⼩红书上⽤户新发布的笔记。<br>• B站上⽤户新上传的视频。<br>• 今⽇头条上作者新发布的⽂章。
为什么要特殊对<br>待新内容?<br>
新内容缺少与⽤户的交互,导致推荐<br>的难度⼤、效果差。
<font color="#a23735"><b>扶持新发布、低曝光的笔记,可以增<br>强作者发布意愿。</b></font>
优化冷启动内容<br>的目标<br>
<font color="#a23735"><b>精准推荐:</b></font>克服冷启的困难,把新内容推荐给合<br>适的⽤户,不引起⽤户反感。
<b><font color="#a23735">激励发布:</font></b>流量向低曝光新内容倾斜,激励作者<br>发布。
<b><font color="#a23735">挖掘⾼潜:</font></b>通过初期⼩流量的试探,找到⾼质量<br>的内容,给与流量倾斜。
内容冷启的<br>评价指标<br>
作者侧指标
<b><font color="#a23735">• 发布渗透率、⼈均发布量反映出作者的发布积极性。<br>• 冷启的重要优化⽬标是促进发布,增⼤内容池。</font></b><br>
发布渗透率 = 当⽇发布⼈数 / ⽇活⼈数
⼈均发布量 = 当⽇发布笔记数 / ⽇活⼈数
用户侧指标
新笔记的消费指标
<font color="#a23735"><b>新笔记的点击率、交互率。</b></font><br>。问题:曝光的基尼系数很⼤。<br>• 少数头部新笔记占据了⼤部分的曝光。<br><br><b><font color="#a23735">交互率:点赞率 评价率 收藏率 阅读完成率 </font></b><br>
分别考察⾼曝光、低曝光新笔记。<br>• ⾼曝光:⽐如>1000次曝光。<br>• 低曝光:⽐如<1000次曝光。
⼤盘消费指标
<b><font color="#a23735">⼤盘的消费时长、⽇活、⽉活。</font></b>
⼤⼒扶持低曝光新笔记会发⽣什么?<br>• 作者侧发布指标变好。<br>• ⽤户侧⼤盘消费指标变差。
内容侧指标
<b><font color="#a23735">⾼热内容占⽐</font></b><br>• ⾼热内容:前 30 天获得 1000+ 次点击。<br>• ⾼热内容占⽐越⾼,说明冷启阶段挖掘优质笔记<br>的能⼒越强。<br>
小红书内容<br>冷启动链路<br>
<b><font color="#a23735">内容信息提取:</font></b>新内容刚上传时,没有用户行为信息,只能通过内容信息进行分发。运用 NLP、CV 和多模态融合技术,提取内容信息,生成相关的话题和内容特征。<br>
<b><font color="#a23735">种子人群圈选和投放:</font></b>利用内容信息定位目标人群,根据内容信息,<br>判断哪些人群对新内容更感兴趣。新内容在种子人群中的投放,<br>借助贝叶斯寻优调整 boost 系数,找到用户指标损失和新内容曝光的最优权衡。<br>
<b><font color="#a23735">基于行为反馈的人群扩散:</font></b>初期分发后,新内容会积累一定的用户反馈。将这些新内容也分发给与反馈用户相似的其他用户。通过 lookalike 模型进行人群扩散,根据与新内容有过交互的用户向量生成新内容向量,并将其作为向量索引。通过定义不同的用户向量和新内容向量的相似度函数,小红书推荐系统 lookalike模型的点击率提高了约 7%。<b><font color="#a23735"><br></font></b><br>
<b><font color="#a23735">模型承接:</font></b>在完成初期的冷启动后,新内容进入正常分发阶段。<br>模型的时效性决定了模型是否能有效处理新内容。通过持续迭代,目前小红书首页推荐的召回、<br>粗排和精排模型的训练都做到了分钟级更新。<br>
内容冷启的<br>召回通道<br>
内容冷启召回<br>依据和难点<br>
⾃带图⽚、⽂字、地点。算法或⼈⼯标注的标签。<br><font color="#a23735"><b>没有⽤户点击、点赞等信息。缺少⽤户交互,<br>导致通用的物品协同模型双塔模型效果不好。</b></font><br>
内容冷启<br>简单的召回通道<br>
<b><font color="#a23735">类⽬召回</font></b><br>• 系统维护类⽬索引:<br>类⽬—笔记列表(按时间倒排)<br>• ⽤类⽬索引做召回:<br>⽤户画像 —类⽬ —笔记列表<br>• 取回笔记列表上前 k 篇笔记(即最新的 k 篇)。<br>
<b><font color="#a23735">关键词召回<br></font></b>• 系统维护关键词索引:<br>关键词—笔记列表(按时间倒排)<br>• 根据⽤户画像上的关键词做召回。<br>
<b><font color="#a23735">类目召回和关键词召回缺点<br></font></b>• 缺点1:只对刚刚发布的新笔记有效。<br>• 取回某类⽬/关键词下最新的 k 篇笔记。<br>• 发布⼏⼩时之后,就再没有机会被召回。<br>• 缺点2:弱个性化,不够精准。<br>
聚类召回
<b><font color="#a23735">• 基本思想:</font></b><br>根据⽤户的点赞、收藏、转发记录,推荐内容<br>相似的笔记。<br><font color="#a23735"><b>• 线下训练:</b></font><br>多模态神经⽹络把图⽂内容映射到向量。<br><font color="#a23735"><b>• 线上服务:</b></font><br>⽤户喜欢的笔记 —特征向量— 最近的Cluster— 新笔记<br>
Look-Alike<br>⼈群扩散召回<br>
<ul><li>点击、点赞、收藏、转发——⽤户对笔记可能感兴趣。</li><li>把有交互的⽤户作为新笔记的种⼦⽤户。</li><li>⽤ look-alike 在相似⽤户中扩散。</li></ul><br>
<span style="font-size:inherit;"> 内容</span><span style="font-size:inherit;">冷启动</span><br><span style="font-size:inherit;"> 流量</span><span style="font-size:inherit;">调控</span><br>
冷启动的优化点<br>
<b><font color="#a23735">优化全链路(包括召回和排序)。</font></b>
流量调控(流量怎么在新物品、⽼物品中分配)。
为什么给新笔记<br>流量倾斜?<br>
<b><font color="#a23735">⽬的1:促进发布,增⼤内容池。</font></b><br>
<div><b><font color="#a23735">⽬的2:挖掘优质笔记</font></b><span style="font-size: inherit;">。</span></div>
新笔记流量<br>调控的发展<br>
1. 在推荐结果中强插新笔记。<br>2. 对新笔记的排序分数做提权(boost)。<br>3. 通过提权,对新笔记做保量。<br>4. 差异化保量。
新笔记<br>提权<br>
<b><font color="#a23735">⽬标:让新笔记有更多机会曝光。<br></font></b><font color="#a23735"><b>单独的召回通道、在排序阶段提权。</b></font><br><b><font color="#a23735">⼲涉粗排、重排环节,给新笔记提权。</font></b><br>
<b><font color="#a23735">优点:</font></b>容易实现,投⼊产出⽐好。<br><font color="#a23735">缺点:</font> 曝光量对提权系数很敏感。 很难精确控制曝光量,<br>容易过度曝光和不充分曝光。<br>
新笔记<br>保量<br>
帮助新笔记在前 24 ⼩时获得 100 次曝光。(数值为举例)<br>在原有提权系数的基础上,乘以额外的提权的系数,<br><br>
<b><font color="#a23735">保量的难点:</font></b><br>好处:分数提升越多,曝光次数越多。<br>坏处:把笔记推荐给不太合适的受众。<br>• 点击率、点赞率等指标会偏低。<br>• 长期会受推荐系统打压,难以成长为热门笔记。<br>
差异化<br>保量<br>
不同笔记有不同保量⽬标,普通笔记<br>保 100 次曝光,内容优质的笔记保 100~500 次曝光。
<ul><li><font color="#a23735"><b>基础保量:</b></font>24 ⼩时 100 次曝光。</li><li><b><font color="#a23735">内容质量:</font></b>⽤模型评价内容质量⾼低,<br>给予额外保量⽬标,上限是加 200 次曝光。</li><li><b><font color="#a23735">作者质量:</font></b>根据作者历史上的笔记质量,<br>给予额外保量⽬标,上限是加 200 次曝光。</li><li><font color="#a23735"><b> ⼀篇笔记最少有 100 次保量,<br>最多有 500 次保量</b></font></li></ul><br>
内容冷启动<br>的AB测试<br>
观察指标
<b><font color="#a23735">作者侧指标:</font></b><br>• 发布渗透率、⼈均发布量。
<b>⽤户侧指标:<br></b>• 对新笔记的点击率、交互率。<br>• ⼤盘指标:消费时长、⽇活、⽉活。
推荐系统的<br>标准A/B测试<br>
用户侧实验
作者侧实验
<font color="#a23735">缺点:新笔记和⽼笔记抢流量<br>设定:新⽼笔记⾃由竞争。</font><br>
缺点:新笔记池减⼩⼀半,对⽤户体验造成负⾯<br>影响。新笔记的两个桶不抢流量,新笔记和⽼笔记抢流量,
缺点:不抢流量,但影响消费体验
各种AB测试的<br>⽅案都有缺陷。<br>
设计⽅案的时候,问⾃⼰⼏个问题:<br>• 实验组、对照组新笔记会不会抢流量?<br>• 新笔记、⽼笔记怎么抢流量?<br>• 同时隔离笔记、⽤户,会不会让内容池变⼩?<br>• 如果对新笔记做保量,会发⽣什么?
学习资料
B站 小红书推荐算法工程师 王树森<br> 《推荐系统公开课——8小时完整版,讲解工业界真实的推荐系统》<br>
小红书技术REDtech 《爆款背后的机制:解码小红书流量算法》
0 条评论
下一页