searchI流
2019-08-28 18:39:16 0 举报
search流
作者其他创作
大纲/内容
Y
排序(垂直tab)1. 播单、节目TopN 基于同主播、同播单打散降权;2. 新鲜度:内容基于发制时间纬度的加权处理;3. 基于节目粒度的文本相关性得分、内容质量得分、搜索反馈得分等的算法排序;
1. 直播配置文件2. 主播名字典
1.\t整体模块排序:播单>声音>主播(不展示直播),top1=播单top1对应主播;2.\t播单模块:n<展示数量<m【n=1、m=5(m、n配置)】;a)\t展示元素:播单封面、标题、播放量、主播名称、播单内节目数量;b)\tTop1 卡片:播单卡片展示;c)\t取播单内两条节目展示;i.\t方式1:用户未收听过该播单,则以顺序展示;用户存在收听该播单记录,则展示播单记录下两条;ii.\t方式2:以发布时间顺序,取播单内最近更新的两条节目;3.\t声音模块:所有声音召回排序,以召回数量为准;a)\t展示元素:节目封面、标题、主播名、时长、播放量、评价量;4.\t去重打散逻辑a)\t同主播相关播单<=2; b)\t如声音模块相关声音∈播单模块top5播单,则将相关声音排序降权;【视具体情况考虑是否不展示】c)\t同一、二级分类下内容打散;【暂不虑】5.\t推荐横向穿插:暂不变;
query意图=直播
query意图:节目
综合排序
query预处理1) 归一化处理;(query&索引一致)i. 大小写、繁简体、拼音转换、错别字-拼音-正确字转换、阿拉伯数据-中方数字、无意义字符删除相关处理;2) 重要性识别i. Query中心词识别;ii. 数量词识别;(例:第一集、第二节、数字序列)iii. 中心词 ∩ 数量词 召回;
query意图:播单
client
QP
query意图:主播>x
召回1. 敏感词过滤处理;2. 播单、节目、主播、直播基于query、内容title文本相关性得分*内容质量得分粗排截断召回;a) 播单:100*n;【召回量<10,基于节目相关性召回其对应播单】b) 直播、主播:50*n;【分别】c) 节目:300*n;3. 播单基于同主播召回数量限制;4. 节目基于同主播、同播单的召回数量限制;
0 条评论
下一页