相关场景类召回
语义表达
深度模型召回序列模型双塔模型混合模型图模型
属性
内容嵌入
倾向性
老年人库
推荐内容倾向性
推荐策略适配
运营内容
点赞
主要的功能是预测和推荐,算法通过行为数据挖掘发现用户的偏好,构建用户需求或画像
内容召回(候选集千万))
阅读
视频
3
粗排(候选集 10000 )
内容试探
内容图谱
内容倾向性
协同召回&社交主题CF文章CF在看CF
试探内容试探兴趣试探
音频
分享
等等
短期精准+泛化+社交
低俗
小视频
评论
模型类召回
文本多分类、主题 topic model ,标签
短视频库
多媒体分析
2
UV+PVUV分享率
特征收取
内容库
内容库分析
搜索
通过内容本身理解内容
话题
内容A/B实验
封面图多维度、人脸识别、标签、、清晰度、色情、敏感信息
通过用户理解内容
自适应+平衡
4
多目标融合
试探类召回
时效
社交类召回
进行内部标签和外部内容标签对齐,完成打标,反馈至下游应用方:用户需求系统、召回策略、排序/混排
用户行为数据来理解内容
知识图谱
检索式召回标签类目地域关注话题
文本分析
新闻
运营
日志分析
推荐内容库
知识
多样性保证
内容标签
推荐内容源各个垂直频道
去重
推荐更多的内容多样性
过滤
保量
接入多家合作方的数据作为内容源,并对数据进行“归一化”操作,包括标签归一化、推荐标签提取、内容投放目标、投放人群倾向等内容理解处理
冷启-》爆款
文本
新内容
内外部关键词信息与词关系
账号等级
内容适合倾向、年龄倾向、地区倾向
深度模型召回
内容投放目标
试探日志爆款内容外部日志分析学习
新内容分发高分享、高点击
精准推荐
内容理解
通过内容理解与内容源构建内容库
推荐目标性识别
小视频库
1
模型算法
试探+多样性
模型粗排
针对内容抽取静态标签
下沉库
用户行为积累的后验数据、统计或模型预估内容的知识性、倾向性、投放目标以及抽象表达
推荐多媒体标签
精排(候选集 1000 )
色情
白名单
产品策略/运营类召回
内容目标
原因:策略过于依赖短期行为,短期内容集中,内容类型收敛,用户行为收敛导致信息茧房出现解决方案:引入泛化与具备试探能力的召回,拓宽用户的兴趣面,减少发信优质内容的周期
基于属性的召回,依赖用户画像与用户需求,
序列表达
推荐文本标签
价值评估
咨询
统一化业务标签适配