A
历史点击提权
最高得分是否大于截断阈值
Titleterms
Feed news
共现关系的挖掘
多样性排序
质量评估
BOW
梧桐山
百度公司
Max
……
当前已排序打压
No
百科数据
currentattention
next nattention
Dot
用户兴趣挖掘
正向跳转关系的计算
SCORE
Bandits
目的地必玩景点天数舒适程度主题偏好…
关注点A
…
需求图谱(关注点相似度的计算)
BOW模型训练
第2次刷新
next 1attention
创新应用(行程规划)
Attention termsembedding
C
依照规则的打散策略
相关性
第n次刷新
基础排序及过滤
多样性排序及过滤
=
RNN语言模型线路生成
序列的生成
max
生成线路
需求图谱(NN)
ctr预估
负向跳转关系的计算
时效性
Softmax
出轨
行程生成
B
Feed流日志
监督学习
横向多样性
last 1attention
多样性
D
SUM
关注点触发
展现有点击
Softsign
Tag/Domainembedding
已排序集合
what is next?
SubmodularRandom walk
排序策略
关注点召回策略
度秘&对话
last 2attention
分发数点展比平均用户时长……
Last Clicked Attention's terms
大搜数据
128
点击提权
用户画像
sim:0.7
多样性计算模型(Submodular)
α
大规模CPU计算平台
目的地线路库的建设
对用户选定POI进行行程的规划
内容
马蓉
新闻召回
优化目标
离线模型训练(LR)
多样性排序策略
End
相关性排序
用户相关性的计算
(一元组)单景点特征:热度、评分、主题、耗时
汽车
Cosine
RNN语言模型训练
应用
选择gain最大的新闻加入到已排序集合
语音播报
序列评估
线路评估模型
为用户推荐个性化的旅游线路
行程规划
1宋哲
生成式算法
大规模GPU计算平台
DU-UI
线路候选集合
根据当前已选集合,重新计算候选document的user_doc_weight
兴趣表示
手百Feed流
Embedding
行程推荐
β
sim:1
long-term reward
大梅沙
陈思成
Aries
Ⅰ期
哪种切分更优?
世界之窗
ctr预估模型
FC
杨幂
增强学习
next 2attention
贪心算法Ant-QRL
实体队列
模型
跳转关系的挖掘
Q-learning/TD
用户: 推荐一个深圳2天休闲亲子游的行程 小助手: 第一天,动物园-西丽水库;第二天,世界之窗
需求图谱
关联图谱
Inverse RL
Q-value 欢乐谷
主题/封面/路程/交通/耗时
增强学习负责Forward looking
哪个线路更优?
上下文
人工智能
启发式搜索算法
启发式/增强式线路生成
Diversity Bandits
上下文模型
从候选集中选出得分最高的doc
category召回及初排
title封面图片线路图交通…
上下文模型负责Backward looking
锦绣中华
(二元组)相邻特征:距离、是否互斥、交通
根据多样性重排
CTR预估
Yes
评估模型
线路生成策略
图谱
新增doc所包含的attention
阿法狗
基础数据
佟丽娅
Δcount:0.7宋哲
类别队列
DQA
推荐策略
关注点C
先验信息
线路库的建设质量评估多样性评估
last nattention
对用户半定制的行程自动生成
Feed数据
Backward looking
启发式:tabu-search、遗传算法、beam-search
0.8马蓉
内容召回策略
把得分最高的doc加入推荐队列
计算所有候选新闻的gain
DU-US
阿拉丁
第1次刷新
增强式:Ant-Q、增强学习(调研中)
DPP排序质量评估多样性评估
排序结束
序列优化(TSP)
DU-DA
Words segmentation
序列(MDP)优化
效果优化
sim:0.6
王宝强
多样性评估
展现打压
数据
1
Deep RL
Ⅱ期
UIAPI
美女
用户偏好
Sigmoid
关注点B
RNN语言模型
展现生成
糯米数据
1王宝强
多样性(Submodular Function)
结果输出
用户: 我想去海上世界、世界之窗、青青世界该怎么安排行程? 小助手: 第一天,海上世界-青青世界; 第二天,世界之窗
展现不点击
行程规划应用场景
目标景点集合输入
FEED序列的整体优化
SKG
多队列merge策略
迭代优化
高级特征生成
sim:0.8
时效性、ctr
知识图谱
CF召回
纵向多样性
Reinforcement learning
Q-value华侨城
Extractattention
通用引导
线路数据
Q-value大梅沙
候选线路
计算所有document的ctr及attenuation
tag召回及初排
真正男子汉
优化
nlp队列
专家系统
人工打分
Δcount:1王宝强
Network
初始状态
计算平台
Tabu-searchBeam-search遗传算法
游记挖掘
替换
Explore & Exploit
个性化分发策略
DPP排序
图谱的计算
达到推荐队列的上限?
为用户推荐优质的城市旅游线路
序列优化
Current Clicked Attention's terms
为用户推荐经典的城市旅游线路
用户: 深圳旅游线路 小助手: 线路1,世界之窗-欢乐谷; 线路2:东部华侨城-大小梅沙 ……
用户
多样性计算模型
是否已达集合上限
DeepQ-network
线路挖掘及生成
attention召回及初排
(set-wise)整体特征:主题分布、舒适度、总距离
计算候选doc的最终得分:score = ctr * sqrt(user_doc_weight) * attenuation
Context Bandits
Ariesgeneral
品牌专区
1: co-occurrence attentions0: negative sampling
Forward looking
Δcount:1马蓉
历史展现打压
用户偏好输入
用户需求输入
关注点提取
Delayreward
根据路质量排序
刘恺威