推荐系统服务端支撑运作流程图
2016-10-10 20:04:13 0 举报
推荐系统分析
作者其他创作
大纲/内容
爬虫数据
执行返回
结论:1.计算相似度如果单独线程实现预分析/预计算,会有很多冗余,开销庞大2.预加载数据源过滤、计算分词权重进行记录,防止重复针对同样数据源进行权重计算(需要明确数据源的身份条件,防止重复添加,方案待讨论)优势:1.将数据源分成独立线程定时爬虫获取数据源,如果单独部署,将大大降低服务器由于高并发所带来的压力,提高了用户的体验效果2.重复利用性比较好,有可拓展性,可维护性的基础劣势:1.相似度计算暂时没想到中意的办法来进行分离,没达到相似度匹配预计算的效果,对用户体验造成一定影响
无兴趣标签
本地数据库
返回数据
start(场景:假定行为参数是岗位分类,匹配相似度API)
true
判定是否有兴趣标签
保存被过滤后的权重词,包含url
有兴趣标签
更改用户标签API
PS:如果数据匹配需要用到多个数据源,此函数可以重复利用
余弦公式计算用户标签权重词和多数据对应的权重词,排序
根据岗位匹配数据返回数据
推荐系统服务端支撑运作流程图
(过滤不具有代表性的词)频率及权重计算
更改用户标签信息
*分类*预加载数据源
false

收藏

收藏
0 条评论
下一页