新闻推荐
2015-10-25 22:30:58 27 举报
AI智能生成
推荐您阅读今日的新闻头条,其中包含了全球各地的重要事件和热点话题。首先,国际政治方面,美国总统在联合国大会上发表重要讲话,强调国际合作的重要性。其次,科技领域,一家名为”未来科技”的初创公司发布了一款具有革命性的人工智能产品,预计将对各行各业产生深远影响。此外,体育界也传来喜讯,中国女排在世界锦标赛中勇夺冠军,再次展现了中国体育健儿的顽强拼搏精神。最后,娱乐圈也有新鲜事,著名歌手张杰即将举办他的世界巡回演唱会首站,引发了粉丝们的热烈期待。以上就是今天的新闻推荐,希望您喜欢并从中获取有价值的信息。
作者其他创作
大纲/内容
技术框架
分词
MMSeg4j
IKAnalyzer
paoding
Ansj
python:jieba
hadoop
Map/reduce
hive
mahout
spark
RDD计算
Storm
流式计算
用户
用户(设备ID)
用户国家、地区、经纬度
用户性别
用户年龄、生日
用户爱好
用户设备型号、分辨率、语言
隐藏:用户关系
隐藏:用户关注
新闻
点击、展示次数
新闻访问浏览时长
新闻专题关注度
新闻分类
点击次数
添加、编辑、拖动、顺序
活跃度、新闻浏览次数
欢迎页首次进入分类
评论、点赞、分享、点踩、
新闻内容长度、图片
活跃用户
facebook登陆次数
两天留存的浏览新闻分类次数
评论、分析、举报、反馈、点赞、点踩、分享的次数
平均访问时长
新闻浏览活跃度
新闻推荐流程
1.新闻内容的长度、图片判别
2.新闻的标签库建立
3.用户人群的划分
4.新闻内容的切词
5.计算新闻内容切词后的权重,选出代表关键词
6.离线计算模型,基于用户浏览过的新闻,对新闻内容切词、计算权重得出相应的历史关键词,搜索对应的新闻标签库的标签,根据权重排序
7.离线计算模型,基于用户未浏览过的新闻中找出相似度高的用户浏览过的新闻,对新闻内容切词、计算权重得出相应的历史关键词,搜索对应的新闻标签库的标签,根据权重排序
8.实时计算模型,暂定;初步设想,用户当前浏览的新闻,切词后搜索标签库推相关新闻
涉及算法
TF.IDF
计算检索文档中的关键特征词语
定义:度量给定词语在少数稳定中反复出现成都的形式化指标为:TF.IDF
Jaccard/K-Shingling
新闻标签、用户标签计算相似度
定义:两集合的交际和并集大小之间的比率
mahout
基于用户推荐
基于内容推荐
搜索算法
多语言
分词
检索
新闻
新闻
新闻点击、展示数
新闻浏览时长
点赞、评论、分享
新闻内容长度、图片数
新闻分类
添加次数、拖动排序、删除次数
点击、展示次数
浏览时长
0 条评论
下一页