利用用户行为数据
评测指标:准确率,召回率
基于用户行为的协同过滤
找到和用户兴趣相似的用户集合,推荐用户未产生行为的物品
余弦相似度
倒排表
关于用户相似度的优化
反映和用户兴趣相似的群体兴趣
基于物品的协同过滤
计算物品相似度,生成推荐列表
倒排表
缺点:对用户活跃度敏感
反映用户的历史兴趣,个性化
区别
基于用户行为的是以用户为角度,去搜索和用户行为类似的其他用户集合,然后推荐集合用户产生行为的其他物品
基于物品的是以物品为角度,去搜索对此物品产生行为的其他用户同时对其他物品产生的行为,计算物品相似度,推荐相似度高的物品
隐语义模型LFM
思想:定义隐类,多通过聚类分类
方法:随机梯度下降
适用于TOPN推荐
LFM与上述算法的区别
LFM是学习,上面的更多是统计
LFM较上面的方法复杂
LFM难以生成实时推荐,每一次都要计算所有物品兴趣权重
前者很好解释
基于图的算法
用户和物品之间进行关系连线,度量与用户节点没有连接的节点的关联性
随机游走,物品被游走的概率将收敛
推荐系统冷启动
问题分类
用户冷启动:新用户加入
物品冷启动:新物品加入
系统冷启动:新的系统
尽可能获得更多信息
利用物品内容信息
USERCF将新物品投放给曾今喜欢过与其类似的物品的用户
ItemCF利用物品的相关属性来进行推荐以及判定物品相似度
专家标注
利用用户标签数据
基于标签的推荐系统
评价:准确率,召回率,多样性,覆盖率
统计用户常用标签,统计打过一个标签最多的物品,对用户推荐常用标签物品
问题:标签清理,同义词,停止词
基于图的推荐
用户,物品,标签组成的三元图
利用随机游走策略
解释标签
给用户推荐标签
方便输入,提高质量
基于图的标签推荐