欢迎来到专业的无忧考公务员网!

注册登陆 我要投稿
当前位置:无忧考公务员网>资讯快报 >

在推荐系统中利用时间因素的方法

日期:2018-07-18 10:35:45 浏览次数:
http://img1.qikan.com.cn/qkimages/jisy/jisy201505/jisy20150526-1-l.jpghttp://img1.qikan.com.cn/qkimages/jisy/jisy201505/jisy20150526-2-l.jpghttp://img1.qikan.com.cn/qkimages/jisy/jisy201505/jisy20150526-3-l.jpghttp://img1.qikan.com.cn/qkimages/jisy/jisy201505/jisy20150526-4-l.jpghttp://img1.qikan.com.cn/qkimages/jisy/jisy201505/jisy20150526-5-l.jpg
  摘要:针对传统推荐算法忽略时间因素的问题,根据个体用户短期行为的相似性,利用时间衰减函数计算项目间相关关系,提出基于用户兴趣的项目关联度; 将其用于项目相似度的计算,提出基于用户兴趣的项目相似度; 同时基于项目关联度对ItemRank算法进行改进,提出一种结合时间因素的TItemRank算法。实验结果表明, 利用项目关联度对推荐算法进行改进时,在推荐项目数较少的情况下能够明显地改善推荐效果。特别地,在推荐项目数为20时,基于用户兴趣的项目相似度相比余弦相似度和Jaccard相似度,推荐准确率分别提高了21.9%、6.7%; 在推荐项目数为5时,TItemRank算法相比ItemRank算法推荐准确率提高2.9%。
  关键词:协同过滤;项目关联度;项目相似度;兴趣衰减;ItemRank;图模型;艾宾浩斯曲线
  中图分类号: TP182 文献标志码:A
  Abstract: Concerning the problem that traditional recommendation algorithm ignores the time factors, according to the similarity of individuals’ shortterm behavior, a calculation method of item correlation by using time decay function based on users’ interest was proposed. And based on this method, a new item similarity was proposed. At the same time, the TItemRank algorithm was proposed which is an improved ItemRank algorithm by combining with the user interestbased item correlation. The experimental results show that: the improved algorithms have better recommendation effects than classical ones when the recommendation list is small. Especially, when the recommendation list has 20 items, the precision of user interestbased item similarity is 21.9% higher than Cosin similarity and 6.7% higher than Jaccard similarity. Meanwhile, when the recommendation list has 5 items, the precision of TItemRank is 2.9% higher than ItemRank.
  Key words: collaborative filtering;item correlation;item similarity;interest in attenuation;ItemRank;graph model;Ebbinghaus curve
  0 引言
  个性化推荐技术作为一种新型的内容提供方式,已被广泛地应用(本文来自:Www.bdfqY.cOm 千 叶帆文 摘:在推荐系统中利用时间因素的方法)于电子商务[1]、社交网站(Social Networking Site, SNS)[2]、网络流媒体[3]等,有效地解决了大数据环境下,用户如何从海量数据中获取信息这一难题。协同过滤技术[4]是当前应用最广泛、效果最好的推荐算法之一。其推荐方式完全独立于具体的数据内容,不管是新闻、电影,还是音乐,都能够进行推荐, 因此得到了广泛的关注和研究。同时,随着搜索引擎技术的发展,基于图论的网页排名算法(PageRank)[5] 得到了广泛的研究,近年来,PageRank算法也被应用于推荐领域[6]并取得了较好的效果。
  当前的推荐算法研究[2-3,7-9],通常采用对时间因素进行加权处理的方式,来提高推荐的准确率。邢春晓等[7]从用户兴趣随时间衰减的角度考虑,提出基于时间的数据权重和基于资源相似度的数据权重,得到了一种适应用户兴趣变化的协同过滤算法;郑先荣等[8]通过对历史评分数据进行线性衰减,来反映用户兴趣的变化过程,利用用户的短期兴趣特征来改善传统算法的推荐效果。
  由于用户阶段兴趣的影响,导致用户短期内交互的项目之间具有一定的相关性[10]。上述算法都没有利用这一特点来捕获项目间的关联关系。本文从用户个人兴趣的角度,计算用户对项目间关联关系的定量评价。引入衰减函数表示用户短期兴趣的变化,反映项目之间不同的相关性,进而得到基于用户兴趣的项目关联度(User Interest based item Correlation, UIC),并基于此提出了基于用户兴趣的项目相似度(User Interest based item Similarity, UIS)和融合时间因素的ItemRank(Time ItemRank, TItemRank)算法。
  1 相关工作
  1.1 基于项目的协同过滤算法
  协同过滤算法根据用户的历史评分数据进行推荐,分为基于用户相似度的协同过滤(User Based Collaborative Filtering, User_CF)和基于项目相似度的协同过滤(Item Based Collaborative Filtering, Item_CF) [4]。Item_CF算法在可扩展性、实时性等方面要优于User_CF算法[1]。Item_CF算法根据用户对项目的评分数据,获取项目之间的相似度模型。然后,根据用户已有的评分记录和相似度模型来预测用户对未知项目的偏好评分。相似度模型是决定算法推荐效果好坏的关键,传统的相似度度量方法有余弦相似度(Cosin Similarity,Cosin)、Jaccard相似度(Jaccard Similarity,Jaccard)等。

声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。

Copyright©2024无忧考公务员网 www.51kaogwy.cn 版权所有