本发明专利技术公开了一种基于位置与时间的好友推荐方法,主要解决现有好友推荐方案忽视签到信息中的时间信息和签到位置语义信息导致推荐精度不够高的问题。其实现步骤为:1.建立一个由用户、定位设施、位置服务器构成的通信系统框架;2.用户将位置的经纬度与当前的时间信息发送给社交网络服务器生成签到信息;3.社交网络服务器对存储的大量签到信息进行预处理;4.社交网络服务器计算每个用户对于每个地点类别的词频‑逆文档频率分值;5.社交网络服务器计算用户间的相似度,并选取相似度较高的用户做出好友推荐。本发明专利技术缓解了推荐系统可用数据稀疏性,提高了推荐精确度。可用于基于位置的无线社交网络服务。
【技术实现步骤摘要】
在位置社交网络中基于位置与时间的好友推荐方法
:本专利技术属于无线网络
,涉及无线社交网络的好友推荐,可应用于基于位置的无线社交网络服务。
技术介绍
:基于位置的社交网络帮助用户在线分享他们的实时位置以便于用户可以发现感兴趣的位置并结交朋友。例如,用户可以通过好友分享的位置发现自己感兴趣的地点,或者通过查找与自己分享相似地点的用户来结交新的好友。此外,随着智能手机的普及,其内置的GPS模块可以更加精确的探测用户的位置,使得用户可以更加便利的分享各自的位置。因此,这种签到服务吸引了越来越多的用户。如何使用大量的签到信息为用户进行好友推荐需要得到重视。推荐系统在社交网络和电子商务网站中扮演了重要的角色,在电子商务网站中,现有的推荐系统通常使用用户的购买记录来分析用户的偏好,正如电子商务网站的购买记录,用户在基于位置的社交网络中的签到历史也包含了大量的关于用户偏好的信息。在使用用户的签到信息进行好友推荐时,由于用户通常只会在数据库中的一小部分地点进行签到行为,因此进行好友推荐的可用数据较为稀疏。为了缓解数据稀疏的问题,现有方案分为如下几种:根据签到地点的密度进行分类,将一些地理位置较为接近的签到地点看作同一个签到地点;使用用户好友的签到数据填充到用户的签到数据中。但是,地理位置接近的地点可能代表了用户不同的兴趣爱好,同样,好友的爱好并不能完全代替用户自身的兴趣爱好,这两种行为都在一定程度上降低了好友推荐的精度。在考虑时间信息的推荐系统方面,现有系统多用在电子商务网站与电影推荐网站,通过分析用户长期的购买记录与电影的观看记录分析用户的偏好来进行推荐。相比于长期的趋势,用户的签到行为在一天的具体时间可以提供更多反映用户偏好的信息。而在现有社交网络推荐系统中,只通过分析签到地点的时间属性对签到地点进行了分类,并未对用户签到行为的时间分布进行分析来进行好友推荐,因此推荐的准确率不够理想。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种在位置社交网络中基于位置与时间的好友推荐方法,以提高推荐的准确率。本专利技术通过将拥有相似语义信息的地点归为一类,解决推荐系统中可用数据稀疏的问题,使用词频-逆文档频率平衡热门地点与用户自身的兴趣,同时通过分析用户签到行为随时间的分布规律,对用户的相似度计算进行调整,实现更加准确的好友推荐。其实现方案包括如下:(1)建立一个由用户、定位设施、社交网络服务器构成的通信系统框架,其中:用户,用于通过移动蜂窝网络或WiFi与定位设施和社交网络服务器进行通信;定位设施,用于协同用户GPS模块实现定位;社交网络服务器,用于存储用户的位置信息,并以此为依据向用户进行好友推荐;(2)用户将位置的经纬度与当前的时间信息发送给社交网络服务器,生成签到信息;(3)社交网络服务器对存储的签到信息进行预处理:(3a)针对签到信息中的经纬度,查找服务器的位置语义数据库获取与签到地点对应的语义信息,然后将每个用户的签到信息按其签到地点的语义信息分类统计签到次数;(3b)针对签到信息中的时间信息,在步骤(3a)的基础上,统计每个用户在每个地点类别下的签到行为随时间的分布;(4)根据用户在各地点类别的签到次数,社交网络服务器计算每个用户u对于每个地点类别c的词频-逆文档频率分值TF-IDFu,c;(4a)根据用户u在各地点类别下的签到次数,社交网络服务器计算用户u在每个地点类别c下签到信息的词频分值TFu,c;(4b)根据所有用户在各地点类别下的签到次数,社交网络服务器计算每个地点类别c的逆文档频率分值IDFc;(4c)社交网络服务器将用户u在地点类别c下的词频分值TFu,c与地点类别c的逆文档频率分值IDFc相乘,得到其在该地点类别下的词频-逆文档频率分值TF-IDFu,c=TFu,c×IDFc;(5)社交网络服务器计算用户间的相似度:(5a)使用用户在每个地点类别下签到行为随时间的分布,计算两个用户在相同地点类别下签到分布的相对熵D(P□Q),其中P和Q为两个用户ui和uj在相同地点类别的签到次数随时间的概率分布,然后使用相对熵计算相似度调整因子(5b)针对用户在每一地点类别的词频-逆文档频率分值TF-IDFu,c,使用对应的相似度调整因子调整余弦相似度计算公式,计算两个用户间的相似度cos(ui,uj);(6)社交网络服务器对请求推荐的用户与所有其他用户之间重复上述步骤(3)至步骤(5),得到该用户与其他用户的相似度分值,选取分值最高的n个用户作为推荐结果发送给请求推荐的用户,n为请求推荐的用户所请求的好友推荐数量。本专利技术与现有技术相比具有如下优点:1)本专利技术由于使用了签到地点的语义信息进行分类,在缓解推荐可用数据稀疏性的同时,保持了较高的推荐精度。2)本专利技术由于使用了词频-逆文档频率模型对签到数据进行量化,平衡了热门签到地点与用户自身的偏好。3)本专利技术由于对用户的签到行为随时间的分布进行了分析,并通过计算用户间签到行为随时间分布的差异得到计算用户相似度的调整因子,充分利用了签到信息的地理信息与时间信息,从而保证了较高的推荐准确性。附图说明图1是本专利技术使用的通信系统框架图;图2是本专利技术的实现流程图;图3是本专利技术所用推荐方案与未考虑时间因素的推荐方案的推荐准确率对比图;图4是本专利技术所用推荐方案与未考虑时间因素的推荐方案的推荐召回率对比图。具体实施方案本专利技术的核心思想是在基于位置的社交网络场景下,通过分析用户签到地点的语义信息将签到数据进行分类以缓解可用数据较为稀疏的问题,并综合分析了签到地点的热度,用户个人的偏好以及用户签到行为随时间的分布规律用来对用户进行好友推荐,提高推荐的准确度。参照图2,本专利技术实现步骤如下:步骤1,建立通信系统框架。参照图1,本步骤建立的通信系统包括:用户、定位设施、社交网络服务器,其中用户与定位设施和社交网络服务器均通过移动蜂窝网或WiFi进行双向无线连接;所述用户,包含应用模块、数据库模块和GPS模块三个功能模块;应用模块主要用于生成并发送签到信息给社交网络服务器;GPS模块主要用于向定位设施查询位置信息并向应用模块提供用户的地理位置信息;数据库模块主要用于存储和管理用户签到和好友信息;所述定位设施,主要包含GPS模块,该GPS模块主要用于对用户的位置查询进行响应并返回用户的地理位置信息;所述社交网络服务器,包含应用模块和数据库模块两个功能模块;应用模块主要用于对用户的签到信息进行分析整理并为用户的好友推荐请求返回推荐结果,数据库模块主要用于存储用户的签到数据和签到地点的语义信息。步骤2,采集签到信息。用户借助定位设施获得自身所在的地理位置信息,并将此地理位置信息与当时的时间信息发送给社交网络服务器生成签到信息。步骤3,社交网络服务器对存储的大量签到信息进行预处理。(3a)针对签到信息中的地理位置信息,查找服务器的位置语义数据库获取与签到地点对应的语义信息,然后将每个用户的签到信息按其签到地点的语义信息分类统计签到次数;(3b)针对签到信息中的时间信息,将一天时间分成5个区间,分别为2:00-7:00,7:00-11:00,11:00-17:00,17:00-22:00,22:00-2:00,统计用户u在地点类别c上每一时间区间上的签到次数vis(c,u)和用户本文档来自技高网...
【技术保护点】
一种在位置社交网络中基于位置与时间的好友推荐方法,包括:(1)建立一个由用户、定位设施、社交网络服务器构成的通信系统框架,其中:用户,用于通过移动蜂窝网络或WiFi与定位设施和社交网络服务器进行通信;定位设施,用于协同用户GPS模块实现定位;社交网络服务器,用于存储用户的位置信息,并以此为依据向用户进行好友推荐;(2)用户将位置的经纬度与当前的时间信息发送给社交网络服务器,生成签到信息;(3)社交网络服务器对存储的签到信息进行预处理:(3a)针对签到信息中的经纬度,查找服务器的位置语义数据库获取与签到地点对应的语义信息,然后将每个用户的签到信息按其签到地点的语义信息分类统计签到次数;(3b)针对签到信息中的时间信息,在步骤(3a)的基础上,统计每个用户在每个地点类别下的签到行为随时间的分布;(4)根据用户在各地点类别的签到次数,社交网络服务器计算每个用户u对于每个地点类别c的词频‑逆文档频率分值TF‑IDFu,c;(4a)根据用户u在各地点类别下的签到次数,社交网络服务器计算用户u在每个地点类别c下签到信息的词频分值TFu,c;(4b)根据所有用户在各地点类别下的签到次数,社交网络服务器计算每个地点类别c的逆文档频率分值IDFc;(4c)社交网络服务器将用户u在地点类别c下的词频分值TFu,c与地点类别c的逆文档频率分值IDFc相乘,得到其在该地点类别下的词频‑逆文档频率分值TF‑IDFu,c=TFu,c×IDFc;(5)社交网络服务器计算用户间的相似度:(5a)使用用户在每个地点类别下签到行为随时间的分布,计算两个用户在相同地点类别下签到分布的相对熵D(P□Q),其中P和Q为两个用户ui和uj在相同地点类别的签到次数随时间的概率分布,然后使用相对熵计算相似度调整因子(5b)针对用户在每一地点类别的词频‑逆文档频率分值TF‑IDFu,c,使用对应的相似度调整因子调整余弦相似度计算公式,计算两个用户间的相似度cos(ui,uj);(6)社交网络服务器对请求推荐的用户与所有其他用户之间重复上述步骤(3)至步骤(5),得到该用户与其他用户的相似度分值,选取分值最高的n个用户作为推荐结果发送给请求推荐的用户,n为请求推荐的用户所请求的好友推荐数量。...
【技术特征摘要】
1.一种在位置社交网络中基于位置与时间的好友推荐方法,包括:(1)建立一个由用户、定位设施、社交网络服务器构成的通信系统框架,其中:用户,用于通过移动蜂窝网络或WiFi与定位设施和社交网络服务器进行通信;定位设施,用于协同用户GPS模块实现定位;社交网络服务器,用于存储用户的位置信息,并以此为依据向用户进行好友推荐;(2)用户将位置的经纬度与当前的时间信息发送给社交网络服务器,生成签到信息;(3)社交网络服务器对存储的签到信息进行预处理:(3a)针对签到信息中的经纬度,查找服务器的位置语义数据库获取与签到地点对应的语义信息,然后将每个用户的签到信息按其签到地点的语义信息分类统计签到次数;(3b)针对签到信息中的时间信息,在步骤(3a)的基础上,统计每个用户在每个地点类别下的签到行为随时间的分布;(4)根据用户在各地点类别的签到次数,社交网络服务器计算每个用户u对于每个地点类别c的词频-逆文档频率分值TF-IDFu,c;(4a)根据用户u在各地点类别下的签到次数,社交网络服务器计算用户u在每个地点类别c下签到信息的词频分值TFu,c;(4b)根据所有用户在各地点类别下的签到次数,社交网络服务器计算每个地点类别c的逆文档频率分值IDFc;(4c)社交网络服务器将用户u在地点类别c下的词频分值TFu,c与地点类别c的逆文档频率分值IDFc相乘,得到其在该地点类别下的词频-逆文档频率分值TF-IDFu,c=TFu,c×IDFc;(5)社交网络服务器计算用户间的相似度:(5a)使用用户在每个地点类别下签到行为随时间的分布,计算两个用户在相同地点类别下签到分布的相对熵D(P||Q),其中P和Q为两个用户ui和uj在相同地点类别的签到次数随时间的概率分布,然后使用相对熵计算相似度调整因子(5b)针对用户在每一地点类别的词频-逆文档频率分值TF-IDFu,c,使用对应的相似度调整因子调整余弦相似度计算公式,计算两个用户间的相似度cos(ui,uj);(6)社交网络服务器对请求推荐的用户与所有其他用户之间重复上述步骤(3)至步骤(5),得到该用户与其他用户的相似度分值,选取分值最高的n个用户作为推荐结...
【专利技术属性】
技术研发人员:朱晓妍,黄乙哲,牛帅奇,池浩田,裴庆祺,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。