System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及大数据和计算机科学,尤其涉及一种基于双边画像的旅游景点推荐方法及系统。
技术介绍
1、在当前的旅游市场中,随着互联网技术的快速发展和普及,人们对旅游信息的获取方式发生了根本性变化。旅游者不再仅依赖传统的旅行社或旅游手册来规划他们的旅行,而是越来越多地转向在线平台和社交媒体来寻找旅游灵感和建议。在这种趋势下产生了了大量关于旅游景点的描述性文本和用户生成的内容,如评论和评分,这些都是了解景点特性和旅游者偏好的宝贵资源。
2、然而,面对庞大而复杂的数据,如何有效地从中提取有用信息,并根据这些信息为旅游者提供个性化的景点推荐,成为了旅游推荐平台所面临的挑战。传统的推荐系统往往侧重于用户的历史行为和显式评分,而忽视了文本内容中蕴含的丰富信息。此外,这些系统通常不考虑景点本身的特性,从而限制了推荐的准确性和个性化程度,造成推荐信息类型趋向单一。
技术实现思路
1、鉴于上述现有存在的问题,提出了本专利技术。
2、因此,本专利技术提供了一种基于双边画像的旅游景点推荐方法及系统解决在大数据景点推荐算法中容易忽视文本内容信息,不考虑景点本身的特性,从而限制了推荐的准确性和个性化程度,造成推荐信息类型趋向单一,不具有可扩展性和自适应性的问题。
3、为解决上述技术问题,本专利技术提供如下技术方案:
4、第一方面,本专利技术提供了一种基于双边画像的旅游景点推荐方法,包括:
5、获取景点信息,依据景点信息挖掘景点特征标签,以得到景点画像
6、获取用户信息,依据用户信息建立用户兴趣标签和基本信息标签,以得到用户画像;
7、对相似用户进行聚类,所述聚类通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,获取目标用户群体的景点选择偏好集合;
8、通过景点画像与目标用户画像的匹配程度,获取用户对于各景点的偏好值,所述偏好值作为所述景点选择偏好集合的排列依据。
9、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:所述景点信息包括景点描述信息以及景点相关评论;
10、所述依据景点信息挖掘景点特征标签,以得到景点画像包括:
11、通过etm主题挖掘模型对景点描述信息和景点相关评论进行主题挖掘;
12、通过主题连贯性指标确定所挖掘的主题质量,并人工审核主题含义;
13、确定主题特征词作为景点特征标签,得到景点画像。
14、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:所述景点特征标签还包括通过所述主题特征词计算得到的对应景点特征标签的吸引力分数,表示为:
15、
16、其中,si为某个景点,fi为某个景点特征标签,rk为景点的某个相关评论语句,r为评论语句的集合,lab_scosi,fi表示景点si在景点特征标签fi上的吸引力分数,revfi表示涉及景点特征标签fi的评论语句的集合,emo_socfi,rk表示景点相关评论rk所带有的情感分数。
17、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:所述用户信息包括:基本信息、出游历史、用户评论;
18、所述用户兴趣标签包括:兴趣特征词及其对应的兴趣权重;
19、所述兴趣权重通过用户前往的景点所包含的特征标签、用户评论中涉及到的主题以及分配给该主题的情感分数emoj计算得到,表示为:
20、
21、其中,ui为某个用户,pi为某个兴趣标签,wui,pi为经过本次更新后的权重,w′ui,pi为用户ui的标签pi本次计算前的权重,tui,pi为用户ui的标签pi在上次计算时间到本次的时间间隔,s为常数,δwui,pi为用户ui的标签pi在本次交互的基本权重变化值,emopi为评论中对标签pi的情感分数,lab_scopi表示景点的特征标签pi的吸引力分数,rev_th表示用户评论涉及到的景点特征集合,[pi∈rev_th]的值当标签pi属于rev_th时为1,标签pi不属于rev_th时为0。
22、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:对相似的用户进行聚类,包括:
23、计算用户相似度,所述用户相似度通过选取用户兴趣标签与基本信息标签结合作为用户相似度,表示为:
24、
25、其中,s为基本信息标签集合,i为兴趣标签集合,xi和yi分别为用户x和y的某个分量,和为x和y的样本均值,a和b为比例系数。
26、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:所述通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,得到目标用户群体的选择偏好,包括:
27、采用切比雪夫映射选定多组初始用户聚类的中心,每组用户中心代表一个聚类方案,作为一个可行解;
28、对所有用户聚类中心组应用反向学习,生成新的用户聚类中心组加入所述可行解;
29、计算每个用户聚类中心组的适应度,将最高适应度的可行解作为雄性金豺,排序第二的可行解作为雌性金豺;
30、对雌雄金豺应用柯西变异和高斯变异;
31、计算猎物的逃脱能量e,若|e|≥1,则执行金豺个体侵扰猎物,更新所有可行解,并跳转至对所有用户聚类中心组应用反向学习,生成新的用户聚类中心组加入可行解的步骤,继续执行后续步骤;
32、若|e|<1,则执行金豺个体捕食猎物,更新所有可行解,若满足结束条件,输出适应度最高的可行解,否则重新计算每个可行解的适应度并执行后续步骤。
33、作为本专利技术所述的基于双边画像的旅游景点推荐方法的一种优选方案,其中:所述用户对于各景点的偏好值,表示为:
34、pref=∑pi∈i(wpi×label_scopi)
35、其中,wpi为兴趣标签pi的权重值,label_scopi为景点特征标签中与用户兴趣标签pi对应的特征标签所拥有的吸引力分数。
36、第二方面,本专利技术提供了一种基于双边画像的旅游景点推荐系统,包括:
37、第一标签构建模块,用于获取景点信息,依据景点信息挖掘景点特征标签,以得到景点画像;
38、第二标签构建模块,用于获取用户信息,依据用户信息建立用户兴趣标签和基本信息标签,以得到用户画像;
39、聚类模块,用于对相似用户进行聚类,所述聚类通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,得到目标用户群体的选择偏好,并设为候选推荐;
40、计算模块,用于通过目标用户画像与景点画像的匹配程度,获取用户对于各景点的偏好值,所述偏好值作为推荐列表的排列依据。
41、第三方面,本专利技术提供了一种计算设备,包括:
42、存储器和处理器;
43、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执本文档来自技高网...
【技术保护点】
1.一种基于双边画像的旅游景点推荐方法,其特征在于,包括:
2.如权利要求1所述的基于双边画像的旅游景点推荐方法,其特征在于,
3.如权利要求2所述的基于双边画像的旅游景点推荐方法,其特征在于,所述景点特征标签还包括通过所述主题特征词计算得到的对应景点特征标签的吸引力分数,表示为:
4.如权利要求2或3所述的基于双边画像的旅游景点推荐方法,其特征在于,所述用户信息包括:基本信息、出游历史、用户评论;
5.如权利要求4所述的基于双边画像的旅游景点推荐方法,其特征在于,对相似的用户进行聚类,包括:
6.如权利要求5所述的基于双边画像的旅游景点推荐方法,其特征在于,所述通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,得到目标用户群体的选择偏好,包括:
7.如权利要求6所述的基于双边画像的旅游景点推荐方法,其特征在于,所述用户对于各景点的偏好值,表示为:
8.一种基于双边画像的旅游景点推荐系统,其特征在于,包括:
9.一种电子设备,包括:
10.一种计算机可读存储介质
...【技术特征摘要】
1.一种基于双边画像的旅游景点推荐方法,其特征在于,包括:
2.如权利要求1所述的基于双边画像的旅游景点推荐方法,其特征在于,
3.如权利要求2所述的基于双边画像的旅游景点推荐方法,其特征在于,所述景点特征标签还包括通过所述主题特征词计算得到的对应景点特征标签的吸引力分数,表示为:
4.如权利要求2或3所述的基于双边画像的旅游景点推荐方法,其特征在于,所述用户信息包括:基本信息、出游历史、用户评论;
5.如权利要求4所述的基于双边画像的旅游景点推荐方法,其特征在于,对相似的用户进行聚类,包括:
6...
【专利技术属性】
技术研发人员:孙知信,包禹兵,宫婧,孙哲,曹亚东,赵学健,汪胡青,胡冰,徐玉华,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。