一种艾滋病防控知识宣教的个性化推荐方法技术

技术编号:25270953 阅读:67 留言:0更新日期:2020-08-14 23:04
本发明专利技术公开一种艾滋病防控知识宣教的个性化推荐方法,应用于大数据处理领域,针对现有技术的推荐结果精准性不高的问题,本发明专利技术在协同过滤推荐算法基础上,利用KL散度解决由于数据稀疏性导致不同维度数据不能利用的问题,有效处理了传统推荐算法的数据稀疏性问题;在选择聚类中心时有效地区分不同的宣教内容,同时,距离模型打破了经典几何距离方法(如欧几里德距离)的对称模式,并考虑了宣教内容之间不同评级数的影响,以强调其不对称关系,相比于现有技术可提高推荐精准性。

【技术实现步骤摘要】
一种艾滋病防控知识宣教的个性化推荐方法
本专利技术属于大数据处理领域,特别涉及一种艾滋病防控知识的个性化推荐技术。
技术介绍
艾滋病作为一种目前无法治愈的慢性传染疾病,防治艾滋病任重道远。普通大众对艾滋病相关知识了解薄弱,而目前获取艾滋病健康知识的途径主要由相关部门不定期组织现场宣讲及发放宣传资料,或者借助电视广播等传统媒体,这些方式对民众而言都是被动接收,且难以跟踪学习情况。因此,艾滋病防控知识宣传需要更多的宣传手段及推广力度。随着智能手机的普及,可以通过手机推送艾滋防控相关的文章、视频等,还可通过答题等方式检验用户学习效果,用户可随时主动获取相关宣教信息,极大地扩大宣教工作覆盖的人群范围。智能手机还可记录用户查看宣教信息的行为及相关知识掌握情况,个性化推荐不同主题的文章、视频和答题知识点,一方面提高用户学习兴趣,另一方面可跟踪用户依从性,为相关部门进一步指导工作提供参考依据。为了满足用户个性化需求,推荐系统(RS)作为一种信息过滤技术广泛用于处理信息过滤问题,从大量数据中识别出用户感兴趣的内容,并将这些内容推荐给用户。协同过滤(CF)算法因其简单和高效而成为最广泛应用的推荐技术之一。协同过滤推荐算法将用户历史行为数据生成推荐项,根据用户之间的相似程度或可选项目之间的相似程度,按相似程度高低推荐给用户。中国专利“CN109977315A一种文章推荐方法、装置、设备及存储介质”根据用户历史浏览文章,通过对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,通过将上一个推荐算法得到的推荐文章列表作为下一个算法的输入,依次执行得到最终推荐文章,以此方法流水线的得到推荐文章列表。此方法较为单一,仅通过用户历史浏览文章信息作为推荐依据。现有技术存在的缺陷:在传统的协同过滤推荐算法中,经常使用经典距离度量(例如欧几里德或曼哈顿距离)来计算两个项目之间的相似度。然而,这些距离方法取决于用于相似性计算的共同评定项目,即用户评定的共同属性,只有包含用户共同评定属性的项目才能用作相似性度量。然而,由于互联网数据普遍存在稀疏性特点,传统的协同过滤方法无法充分利用所有用户评级信息,而只能使用一小部分用户评级数据,这会影响推荐结果的精准性。
技术实现思路
为解决上述技术问题,本专利技术提出一种艾滋病防控知识宣教的个性化推荐方法,在协同过滤(CF)推荐算法基础上,基于KL散度(Kullback-Leibler散度,又称信息散度InformationDivergence)解决由于数据稀疏性导致不同维度数据不能利用的问题,提高了推荐准确性。本专利技术采用的技术方案为:一种艾滋病防控知识宣教的个性化推荐方法,包括:S1、通过终端设备收集用户个人基础信息,收集用户历史浏览信息;S2、根据用户历史浏览信息,采用KL散度计算向用户推荐艾滋病防控知识信息。步骤S2具体为:S21、采用KL散度计算任意两信息之间的距离;S22、根据步骤S21计算的两信息之间的距离,从信息概率分布角度找出所有可用信息的k个聚类中心,并生成信息聚类结果;S23、基于Top-n进行信息推荐。步骤S21的计算式为:其中,m是相同类别的信息数量,是信息i评分为r的概率,#i是为信息i评分的所有用户的数量,#r是信息i评分为r的用户数量,因子表示为信息i评分用户数与为信息i和信息j评分的用户数之和的比例。步骤S22具体为:S221、根据步骤S21计算的两信息之间的距离,基于K-medoids确定聚类中心;S222、根据余下的非中心信息与各中心信息之间的KL距离,对非中心信息进行分类。步骤S23具体为:未评级信息根据其最近邻集合,计算信息在具体用户中的预测评级值;根据具体用户对未评级信息的预测评级值,选择具有最高预测评级值的前n个信息作为推荐列表。所述最近邻集合的计算过程为:对未评级信息,在其所属类中选出与该信息KL距离最近的n个信息,将这n个信息作为该信息的最近邻集合。步骤S2初始未采集用户历史浏览信息时,推荐最新的信息;当信息浏览量大于第一阈值,且信息浏览量大于第一阈值的信息数量大于n,则向用户推荐浏览量最高的n个信息;否则推荐最新的信息。步骤S1所述信息包括文章或视频。步骤S1中的终端设备为智能手机、PC、平板。还包括根据用户对获取艾滋相关信息的感兴趣程度,进行感兴趣信息的补充推送。本专利技术的有益效果:本专利技术在协同过滤推荐算法基础上,利用KL散度解决由于数据稀疏性导致不同维度数据不能利用的问题,有效处理了传统推荐算法的数据稀疏性问题;在选择聚类中心时有效地区分不同的宣教内容,同时,距离模型打破了经典几何距离方法(如欧几里德距离)的对称模式,并考虑了宣教内容之间不同评级数的影响,以强调其不对称关系,可提高推荐精准性。附图说明图1为本专利技术的方案流程图。具体实施方式为便于本领域技术人员理解本专利技术的
技术实现思路
,下面结合附图对本
技术实现思路
进一步阐释。图1是本专利技术技术方案的主流程图,本专利技术方法的实现过程包括如下步骤:S1.收集用户个人基础信息及用户类别(普通人群、稳健型人群和进取型人群);收集用户历史浏览信息;新用户初始归为普通人群。S2.基于用户历史浏览信息,推荐用户相关及感兴趣的浏览信息。S3.对进取型人群推荐更多艾滋防治、艾滋治疗等内容。本实施例中还针对不同的用户对获取艾滋相关信息的感兴趣程度,进行热点艾滋信息推荐。S11.通过智能手机(还可以是PC或平板)应用程序,提供艾滋病相关宣教知识供用户查看学习,通过应用程序获取用户个人基础信息,以及用户对各类艾滋宣教知识的浏览行为信息。S12.本方案涉及的手机应用程序提供的艾滋宣传知识包含文章及视频形式,本方案对文章和视频的分类方法相同,推荐方法相同,以下推荐方法以文章推荐为例进行介绍。S13.获取的用户待评定内容包含信息脱敏后隐藏用户身份关联的性别、年龄等基础信息,以及用户浏览行为信息,包含浏览信息类别、浏览时间和频次等。S14.根据S13中产生的各维度信息,产生不同的分类。其中连续型数据根据数值范围确定评分,包含年龄、信息浏览时间、信息浏览频次;离散型数据则根据不同值设定不同分类,包含性别、信息浏览类别。如表1所示,用户评定数据通过表格对应相关分类。表1数据分类规则评定数据对应分类1对应分类2对应分类3对应分类4性别男女其他—年龄(岁)0-1818-4546-69>69信息浏览类别防艾基础知识政策文件艾滋防治艾滋治疗信息浏览时间(秒)0-1010-6060-180>180...

【技术保护点】
1.一种艾滋病防控知识宣教的个性化推荐方法,其特征在于,包括:/nS1、通过终端设备收集用户个人基础信息,收集用户历史浏览信息;/nS2、根据用户历史浏览信息,采用KL散度计算向用户推荐艾滋病防控知识信息。/n

【技术特征摘要】
1.一种艾滋病防控知识宣教的个性化推荐方法,其特征在于,包括:
S1、通过终端设备收集用户个人基础信息,收集用户历史浏览信息;
S2、根据用户历史浏览信息,采用KL散度计算向用户推荐艾滋病防控知识信息。


2.根据权利要求1所述的一种艾滋病防控知识宣教的个性化推荐方法,其特征在于,步骤S2具体为:
S21、采用KL散度计算任意两信息之间的距离;
S22、根据步骤S21计算的两信息之间的距离,从信息概率分布角度找出所有可用信息的k个聚类中心,并生成信息聚类结果;
S23、基于Top-n进行信息推荐。


3.根据权利要求2所述的一种艾滋病防控知识宣教的个性化推荐方法,其特征在于,步骤S21的计算式为:



其中,m是相同类别的信息数量,是信息i评分为r的概率,#i是为信息i评分的所有用户的数量,#r是信息i评分为r的用户数量,因子表示为信息i评分用户数与为信息i和信息j评分的用户数之和的比例。


4.根据权利要求2所述的一种艾滋病防控知识宣教的个性化推荐方法,其特征在于,步骤S22具体为:
S221、根据步骤S21计算的两信息之间的距离...

【专利技术属性】
技术研发人员:刘勇国陶文元杨尚明李巧勤
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1