基于知识图谱的用户兴趣爱好确定方法及系统技术方案

技术编号:27262994 阅读:22 留言:0更新日期:2021-02-06 11:24
本发明专利技术提供了基于知识图谱的用户兴趣爱好确定方法及系统。该方法包括:获取在预设时间段内,用户对目标知识图谱的浏览记录;根据所述用户对目标知识图谱的浏览记录,确定所述用户对目标知识图谱的兴趣度;根据所述用户对目标知识图谱的兴趣度,生成所述用户感兴趣的知识图谱集合。知识图谱集合。知识图谱集合。

【技术实现步骤摘要】
基于知识图谱的用户兴趣爱好确定方法及系统


[0001]本专利技术涉及智能学习
,特别涉及基于知识图谱的用户兴趣爱好确定方法及系统。

技术介绍

[0002]现有技术中,有很多知识点借助知识图谱展现。知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0003]对于经常通过知识图谱来浏览知识的用户来讲,知识图谱的展现形式好坏、知识图谱关联知识点的多少,会极大影响用户对知识图谱中知识点的兴趣度,因此,需要设计一种能够智能化的、较为准确的确定基于知识图谱的用户对知识的兴趣爱好的技术。

技术实现思路

[0004]本专利技术提供基于知识图谱的用户兴趣爱好确定方法及系统。
[0005]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0006]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0007]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0008]图1为本专利技术实施例中一种基于知识图谱的用户兴趣爱好确定方法的流程等图。
具体实施方式
[0009]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0010]本专利技术实施例提供一种基于知识图谱的用户兴趣爱好确定方法,如图1所示,包括步骤S1-S3:
[0011]步骤S1、获取在预设时间段内,用户对目标知识图谱的浏览记录。
[0012]步骤S2、根据用户对目标知识图谱的浏览记录,确定用户对目标知识图谱的兴趣度。
[0013]步骤S3、根据用户对目标知识图谱的兴趣度,生成用户感兴趣的知识图谱集合。
[0014]上述技术方案的有益效果为:上述技术方案,通过根据用户对目标知识图谱的浏览记录,确定用户对目标知识图谱的兴趣度;根据用户对目标知识图谱的兴趣度,生成用户
感兴趣的知识图谱集合,从而确定出用户兴趣高的所有知识图谱。
[0015]在一个实施例中,获取在预设时间段内,用户对目标知识图谱的浏览记录之前,还包括:
[0016]步骤A1、获取目标知识图谱,根据如下公式(1)对目标知识图谱进行质量评估:
[0017][0018]其中,J表示目标知识图谱的质量标识值,N表示为目标知识图谱中的重要知识点的数量,S
i
表示目标知识图谱中第i个重要知识点在目标知识图谱中占据的数据量大小;X为目标知识图谱中总数据量大小;Y表示目标知识图谱中重要知识点占据的平均数据量大小;M表示目标知识图谱中的文本段落的总数量,Q
j
表示目标知识图谱中第j个文本段落的重要系数,取值范围为[0,1],越重要的文本段落,其重要系数越大;α
j
表示目标知识图谱中第j个文本段落所占据的数据量大小;α
max
表示目标知识图谱中占据数据量最大的文本段落所占据的数据量大小;β表示目标知识图谱中所有非重要知识点所占据的数据量大小;
[0019]步骤A2、判断目标知识图谱的质量标识值是否大于等于预设阈值,如果是,则为目标知识图谱设置第一数量个关联知识点关键词,并建立第一数量个关联知识点关键词与目标知识图谱之间的关联关系;否则,为目标知识图谱设置第二数量个关联知识点关键词,并建立第二数量个关联知识点关键词与目标知识图谱之间的关联关系;其中,第一数量大于第二数量;其中,关联知识点关键词为与重点知识点之间具有预设相似关系的知识点的关键词。
[0020]上述技术方案的有益效果为:可以通过对目标知识图谱中一些参数例如重要知识点和非重要知识点的相关数据、文本段落等数据进行分析,获得目标知识图谱的质量优劣,并对不同质量的知识图谱配置不同数量的关联知识点,从而使得目标知识图谱能够放大优势、减小劣势,为后续的继续分析确定用户兴趣爱好知识点提供优质的数据基础。
[0021]在一个实施例中,根据用户对目标知识图谱的浏览记录,确定用户对目标知识图谱的兴趣度,包括:
[0022]步骤B1、根据如下公式(2)计算出用户对目标知识图谱的兴趣度:
[0023][0024]其中,η表示为用户对目标知识图谱的兴趣度;ln表示为自然对数,B
i
表示用户在预设时间段内点击目标知识图谱中第i个重要知识点的频率;F
i
表示第i个重要知识点在目标知识图谱中对应的文本段落的数量;M表示目标知识图谱中的文本段落的总数量,R
k
表示用户所点击的第k个关联知识点关键词与目标知识图谱中相应的重点知识点之间的相似度;H表示用户在预设时间段内点击关联知识点关键词的数量;G1表示用户在预设时间段内通过点击关联知识点关键词后对目标知识图谱进行浏览的浏览总次数,G2表示用户的历史
浏览记录中,在与预设时间段相等时长的时间段内浏览目标知识图谱的最多次数;T表示预设时间段的时长;I
k
表示用户点击第k个关联知识点关键词后,目标知识图谱的页面加载时长;O
k
表示用户点击第k个关联知识点关键词后对目标知识图谱的浏览时长;
[0025]步骤B2、将用户对目标知识图谱的兴趣度与预设兴趣度阈值进行比较,当兴趣度大于或等于预设兴趣度阈值时,确认用户对目标知识图谱爱好度高;否则,确认用户对目标知识图谱爱好度低。
[0026]上述技术方案的有益效果为:通过利用用户对目标知识图谱的浏览总时长、浏览次数等参数计算出用户对于目标知识图谱的兴趣度,其中,所用到的参数中细致到了通过点击关联知识点进入浏览知识图谱的次数等,保证了计算结果的准确性,提高了评估用户对于知识图谱的爱好程度的准确率。
[0027]在一个实施例中,根据用户对目标知识图谱的兴趣度,生成用户感兴趣的知识图谱集合,包括:
[0028]将爱好度高的所有目标知识图谱,加入所述用户感兴趣的知识图谱集合,形成所述用户感兴趣的知识图谱集合。
[0029]在另一个实施例中,根据所述用户对目标知识图谱的兴趣度,生成所述用户感兴趣的知识图谱集合,包括:
[0030]将爱好度高的所有目标知识图谱,按照对应的兴趣度从大到小的顺序排序,形成依序排列的所述用户感兴趣的知识图谱集合。
[0031]上述技术方案的有益效果为:通过计算爱好度高的目标知识图谱,并将爱好度高的目标知识图谱加入用户感兴趣的知识图谱集合,最终可以方便统计用户对知识图谱的兴趣信息,便于后续分析知识图谱与用户之间的关系,为知识图谱的进一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
表示用户在所述预设时间段内通过点击关联知识点关键词后对所述目标知识图谱进行浏览的浏览总次数,G2表示所述用户的历史浏览记录中,在与所述预设时间段相等时长的时间段内浏览所述目标知识图谱的最多次数;T表示所述预设时间段的时长;I
k
表示用户点击第k个关联知识点关键词后,目标知识图谱的页面加载时长;O
k
表示用户点击第k个关联知识点关键词后对所述目标知识图谱的浏览时长;步骤B2、将用户对所述目标知识图谱的兴趣度与预设兴趣度阈值进行比较,当兴趣度大于或等于所述预设兴趣度阈值时,确认所述用户对目标知识图谱爱好度高;否则,确认所述用户对目标知识图谱爱好度低。4.如权利要求3所述的方法,其特征在于,所述根据所述用户对目标知识图谱的兴趣度,生成所述用户感兴趣的知识图谱集合,包括:将爱好度高的所有目标知识图谱加入所述用户感兴趣的知识图谱集合,形成所述用户感兴趣的知识图谱集合。5.如权利要求3所述的方法,其特征在于,所述根据所述用户对目标知识图谱的兴趣度,生成所述用户感兴趣的知识图谱集合,包括:将爱好度高的所有目标知识图谱,按照对应的兴趣度从大到小的顺序排序,形成依序排列的所述用户感兴趣的知识图谱集合。6.一种基于知识图谱的用户兴趣爱好确定系统,其特征在于,包括:获取模块,用于获取在预设时间段内,用户对目标知识图谱的浏览记录;确定模块,用于根据所述用户对目标知识图谱的浏览记录,确定所述用户对目标知识图谱的兴趣度;生成模块,用于根据所述用户对目标知识图谱的兴趣度,生成所述用户感兴趣的知识图谱集合。7.如权利要求6所述的系统,其特征在于,所述获取在预设时间段内,用户对目标知识图谱的浏览记录之前,还包括:步骤A1、获取目标知识图谱,根据如下公式(1)对所述目标知识图谱进行质量评估:其中,J表示目标知识图谱的质量标识值,N表示为目标知识图谱中的重要知识点的数量,S
i
表示目标知识图谱中第i个重要知识点在目标知识图谱中占据的数据量大小;X为目标知识图谱中总数据量大小;Y表示目标知识图谱中重要知识点占据的平均数据量大小;M表示目标知识图谱中的文本段落的总数量,Q
j
表示目标知识图谱中第j个文本段落的重要系数,取值范围为[0,1],越重要的文本段落,其重要系数越大;α
j
表示目标知识图谱中第j个文本段落所占据的数据量大小;α
max
表示目标知识图谱中占据数据量最大的文本段落所占据的数据量大小;β表示目标知识图谱中所有非重要知识点所占据的...

【专利技术属性】
技术研发人员:崔炜
申请(专利权)人:上海松鼠课堂人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1