System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文本语义分析领域,更具体的,涉及基于图卷积属性聚合的专利聚类方法和系统。
技术介绍
1、随着技术专利技术专利的文本数量与日俱增,在用户进行技术查新以避免技术侵权,或者审查员进行专利审查中,通常需要查找相关或相似的专利。但现有技术中,缺少通过专利文本的语义解析进行精准化表征的过程,对专利的检索过于简单,得到的检索结果往往不符合预期,或得到较少的检索结果,因此,如何通过现代化信息手段进行专利文本的高效分析与检索,是目前仍需解决的重要问题。
技术实现思路
1、本专利技术克服了现有技术的缺陷,提出了基于图卷积属性聚合的专利聚类方法和系统。
2、本专利技术第一方面提供了一种基于图卷积属性聚合的专利聚类方法,包括:
3、获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱;
4、基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据;
5、基于当前专利数据生成第一检索信息,通过第一检索信息进行检索得到初始专利大数据;
6、根据所述初始专利大数据,对权利要求信息进行语义分析与向量化,形成初始特征数据;
7、根据专利表征数据与初始特征数据进行基于余弦相似度的数据相似度计算,基于相似度,对初始专利大数据进行排序,形成专利检索推荐数据;
8、将所述专利检索推荐数据发送至预设终
9、本方案中,所述获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱,具体为:
10、获取当前专利数据,将所述当前专利数据进行文本格式转化,得到当前文本数据;
11、对当前文本数据进行语义分析与技术关键词提取,并以关键词作为实体、权利要求作为属性,进行基于实体、属性、关系的三元组信息抽取,形成三元组数据;
12、基于所述三元组数据构建专利知识图谱。
13、本方案中,所述基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,之前包括:
14、基于专利知识图谱进行属性数据抽取,并基于知识图谱中原有数据结构,对抽取的属性数据进行图结构搭建,形成属性图;
15、基于agnn算法,对属性图进行节点学习,计算出每个属性节点的在图结构中的重要度,并将重要度作为属性节点的复杂度,重要度计算基于属性节点所在图中的位置、连接边数量、边权值;
16、基于属性图,对属性节点数据进行语义分析与语义特征提取,得到每个属性节点的特征向量。
17、本方案中,所述基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,具体为:
18、获取每个属性节点的复杂度与特征向量;
19、基于谱聚类算法,对属性节点数据进行聚类分析;
20、所述聚类分析过程中,聚类的单位数据为每个属性节点,聚类过程中数据之间相似度计算为基于节点的之间的特征向量相似度与复杂度;
21、通过聚类分析,生成多个属性组,每个属性组包括至少一个属性节点;
22、基于一个属性组,将对应属性数据进行语义表征分析,形成表征数据;
23、分析所有属性组,并将得到的所有表征数据进行整合,形成专利表征数据。
24、本方案中,所述基于当前专利数据生成第一检索信息,通过第一检索信息进行检索得到初始专利大数据,具体为:
25、基于当前专利数据得到专利基础信息,将专利基础信息作为第一检索信息;
26、基于第一检索信息在预设检索终端进行数据检索,得到专利检索结果;
27、将所述专利检索结果进行数据清洗预处理,形成初始专利大数据。
28、本方案中,所述根据专利表征数据与初始特征数据进行基于余弦相似度的数据相似度计算,基于相似度,对初始专利大数据进行排序,形成专利检索推荐数据,具体为:
29、将初始特征数据进行专利数据文本格式化与语义特征分析,形成专利特征数据;
30、根据专利表征数据与专利特征数据进行相似度计算,基于相似度结果,对初始专利大数据进行检索数据排序,得到专利检索推荐数据;
31、所述相似度计算为基于余弦相似度计算法;
32、将所述专利检索推荐数据发送至预设终端设备。
33、本专利技术第二方面还提供了一种基于图卷积属性聚合的专利聚类系统,该系统包括:存储器、处理器,所述存储器中包括基于图卷积属性聚合的专利聚类程序,所述基于图卷积属性聚合的专利聚类程序被所述处理器执行时实现如下步骤:
34、获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱;
35、基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据;
36、基于当前专利数据生成第一检索信息,通过第一检索信息进行检索得到初始专利大数据;
37、根据所述初始专利大数据,对权利要求信息进行语义分析与向量化,形成初始特征数据;
38、根据专利表征数据与初始特征数据进行基于余弦相似度的数据相似度计算,基于相似度,对初始专利大数据进行排序,形成专利检索推荐数据;
39、将所述专利检索推荐数据发送至预设终端设备。
40、本方案中,所述获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱,具体为:
41、获取当前专利数据,将所述当前专利数据进行文本格式转化,得到当前文本数据;
42、对当前文本数据进行语义分析与技术关键词提取,并以关键词作为实体、权利要求作为属性,进行基于实体、属性、关系的三元组信息抽取,形成三元组数据;
43、基于所述三元组数据构建专利知识图谱。
44、本专利技术公开了基于图卷积属性聚合的专利聚类方法和系统,基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据;基于当前专利数据生成第一检索信息,通过第一检索信息进行检索得到初始专利大数据;根据所述初始专利大数据,对权利要求信息进行语义分析与向量化,形成初始特征数据;根据专利表征数据与初始特征数据进行基于余弦相似度的数据相似度计算,基于相似度,对初始专利大数据进行排序,形成专利检索推荐数据;将所述专利检索推荐数据发送至预设终端设备。通过本专利技术,能够对专利数据实现精准化表征的用户特征化的数据推荐,提高检索效率与用户体验。
本文档来自技高网...【技术保护点】
1.一种基于图卷积属性聚合的专利聚类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱,具体为:
3.根据权利要求1所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述基于AGNN算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,之前包括:
4.根据权利要求3所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述基于AGNN算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,具体为:
5.根据权利要求4所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述基于当前专利数据生成第一检索信息,通过第一检索信息进行检索得到初始专利大数据,具体为:
6.根据权利要求5所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述根据专利表征数据与初始特征数据
7.一种基于图卷积属性聚合的专利聚类系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括基于图卷积属性聚合的专利聚类程序,所述基于图卷积属性聚合的专利聚类程序被所述处理器执行时实现如下步骤:
8.根据权利要求7所述的一种基于图卷积属性聚合的专利聚类系统,其特征在于,所述获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱,具体为:
...【技术特征摘要】
1.一种基于图卷积属性聚合的专利聚类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述获取当前专利数据,将所述当前专利数据转化为文本数据并基于语义进行三元组信息抽取,以专利数据中的权利要求作为属性元,基于抽取的三元组信息构建专利知识图谱,具体为:
3.根据权利要求1所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,之前包括:
4.根据权利要求3所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,所述基于agnn算法,对专利知识图谱中的属性数据进行数据聚合,将聚合后的数据作为专利表征数据,具体为:
5.根据权利要求4所述的一种基于图卷积属性聚合的专利聚类方法,其特征在于,...
【专利技术属性】
技术研发人员:赖培源,廖德章,廖晓东,李奎,叶世兵,周海涛,蔡焕涛,翁锦标,张跃,黄俊铮,
申请(专利权)人:广东省华南技术转移中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。