System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种基于语义理解模型的相关专利推荐方法、控制装置、计算机设备以及计算机可读存储介质。
技术介绍
1、目前,专利分析系统(或专利检索平台)为了方便用户进行专利比对,一般会提供所选中专利的相关专利(或相似专利)推荐服务,以便于用户快速查询相关专利,更好地进行专利比对分析。
2、但现有相关专利的检索查询,一般是以所选中专利为基础专利,通过提取基础专利的关键词,在专利数据库中索引查询相关专利;或者是通过词条文序编码来计算基础专利与候选专利之间的相似性,以此查询相关专利。但这些查询相关专利的方式主要依赖于表面文本信息的匹配,忽略了专利文本的语境和内容,无法考虑到复杂的语义关系和深层语义信息,只能检索到文字描述一致的相关专利,而忽略掉那些虽然文字表达方式不同,但在构思、实施方式上具有相似性的专利,从而难以更准确、更全面地进行相关专利的推荐。
3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本申请的主要目的在于提供一种基于语义理解模型的相关专利推荐方法、控制装置、计算机设备和计算机可读存储介质,旨在更准确、更全面地实现相关专利的推荐。
2、为实现上述目的,本申请提供一种基于语义理解模型的相关专利推荐方法,包括以下步骤:
3、根据基础专利的关键信息,筛选出与关键信息相匹配的专利集合;
4、对基础专利进行文档切片,得到第一文段集;以及,对专利集合中的候选专利进行文档
5、基于语义理解模型,提取第一文段集中各文段对应的第一语义特征,以及提取第二文段集中各文段对应的第二语义特征;
6、查询与第一语义特征相匹配的第二语义特征,并将查询到的第二语义特征所关联的文段标记为目标文段;
7、根据目标文段的数量,对候选专利进行排序;
8、将排序满足预设位次的候选专利,作为基础专利的相关专利进行推荐。
9、可选的,所述语义理解模型包括输入层、中间层和输出层;其中,所述输入层基于词嵌入技术构建、所述中间层基于bert(bidirectional encoder representationsfromtransformers)网络构建;
10、所述输入层,用于将文段转换为词嵌入向量;
11、所述中间层,用于对词嵌入向量进行前向传播,经过多层网络结构进行一系列非线性变换和特征提取;
12、所述输出层,用于对所述中间层提取的特征进行特征汇聚操作,以生成语义特征。
13、可选的,所述第一文段集、所述第二文段集中的文段分为关键文段,以及除关键文段外的其他文段;
14、所述查询与第一语义特征相匹配的第二语义特征,并将查询到的第二语义特征所关联的文段标记为目标文段的步骤包括:
15、根据第一文段集中关键文段对应的第一语义特征,查询相匹配的第二文段集中关键文段对应的第二语义特征;
16、将查询到的第二语义特征所关联的关键文段标记为目标文段;
17、查询目标文段所属候选专利中的其他文段对应的第二语义特征,是否有相匹配的第一语义特征;
18、若是,则将其他文段同样标记为目标文段。
19、可选的,所述基于语义理解模型的相关专利推荐方法还包括:
20、若第一语义特征与第二语义特征之间的相似度大于预设阈值,则判定第一语义特征与第二语义特征相匹配;
21、其中,将查询关键文段时使用的预设阈值标记为第一阈值;将查询其他文段时使用的预设阈值标记为第二阈值;所述第一阈值大于所述第二阈值。
22、可选的,所述查询目标文段所属候选专利中的其他文段对应的第二语义特征,是否有相匹配的第一语义特征的步骤之前,还包括:
23、根据目标文段所属候选专利的数量,调整所述第二阈值;
24、其中,所述目标文段所属候选专利的数量,与所述第二阈值正相关。
25、可选的,所述将排序满足预设位次的候选专利,作为基础专利的相关专利进行推荐的步骤包括:
26、基于gpt(generative pre-trained,生成式预训练)模型的文档分析功能,对基础专利中,以及对排序满足预设位次的候选专利分别进行分析总结,并生成相应的总结信息;
27、根据基础专利与候选专利之间相应的总结信息的相似度,调整预设位次以内的候选专利的排序结果;
28、基于调整后的排序结果,生成预设位次以内的候选专利的推荐列表;
29、基于所述推荐列表,执行基础专利的相关专利推荐操作。
30、可选的,所述查询与第一语义特征相匹配的第二语义特征,并将查询到的第二语义特征所关联的文段标记为目标文段的步骤之后,还包括:
31、若不同候选专利之间的目标文段的数量一致,则目标文段在文中的连贯性越高,相应的候选专利排序越靠前。
32、为实现上述目的,本申请还提供一种控制装置,包括:
33、筛选模块,用于根据基础专利的关键信息,筛选出与关键信息相匹配的专利集合;
34、切片模块,用于对基础专利进行文档切片,得到第一文段集;以及,对专利集合中的候选专利进行文档切片,得到第二文段集;
35、提取模块,用于基于语义理解模型,提取第一文段集中各文段对应的第一语义特征,以及提取第二文段集中各文段对应的第二语义特征;
36、查询模块,用于查询与第一语义特征相匹配的第二语义特征,并将查询到的第二语义特征所关联的文段标记为目标文段;
37、排序模块,用于根据目标文段的数量,对候选专利进行排序;
38、推荐模块,用于将排序满足预设位次的候选专利,作为基础专利的相关专利进行推荐。
39、为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述基于语义理解模型的相关专利推荐方法的步骤。
40、为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述基于语义理解模型的相关专利推荐方法的步骤。
41、本申请提供的基于语义理解模型的相关专利推荐方法、控制装置、计算机设备和计算机可读存储介质,利用语义理解模型,对专利文本进行深入的语义理解和文本分析,克服了传统相关专利搜寻方式中对表面文本信息匹配的依赖,能够更准确地捕捉到专利文本的深层语义信息和相关性,这样就能充分考虑到那些虽然文字表达方式不同,但在构思、实施方式上具有相似性的专利,从而查询到更准确、更全面的相关专利进行推荐,有助于用户更好地完成专利比对或相关专利搜寻任务,从而显著提升了相关专利推荐的效果和用户满意度。
本文档来自技高网...【技术保护点】
1.一种基于语义理解模型的相关专利推荐方法,其特征在于,包括:
2.如权利要求1所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述语义理解模型包括输入层、中间层和输出层;其中,所述输入层基于词嵌入技术构建、所述中间层基于BERT网络构建;
3.如权利要求1所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述第一文段集、所述第二文段集中的文段分为关键文段,以及除关键文段外的其他文段;
4.如权利要求3所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述基于语义理解模型的相关专利推荐方法还包括:
5.如权利要求4所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述查询目标文段所属候选专利中的其他文段对应的第二语义特征,是否有相匹配的第一语义特征的步骤之前,还包括:
6.如权利要求4所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述将排序满足预设位次的候选专利,作为基础专利的相关专利进行推荐的步骤包括:
7.如权利要求1所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述查询
8.一种控制装置,其特征在于,包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于语义理解模型的相关专利推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语义理解模型的相关专利推荐方法的步骤。
...【技术特征摘要】
1.一种基于语义理解模型的相关专利推荐方法,其特征在于,包括:
2.如权利要求1所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述语义理解模型包括输入层、中间层和输出层;其中,所述输入层基于词嵌入技术构建、所述中间层基于bert网络构建;
3.如权利要求1所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述第一文段集、所述第二文段集中的文段分为关键文段,以及除关键文段外的其他文段;
4.如权利要求3所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述基于语义理解模型的相关专利推荐方法还包括:
5.如权利要求4所述的基于语义理解模型的相关专利推荐方法,其特征在于,所述查询目标文段所属候选专利中的其他文段对应的第二语义特征,是否有相匹配的第一语义特征的步骤之前,还包括:
6.如权利要求4所述的基于语义理解模型的相...
【专利技术属性】
技术研发人员:付渝翔,刘谦,范献银,
申请(专利权)人:深圳铸联技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。