System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于自然语言模型的专利预警分析方法及其系统技术方案_技高网

一种基于自然语言模型的专利预警分析方法及其系统技术方案

技术编号:41427585 阅读:13 留言:0更新日期:2024-05-28 20:25
本申请适用于语言大模型与专利数据库交互技术的技术领域,提供了一种基于自然语言模型的专利预警分析方法及其系统,其方法包括获取待评估企业的第一申请专利集信息和竞争企业的第二申请专利集信息;再确定第一关键词信息和第二关键词信息;再确定第一核心分类词组信息和第二核心分类词组信息;然后依次比对第一核心分类词组信息和各个第二核心分类词组信息,确定重复词数量信息并生成预警信息,预警信息作为大型语言模型的高价值输出。本申请能够有利于大型语言模型对海量文献进行学习和精准理解,帮助分析人员把握技术发展的脉络,为企业的研发和知识产权管理提供重要支持,有利于挖掘专利的技术价值和推广潜力,推动电网行业创新技术发展。

【技术实现步骤摘要】

本申请涉及语言大模型与专利数据库交互技术的,具体而言,涉及一种基于自然语言模型的专利预警分析方法及其系统


技术介绍

1、随着人工智能技术的迅速发展,大型语言模型(large language model,llm)在计算机理解和处理自然语言方面取得了巨大的进步,展现出了强大的表现能力,并且为自然语言处理和人工智能的发展提供了重要的技术支持。大型语言模型是一种基于人工智能的自然语言模型,旨在理解和生成人类语言,它在大量的数据进行训练后,可以执行广泛的任务,譬如:文本生成、逻辑推理、语言理解等等。

2、目前,尚无将大型语言模型与专利数据库相结合,以辅助企业对专利信息进行分析,存在专利分析效率低下的问题,有待进一步改进。


技术实现思路

1、基于此,本申请实施例提供了一种基于自然语言模型的专利预警分析方法及其系统,以解决现有技术中专利分析效率低下的问题。

2、第一方面,本申请实施例提供了一种基于自然语言模型的专利预警分析方法,所述方法包括:

3、获取待评估企业的第一申请专利集信息和竞争企业的第二申请专利集信息,其中,所述第一申请专利集信息用于描述所述待评估企业的全部第一已公开专利的集合,所述第二申请专利集信息用于描述所述竞争企业的全部第二已公开专利的集合;

4、基于预设的分词算法和所述第一申请专利集信息,确定各个所述第一已公开专利的第一关键词信息,并基于所述分词算法和所述第二申请专利集信息,确定各个所述第二已公开专利的第二关键词信息;

5、针对每个所述第一已公开专利:基于预设的近义词链组信息和所述第一关键词信息,确定所述第一已公开专利的第一核心分类词组信息,并针对每个所述第二已公开专利:基于所述近义词链组信息和所述第二关键词信息,确定所述第二已公开专利的第二核心分类词组信息;

6、针对每个所述第一已公开专利:将所述第一已公开专利的第一核心分类词组信息依次和各个所述第二已公开专利对应的第二核心分类词组信息进行比对,确定重复词数量信息;

7、根据所述重复词数量信息和预设的重复词数量阈值信息,生成预警信息。

8、与现有技术相比存在的有益效果是:本申请实施例提供的基于自然语言模型的专利预警分析方法,终端设备可以先获取待评估企业的第一申请专利集信息和竞争企业的第二申请专利集信息,其中,第一申请专利集信息用于描述待评估企业的全部第一已公开专利的集合,第二申请专利集信息用于描述竞争企业的全部第二已公开专利的集合;然后基于分词算法和第一申请专利集信息,确定各个第一已公开专利的第一关键词信息,同时基于分词算法和第二申请专利集信息,确定各个第二已公开专利的第二关键词信息;再基于近义词链组信息和第一关键词信息,确定第一已公开专利的第一核心分类词组信息,同时基于近义词链组信息和第二关键词信息,确定第二已公开专利的第二核心分类词组信息;然后将第一已公开专利的第一核心分类词组信息依次和各个第二已公开专利对应的第二核心分类词组信息进行比对,确定重复词数量信息;再根据重复词数量信息和重复词数量阈值信息,生成预警信息,从而实现将大型语言模型与专利数据库相结合,辅助企业对专利信息进行分析,大幅度提高专利分析效率,在一定程度上解决了当前专利分析效率较低的问题。

9、第二方面,本申请实施例提供了一种基于自然语言模型的专利预警分析系统,所述系统包括:

10、申请专利集信息获取模块:用于获取待评估企业的第一申请专利集信息和竞争企业的第二申请专利集信息,其中,所述第一申请专利集信息用于描述所述待评估企业的全部第一已公开专利的集合,所述第二申请专利集信息用于描述所述竞争企业的全部第二已公开专利的集合;

11、关键词信息确定模块:用于基于预设的分词算法和所述第一申请专利集信息,确定各个所述第一已公开专利的第一关键词信息,并基于所述分词算法和所述第二申请专利集信息,确定各个所述第二已公开专利的第二关键词信息;

12、核心分类词组信息确定模块:用于针对每个所述第一已公开专利:基于预设的近义词链组信息和所述第一关键词信息,确定所述第一已公开专利的第一核心分类词组信息,并针对每个所述第二已公开专利:基于所述近义词链组信息和所述第二关键词信息,确定所述第二已公开专利的第二核心分类词组信息;

13、重复词数量信息确定模块:用于针对每个所述第一已公开专利:将所述第一已公开专利的第一核心分类词组信息依次和各个所述第二已公开专利对应的第二核心分类词组信息进行比对,确定重复词数量信息;

14、预警信息生成模块:用于根据所述重复词数量信息和预设的重复词数量阈值信息,生成预警信息。

15、第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面的方法的步骤。

16、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

17、可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。

本文档来自技高网
...

【技术保护点】

1.一种基于自然语言模型的专利预警分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设的分词算法和所述第一申请专利集信息,确定各个所述第一已公开专利的第一关键词信息,并基于所述分词算法和所述第二申请专利集信息,确定各个所述第二已公开专利的第二关键词信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述近义词链组信息包括多个近义词链信息,所述近义词链信息包括多个近义词信息;所述针对每个所述第一已公开专利:基于预设的近义词链组信息和所述第一关键词信息,确定所述第一已公开专利的第一核心分类词组信息,并针对每个所述第二已公开专利:基于所述近义词链组信息和所述第二关键词信息,确定所述第二已公开专利的第二核心分类词组信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述针对每个所述第一已公开专利:将所述第一已公开专利的第一核心分类词组信息依次和各个所述第二已公开专利对应的第二核心分类词组信息进行比对,确定重复词数量信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述重复词数量阈值信息包括第一数量阈值信息和第二数量阈值信息,所述第二数量阈值信息大于所述第一数量阈值信息,所述预警信息包括轻度关联信息、中度关联信息和高度关联信息;所述根据所述重复词数量信息和预设的重复词数量阈值信息,生成预警信息,包括:

6.一种基于自然语言模型的专利预警分析系统,其特征在于,所述系统包括:

7.根据权利要求6所述的系统,其特征在于,所述关键词信息确定模块包括:

8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于自然语言模型的专利预警分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设的分词算法和所述第一申请专利集信息,确定各个所述第一已公开专利的第一关键词信息,并基于所述分词算法和所述第二申请专利集信息,确定各个所述第二已公开专利的第二关键词信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述近义词链组信息包括多个近义词链信息,所述近义词链信息包括多个近义词信息;所述针对每个所述第一已公开专利:基于预设的近义词链组信息和所述第一关键词信息,确定所述第一已公开专利的第一核心分类词组信息,并针对每个所述第二已公开专利:基于所述近义词链组信息和所述第二关键词信息,确定所述第二已公开专利的第二核心分类词组信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述针对每个所述第一已公开专利:将所述第一已公开专利的第一核心分类词组信息依次和各个所述第二已公开专利对应的第二核心分...

【专利技术属性】
技术研发人员:张晨晨孙建谢涛罗超陈凡骆晨李博邵珺伟卞真旭李心姚翔宇金轶航苏鹏
申请(专利权)人:国网安徽省电力有限公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1