System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,具体而言,本申请涉及一种知识产权与学术助理系统及其实现方法、装置、电子设备及存储介质。
技术介绍
1、在知识产权和学术研究领域,随着信息量的爆炸式增长,研究人员和专业人士面临着越来越多的信息检索和管理挑战。传统的信息检索和学术文献管理系统在处理大规模数据和复杂查询需求方面往往显得力不从心。
2、例如,在专利检索方面,研究人员需要从海量的专利文献中找到相关的信息。传统的检索方法通常基于关键词匹配,容易产生大量无关的结果。在学术研究方面,研究人员需要查找和整理大量的文献资料。现有的文献整理方法对于大量的专利文献的整理效率过低。
3、由上可知,如何提高知识产权与学术助理系统的效率的问题仍有待解决。
技术实现思路
1、本申请各提供了一种知识产权与学术助理系统及其实现方法、装置、电子设备及存储介质,可以解决相关技术中存在的知识产权与学术助理系统的效率不高的问题。所述技术方案如下:
2、根据本申请的一个方面,一种知识产权与学术助理系统及其实现方法,其特征在于,包括:
3、获取问题信息,并将所述问题信息输入意图分类模型进行意图分类,获得指示所述问题信息的问题类别的意图分类结果,其中,问题信息的问题类别包括知识产权问答类、专利检索类、学术问答类;
4、若所述意图分类结果指示所述问题信息的问题类别为专利检索类别,则将所述问题信息输入专利检索模型,生成专利检索结果;
5、若所述意图分类结果指示所述问题信息的问题
6、若所述意图分类结果指示所述问题信息的问题类别为学术问答类别,则将所述问题信息输入学术问答模型,生成学术问答结果。
7、根据本申请的一个方面,一种知识产权与学术助理系统装置,其特征在于,包括:
8、意图分类模块,用于获取问题信息,并将所述问题信息输入意图分类模型进行意图分类,获得指示所述问题信息的问题类别的意图分类结果,其中,问题信息的问题类别包括知识产权问答类、专利检索类、学术问答类;
9、专利检索模块,用于若所述意图分类结果指示所述问题信息的问题类别为专利检索类别,则将所述问题信息输入专利检索模型,生成专利检索结果;
10、知识产权问答模块,用于若所述意图分类结果指示所述问题信息的问题类别为知识产权问答类别,则将所述问题信息输入知识产权大模型,生成知识产权回答结果;
11、学术问答模块,用于若所述意图分类结果指示所述问题信息的问题类别为学术问答类别,则将所述问题信息输入学术问答模型,生成学术问答结果。
12、在一示例性实施例中,所述专利检索模型包括全文搜索引擎单元和重排序单元;
13、所述专利检索模块,包括:
14、关键字抽取单元,用于对所述问题信息进行关键字抽取,生成检索词信息;
15、相关性检索单元,用于将所述检索词信息输入全文搜索引擎单元进行相关性检索,获取预定的第一数量的检索结果;
16、重排序单元,用于基于所述重排序单元对所述检索结果进行重排序,获得与所述问题信息对应的专利检索结果。
17、在一示例性实施例中,所述学术问答模型包括知识图谱单元和大语言模型单元;
18、所述学术问答模块,包括:
19、知识图谱检索单元,用于将所述问题信息输入所述知识图谱单元进行知识图谱检索,确定对应所述问题信息的背景检索信息;
20、学术问答结果生成单元,用于将所述背景检索信息与所述问题信息输入预设的大语言模型单元,获得对应问题信息的学术问答结果。
21、在一示例性实施例中,所述装置还包括:
22、数据获取模块,用于获取专利学术数据;
23、实体管理处理模块,用于对所述专利学术数据进行实体关联处理,获得关键信息实体以及各所述关键信息实体之间的实体关系,其中,所述实体关联处理包括分词、命名实体识别和关系抽取;
24、存储模块,用于将所述关键信息实体以及对应的所述实体关系进行图数据库存储,获得知识图谱单元。
25、在一示例性实施例中,所述学术问答结果生成单元,包括:
26、多维度分析子单元,用于基于大语言模型单元对所述背景检索信息中的关键信息实体进行多维度分析,生成对应所述关键信息实体的用户画像信息;
27、学术问答结果生成子单元,用于基于各关键信息实体对应的所述用户画像信息,生成学术问答结果。
28、在一示例性实施例中,所述装置还包括:
29、第一训练模块,用于获取第一训练集,并基于所述第一训练集对预设的分类预训练模型进行训练,获得所述分类预训练模型生成的分类预测结果,其中,第一训练集包括包括对应知识产权问答类的知识产权问答数据、对应专利检索类的专利检索数据、对应学术问答类的专利学术数据;
30、性能评估模块,用于基于损失函数对所述分类预测结果进行模型性能评估,获得指示所述分类预训练模型对第一训练集的数据种类的预测效率的评估结果;
31、模型获取模块,用于基于所述评估结果对对所述预训练模型进行调参并重复训练,直至所述分类预训练模型预测的预测准确率达到预设阈值,获得意图分类模型。
32、在一示例性实施例中,所述装置还包括:
33、第二训练模块,用于获取第二训练集,其中,第二训练集包括知识产权问答数据和通用问答数据;
34、参数微调模块,用于基于所述第二训练集对预设的问答预训练模型进行模型参数微调,获得知识产权问答大模型。
35、根据本申请的一个方面,一种电子设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器上存储有计算机可读指令;所述计算机可读指令被一个或多个所述处理器执行,使得电子设备实现如上所述的知识产权与学术助理系统及其实现方法。
36、根据本申请的一个方面,一种存储介质,其上存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行,以实现如上所述的知识产权与学术助理系统及其实现方法。
37、根据本申请的一个方面,一种计算机程序产品,计算机程序产品包括计算机可读指令,计算机可读指令存储在存储介质中,电子设备的一个或多个处理器从存储介质读取计算机可读指令,加载并执行该计算机可读指令,使得电子设备实现如上所述的知识产权与学术助理系统及其实现方法。
38、本申请提供的技术方案带来的有益效果是:
39、在上述技术方案中,通过意图分类模型进行意图分类后,在将问题信息输入对应的模型进行处理,在确定了问题信息的问题类别后,根据问题信息所属领域的不同调用最合适的大模型进行服务检索,最终获取最符合用户需求的结果,提高了知识产权与学术助理系统的针对性,和各模型处理问题信息的效率,从而能够有效地解决相关技术中存在的知识产权与学术助理系统的效率不高的问题。本文档来自技高网...
【技术保护点】
1.一种知识产权与学术助理系统及其实现方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述专利检索模型包括全文搜索引擎单元和重排序单元;
3.如权利要求1所述的方法,其特征在于,所述学术问答模型包括知识图谱单元和大语言模型单元;
4.如权利要求3所述的方法,其特征在于,所述将所述问题信息输入所述知识图谱单元进行知识图谱检索,生成背景检索信息之前,所述方法还包括:
5.如权利要求3所述的方法,其特征在于,所述将所述背景检索信息与所述问题信息输入预设的大语言模型单元,获得对应问题信息的学术问答结果,包括:
6.如权利要求1所述的方法,其特征在于,所述将所述问题信息输入意图分类模型进行意图分类之前,所述方法还包括:
7.如权利要求1所述的方法,其特征在于,所述将所述问题信息输入知识产权大模型,生成知识产权回答结果之前,所述方法还包括:
8.一种知识产权与学术助理系统装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:至少一个处理器以及至少一个存储器,其中,
...【技术特征摘要】
1.一种知识产权与学术助理系统及其实现方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述专利检索模型包括全文搜索引擎单元和重排序单元;
3.如权利要求1所述的方法,其特征在于,所述学术问答模型包括知识图谱单元和大语言模型单元;
4.如权利要求3所述的方法,其特征在于,所述将所述问题信息输入所述知识图谱单元进行知识图谱检索,生成背景检索信息之前,所述方法还包括:
5.如权利要求3所述的方法,其特征在于,所述将所述背景检索信息与所述问题信息输入预设的大语言模型单元,获得对应问题信息的学术问答结果,包括:
...
【专利技术属性】
技术研发人员:倪仕文,杨敏,李烨,樊建平,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。