System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机,涉及一种信息检索中查新点生成方法、系统及设备,具体涉及一种基于大小模型协作的信息检索中查新点生成方法、系统及设备。
技术介绍
1、查新一直是科研
迭代发展过程中重要的环节,是我国科技管理和评估的重要环节,以文献调研为基础,通过情报分析对查新目标项目的新颖性进行审查,并产出详实的总结报告。因此查新是一项非常繁琐且复杂的工作,涉及到的技术点众多,如果检索的完整性不足、没有系统性地检索出目标项目所涉及的技术方面与层次,很容易获得有偏的查新报告,影响到目标项目的创新与研发,进而导致科研资源的浪费。因此在人机交互的背景下,如何根据用户查新需求设计出一种方法来自动地、可控地、完整地、准确地生成查新点,具有巨大的应用价值和广阔的发展前景。
2、现有的查新检索方式主要分两步。主要的检索途径包括主题检索、分类检索。主题检索是主要的确定检索词途径,其是以能反映查新目标项目内容及特征的词或词组作为检索词对数据库内的相关文献进行检索。分类检索则是依据查新目标项目中事物的类别在数据库中继续检索,通过分类检索有助于对检索对象进行分门别类的整理。通过一定途径确定检索词后,就需要按照查新的目标构建检索式。一般的检索式主要由检索词和相应的位置算符、逻辑算符组合而成,用来界定查新项目范围、控制检出精度。因此查新人员往往需要不断选择检索词、构建检索式进行检索,尽可能保证查新结果不错检、不漏检。但由位置算符、逻辑算符、检索词组成的检索式对查新目标的表达能力欠缺,难以反映更加复杂的关系。查新点为检索式构建提供了语义依据,但目前查新
技术实现思路
1、为了解决上述技术问题,本专利技术提供了一种基于大小模型协作的检索用查新点生成方法、系统及设备。
2、本专利技术第一方面提供了一种基于大小模型协作的检索用查新点生成方法,包括以下步骤:
3、步骤1:输入用于抽取关键词的技术背景文本及需求提示,所述需求提示包括需要抽取的查新中心词的类别或特征;
4、步骤2:依据需求提示利用大模型从技术背景文本中抽取查新中心词;
5、步骤3:过滤查新中心词,利用小模型对保留的中心词生成查新点文本;
6、步骤4:采用评估分类器对生成查新点文本进行分类评估;对不符合要求的查新点文本由大模型根据提示信息进行改写;
7、步骤5:生成符合要求的查新点文本。
8、作为优选,步骤1中所述的需求提示,用于引导大模型生成查新点中心词,内容包括让大模型基于相似案例检索的类别或特征,推荐相应的查新点中心词。
9、作为优选,步骤2中所述大模型,由编码层、若干transformer层和输出层组成;
10、所述编码层,为线性神经网络,用于将词汇单元序号转换为高维连续向量表示;
11、所述若干transformer层,由预设层transformer模块组成;所述transformer模块,由基于掩码的多头自注意力机制模块、第一个归一化模块、前向传播模块和第二个归一化模块串联组成;其中,所述基于掩码的多头自注意力机制模块输出与原始输入经过⊕运算后输入所述第一个归一化模块,所述前向传播模块输出与所述第一个归一化模块输出经过⊕运算后输入所述第二个归一化模块;所述⊕运算为逐元素相加运算;
12、所述输出层,为全连接神经网络。
13、作为优选,步骤3中所述小模型,由编码层、若干glmblock层和输出层组成;
14、所述编码层,为线性神经网络,用于将词汇单元序号转换为高维连续向量表示;
15、所述若干glmblock层,由预设层glmblock模块堆叠组成;所述glmblock模块,由第一rms归一化模块、注意力模块、第二rms归一化模块和mlp模块组成;所述第一rms归一化模块,对glmblock模块输入向量进行前归一化,其输出输入所述注意力模块,所述注意力模块对输入向量进行上下文注意力运算,运算结果与未进行前归一化的输入向量进行残差连接运算,所述第二rms归一化模块对注意力模块残差连接运算结果向量进行后归一化,然后输入所述mlp模块;所述mlp模块的输出向量与所述注意力模块残差连接运算结果向量经过进一步残差连接运算后输出;
16、所述输出层,为全连接神经网络。
17、作为优选,步骤3中所述小模型,其训练语料由输入文本与输出文本组成;所述输入文本,来自于基于现有查新点利用大模型抽取出的中心词和技术背景文本;所述输出文本,即为查新点。
18、作为优选,步骤4中所述评估分类器,采用bert-cnn架构,由bert层和卷积神经网络cnn层串联组成,输入是技术背景文本及据其生成的查新点文本;所述bert层,将bert层分类头的cls向量传递至分类器classifier中,得到查新点信息是否完备的分类;所述卷积神经网络cnn层,通过掩码只连接查新点文本部分,用于评估生成的查新点文本质量,输出是多标签向量,每一维表示不同的评估方面。
19、作为优选,步骤4中所述评估分类器,是训练好的评估分类器;训练中,首先构造伪语料数据训练评估分类器;所述伪语料数据,是基于领域内论文的摘要数据,完整的摘要作为正样本数据,而有残缺或经修改的摘要作为负样本数据。
20、本专利技术第二方面提供了一种基于大小模型协作的检索用查新点生成系统,包括以下模块:
21、输入模块,用于输入用于抽取关键词的技术背景文本及需求提示,所述需求提示包括需要抽取的查新中心词的类别或特征;
22、查新中心词抽取模块,用于依据需求提示利用大模型从技术背景文本中抽取查新中心词;
23、查新点文本生成模块,用于过滤查新中心词,利用小模型对保留的中心词生成查新点文本;
24、分类评估模块,用于采用评估分类器对生成查新点文本进行分类评估;对不符合要求的查新点文本由大模型根据提示信息进行改写;
25、检索模块,用于生成符合要求的查新点文本。
26、本专利技术第三方面提供了一种基于大小模型协作的检索用查新点生成设备,包括:
27、一个或多个处理器;
28、存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的基于大小模型协作的检索用查新点生成方法。
29、本专利技术第四方面提供了一种可读存储装介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于大小模型协作的检索用查新点生成的步骤。
30、相对于现有技术,本专利技术有益效果包括:
31、(1)本专利技术提出的一种基于大小模型协作的查新点生成技术,采用大模型抽取本文档来自技高网...
【技术保护点】
1.一种基于大小模型协作的检索用查新点生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤1中所述的需求提示,用于引导大模型生成查新点中心词,内容包括让大模型基于相似案例检索的类别或特征,推荐相应的查新点中心词。
3.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤2中所述大模型,由编码层、若干transformer层和输出层组成;
4.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤3中所述小模型,由编码层、若干GLMBlock层和输出层组成;
5.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤3中所述小模型,其训练语料由输入文本与输出文本组成;
6.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤4中所述评估分类器,采用BERT-CNN架构,由BERT层和卷积神经网络CNN层串联组成,输入是技术背景文本及据其生成的查新点文本;所述BERT层
7.根据权利要求1-6任意一项所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤4中所述评估分类器,是训练好的评估分类器;训练中,首先构造伪语料数据训练评估分类器;所述伪语料数据,是基于领域内论文的摘要数据,完整的摘要作为正样本数据,而有残缺或经修改的摘要作为负样本数据。
8.一种基于大小模型协作的检索用查新点生成系统,其特征在于,包括以下模块:
9.一种基于大小模型协作的检索用查新点生成设备,其特征在于,包括:
10.一种可读存储装介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于大小模型协作的检索用查新点生成的步骤。
...【技术特征摘要】
1.一种基于大小模型协作的检索用查新点生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤1中所述的需求提示,用于引导大模型生成查新点中心词,内容包括让大模型基于相似案例检索的类别或特征,推荐相应的查新点中心词。
3.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤2中所述大模型,由编码层、若干transformer层和输出层组成;
4.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤3中所述小模型,由编码层、若干glmblock层和输出层组成;
5.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤3中所述小模型,其训练语料由输入文本与输出文本组成;
6.根据权利要求1所述的基于大小模型协作的检索用查新点生成方法,其特征在于:步骤4中所述评估分类器,采用bert-cnn架构,由bert层和卷积神经网络cnn层串联...
【专利技术属性】
技术研发人员:黄永,陈卓,魏家泽,陆伟,齐晓曼,华珉,李文清,
申请(专利权)人:武汉大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。