System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及自然语言处理与人工智能,尤其涉及一种基于大模型知识推理的领域技术树生成方法及装置。
技术介绍
1、近年来,随着新能源、半导体和人工智能等高新技术的发展,对于这些技术产业链的上游、中游和下游所涉及到的关键领域节点的梳理对理解和掌握整个产业链发展的规律脉络变得尤为重要。自动化的产业链技术树挖掘及生成需要依托自然语言处理方法,通过分析海量科技文本数据,提取目标领域的相关技术以及上下游技术之间的关系。随着机器学习和深度学习的发展,如智能优化算法、深度神经网络模型以及预训练语言模型等方法已在大部分自然语言处理任务如文本分类、命名实体识别、关系抽取等任务上取得了领先的性能,这些方法对领域技术树的挖掘提供了良好的支撑。例如对量子芯片(quantumchip,qc)产业链进行分析,可以通过预训练模型强大的表征能力对海量新闻、技术报告中的文本向量化,通过语义匹配快速检索到相关信息。并且通过对这些文本特征进行实体识别和关系抽取,最终确定qc上下游技术实体完成产业链技术树的构建。
2、然而,使用依靠传统的机器学习和深度学习方法构建技术树存在以下问题:首先,使用传统机器学习和深度学习方法依赖专家智慧,且构建的技术树规模小、深度浅,难以满足面对不断变化演进的技术产业链进行深度解耦分析的研究需求;其次,科技信息迭代日新月异,面对海量庞杂、价值密度低的信息数据,传统技术树构建方法难以挖掘到高价值目标技术信息。
技术实现思路
1、本专利技术的目的在于克服现有技术树构建存在专家知识依赖、规
2、一方面,提供了一种基于大模型知识推理的领域技术树生成方法,包括:
3、步骤1:利用领域技术关键词对互联网和/或领域专业知识库进行检索,得到候选检索内容;
4、步骤2:利用所述候选检索内容和所述领域技术关键词构建第一任务指令,调用领域大模型对该第一任务指令中候选检索内容与技术关键词的相关性进行判断,得到高价值候选检索内容;
5、步骤3:利用所述高价值候选检索内容和所述领域技术关键词构建第二任务指令,调用领域大模型从该第二任务指令的高价值候选检索内容中抽取领域技术三元组,其中,领域技术三元组以领域技术关键词为主语,以关系集合内任意具有“包含”语义的词汇作为谓语,以下游技术关键词或者依赖技术关键词作为宾语;
6、步骤4:利用抽取的领域技术三元组生成领域技术树。
7、在一种改进的基于大模型知识推理的领域技术树生成方法中,还包括:
8、步骤5:在确定本次抽取的下游技术关键词需要增加子节点时,将本次抽取的下游技术关键词作为领域技术关键词,跳转至步骤1。
9、在一种改进的基于大模型知识推理的领域技术树生成方法中,步骤1包括:
10、步骤1-1:利用领域技术关键词,检索互联网和/或领域专业知识库,得到检索内容;
11、步骤1-2:根据与领域技术关键词的相关程度对检索内容进从高到低排序,取排序在前设定数量的检索内容作为候选检索内容;
12、步骤1-3:对候选检索内容进行去重过滤操作和格式解析,生成统一格式的候选检索内容。
13、在一种改进的基于大模型知识推理的领域技术树生成方法中,步骤2包括:
14、步骤2-1:遍历候选检索数据集中的候选检索内容,其中,所有候选检索内容构成候选检索数据集;
15、步骤2-2:将候选检索内容与其对应的领域技术关键词组成关键技术对,利用提示工程将关键技术对组成第一提示问题;
16、步骤2-3:将第一提示问题作为第一任务指令,输入领域大模型,得到关于该候选检索内容和领域技术关键词是否匹配的回答;
17、步骤2-4:将回答为匹配的候选检索内容作为高价值候选检索内容。
18、在一种改进的基于大模型知识推理的领域技术树生成方法中,步骤3包括:
19、步骤3-1:构建关系集合,其中,关系集合中包含表征上下位关系的谓语关键词;
20、步骤3-2:遍历高价值候选数据集中的高价值候选检索内容,其中,所有高价值候选检索内容构成高价值候选数据集;
21、步骤3-3:基于高价值候选检索内容,基于高价值候选检索内容,利用提示工程,以与该高价值候选检索内容对应的领域技术关键词为主语,关系集合内任意具有“包含”语义的词汇作为谓语,组成第二提示问题;
22、步骤3-4:将第二提示问题作为第二任务指令,输入领域大模型判断高价值候选内容中是否存在符合三元组技术关系的谓语,在判断结果为存在时,生成匹配的领域技术三元组作为回答。
23、另一方面,提供了一种基于大模型知识推理的领域技术树生成装置,包括:
24、数据检索模块,用于利用领域技术关键词对互联网和/或领域专业知识库进行检索,得到候选检索内容;
25、高价值内容筛选模块,用于利用所述候选检索内容和所述领域技术关键词构建第一任务指令,调用领域大模型对该第一任务指令中候选检索内容与技术关键词的相关性进行判断,得到高价值候选检索内容;
26、技术三元组抽取模块,用于利用所述高价值候选检索内容和所述领域技术关键词构建第二任务指令,调用领域大模型从该第二任务指令的高价值候选检索内容中抽取领域技术三元组,其中,领域技术三元组以领域技术关键词为主语,以关系集合内任意具有“包含”语义的词汇作为谓语,以下游技术关键词或者依赖技术关键词作为宾语;和
27、领域技术树生成模块,用于利用抽取的领域技术三元组生成领域技术树。
28、在一种改进的基于大模型知识推理的领域技术树生成装置中,还包括:
29、领域技术树展示模块,用于在确定本次抽取的下游技术关键词需要增加子节点时,将本次抽取的下游技术关键词作为领域技术关键词,触发所述数据检索模块。
30、在一种改进的基于大模型知识推理的领域技术树生成装置中,所述数据检索模块,包括:检索单元、排序单元和过滤单元;
31、所述检索单元,用于利用领域技术关键词,检索互联网和/或领域专业知识库,得到检索内容;
32、所述排序单元,用于根据与领域技术关键词的相关程度对检索内容进从高到低排序,取排序在前设定数量的检索内容作为候选检索内容;
33、所述过滤单元,用于对候选检索内容进行去重过滤操作和格式解析,生成统一格式的候选检索内容。
34、在一种改进的基于大模型知识推理的领域技术树生成装置中,所述高价值内容筛选模块包括:遍历单元、第一提示问题组成单元、匹配单元和高价值内容构建单元;
35、所述遍历单元,用于遍历候选检索数据集中的候选检本文档来自技高网...
【技术保护点】
1.一种基于大模型知识推理的领域技术树生成方法,包括:
2.根据权利要求1所述的基于大模型知识推理的领域技术树生成方法,其特征在于,还包括:
3.根据权利要求1所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤1包括:
4.根据权利要求1-3任一所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤2包括:
5.根据权利要求4所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤3包括:
6.一种基于大模型知识推理的领域技术树生成装置,其特征在于,包括:
7.根据权利要求6所述的基于大模型知识推理的领域技术树生成装置,其特征在于,还包括:
8.根据权利要求6所述的基于大模型知识推理的领域技术树生成装置,其特征在于,所述数据检索模块,包括:检索单元、排序单元和过滤单元;
9.根据权利要求6-8任一所述的基于大模型知识推理的领域技术树生成装置,其特征在于,所述高价值内容筛选模块包括:遍历单元、第一提示问题组成单元、匹配单元和高价值内容构建单元;
10
...【技术特征摘要】
1.一种基于大模型知识推理的领域技术树生成方法,包括:
2.根据权利要求1所述的基于大模型知识推理的领域技术树生成方法,其特征在于,还包括:
3.根据权利要求1所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤1包括:
4.根据权利要求1-3任一所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤2包括:
5.根据权利要求4所述的基于大模型知识推理的领域技术树生成方法,其特征在于,步骤3包括:
6.一种基于大模型知识推理的领域技术树生成装置,其特征在于,包括:
7.根据权利要求6所述...
【专利技术属性】
技术研发人员:胡明昊,闫天伟,耿国桐,罗威,罗准辰,谭玉珊,田昌海,
申请(专利权)人:中国人民解放军军事科学院军事科学信息研究中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。