System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及知识图谱,特别是涉及一种基于大语言模型的氟橡胶领域知识图谱构建方法。
技术介绍
1、随着互联网和移动互联网的迅猛发展,各类网络服务应用层出不穷,网络数据量呈现出指数级增长。2012年,谷歌率先提出了知识图谱的概念,将其定义为实体及其关系的表达方式。知识图谱能够有效应对大规模数据处理的挑战,促进各个领域的数据探索、洞察与决策制定,在商业、科研、社交媒体和新闻等方面发挥了重要作用。知识图谱可分为通用知识图谱和领域知识图谱。通用知识图谱面向开放领域,典型实例包括谷歌的“知识图谱”、搜狗的“知识立方体”、yago和dbpedia等。然而,通用知识图谱数据多源于维基百科,难以构建一个完整的全局本体。相比之下,领域知识图谱更侧重于专业知识的描述,在特定行业中表现出更高的针对性,如军事、公安、交通、医疗等领域,适用于复杂的应用分析和辅助决策。这类知识图谱的构建需要专家深度参与,知识结构复杂,质量要求高,粒度精细。例如,“星河”知识图谱作为军事领域的知识图谱,涵盖暗网数据、互联网数据、传统数据库和军事书籍等多种来源,包含10万多条装备实体数据和330个军事本体类别。其他典型的领域知识图谱还包括ibm watson health医疗知识图谱、海致星图金融知识图谱和海信交管云脑交通知识图谱。
2、各行业的研究人员已广泛探索了构建知识图谱的各种方法。在化工领域,尽管已有部分相关研究,但仍处于初步阶段。例如,在化学品安全领域的智能答疑系统中,研究者结合了nb(朴素贝叶斯)算法和bertbilstm-crf模型,构建了一个多分类
3、随着现代军用装备朝着高可靠性方向发展,高性能氟橡胶及其制品的需求日益迫切。然而,氟橡胶领域的基础研究较少、产品种类有限,且缺乏体系化的知识管理,导致研发进程缓慢。知识图谱凭借其强大的语义表达、存储和推理能力,为互联网时代的化工数据管理和智能应用提供了有效的解决方案。作为人工智能技术的重要组成部分,知识图谱已在医疗、电力、金融等专业领域得到广泛应用,其优势在于处理庞大数据、构建丰富的语义关系、确保高质量表达,并提供用户友好的结构。因此,知识图谱可用于表达氟橡胶研究中的专业知识。然而,由于氟橡胶领域的知识复杂且多样,目前尚无标准化的方法论来构建相关知识图谱。此外,现有的知识图谱尚未充分反映实体之间的相关性或相似性,这使得查询相关信息变得困难。
技术实现思路
1、为了克服现有技术的不足,本专利技术的目的是提供一种基于大语言模型的氟橡胶领域知识图谱构建方法,通过大语言模型自动化知识抽取和处理,显著提高了知识图谱构建的效率,减少了人工标注和数据处理的时间成本。
2、为实现上述目的,本专利技术提供了如下方案:
3、一种基于大语言模型的氟橡胶领域知识图谱构建方法,包括:
4、获取氟橡胶领域的工艺相关知识数据,并对所述工艺相关知识数据进行分类,得到氟橡胶领域分类知识数据;
5、基于预设的chatglm模型,根据所述氟橡胶领域分类知识数据进行知识抽取,以提取关键实体与关系;
6、利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据;
7、利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三元组数据;
8、对所述三元组数据进行知识融合,并使用neo4j数据库进行图谱储存,得到构建好的知识图谱。
9、优选地,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。
10、优选地,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。
11、优选地,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。
12、优选地,所述关系的标注类别包括:性能、制备、步骤、配方、方法和其他。
13、优选地,利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据,包括:
14、使用text2vec-large-chinese模型将所述关键实体对应的氟橡胶关键词的定义转化为特征向量;
15、基于所述特征向量,通过余弦相似度计算所述氟橡胶关键词间的语义相似度;
16、根据所述氟橡胶关键词构建关键词共现矩阵;
17、基于所述关键词共现矩阵,使用点互信息公式计算所述氟橡胶关键词间的关联强度;
18、根据所述语义相似度和所述关联强度进行知识融合,得到实体匹配后的所述融合知识数据。
19、优选地,利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三元组数据,包括:
20、利用chatglm模型和预设的提示词对所述融合知识数据进行解释,得到解释结果;
21、基于所述解释结果,根据chatglm模型生成相关的新实体及关系;
22、根据所述新实体及关系对于所述融合知识数据进行扩充,得到扩充后的三元组数据。
23、优选地,对所述三元组数据进行知识融合,并使用neo4j数据库进行图谱储存,得到构建好的知识图谱,包括:
24、将所述扩充后的三元组数据进行整合,得到知识融合后的三元组数据;
25、基于neo4j数据库,将所述知识融合后的三元组数据进行图谱储存,得到构建好的知识图谱。
26、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
27、本专利技术提供了一种基于大语言模型的氟橡胶领域知识图谱构建方法,包括:获取氟橡胶领域的工艺相关知识数据,并对所述工艺相关知识数据进行分类,得到氟橡胶领域分类知识数据;基于预设的chatglm模型,根据所述氟橡胶领域分类知识数据进行知识抽取,以提取关键实体与关系;利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据;利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三本文档来自技高网...
【技术保护点】
1.一种基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。
3.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。
4.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。
5.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关系的标注类别包括:性能、制备、步骤、配方、方法和其他。
6.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据,包括:
7.根据
8.根据权利要求6所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,对所述三元组数据进行知识融合,并使用Neo4j数据库进行图谱储存,得到构建好的知识图谱,包括:
...【技术特征摘要】
1.一种基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。
3.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。
4.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。
5.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关...
【专利技术属性】
技术研发人员:吴亚东,苟于朗,彭莉娟,李慧,林周骏,褚琦凯,刘吉玲,刘宇,伏宏伟,刘雅仙,彭耀霆,
申请(专利权)人:四川轻化工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。