System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型的氟橡胶领域知识图谱构建方法技术_技高网

一种基于大语言模型的氟橡胶领域知识图谱构建方法技术

技术编号:44677200 阅读:1 留言:0更新日期:2025-03-19 20:30
本发明专利技术提供了一种基于大语言模型的氟橡胶领域知识图谱构建方法,包括:获取氟橡胶领域的工艺相关知识数据,并进行分类,得到氟橡胶领域分类知识数据;基于预设的ChatGLM模型,根据氟橡胶领域分类知识数据进行知识抽取,以提取关键实体与关系;利用语义相关性与上下文关联分析对关键实体与关系进行深度分析,通过语义相似度和关联强度来增强关键实体与关系中知识的连接性,得到融合知识数据;利用ChatGLM模型对融合知识数据进行解释和扩充,得到扩充后的三元组数据;对三元组数据进行知识融合,并使用Neo4j数据库进行图谱储存,得到知识图谱。本发明专利技术通过大语言模型自动化知识抽取和处理,显著提高了知识图谱构建的效率,减少了人工标注和数据处理的时间成本。

【技术实现步骤摘要】

本专利技术涉及知识图谱,特别是涉及一种基于大语言模型的氟橡胶领域知识图谱构建方法


技术介绍

1、随着互联网和移动互联网的迅猛发展,各类网络服务应用层出不穷,网络数据量呈现出指数级增长。2012年,谷歌率先提出了知识图谱的概念,将其定义为实体及其关系的表达方式。知识图谱能够有效应对大规模数据处理的挑战,促进各个领域的数据探索、洞察与决策制定,在商业、科研、社交媒体和新闻等方面发挥了重要作用。知识图谱可分为通用知识图谱和领域知识图谱。通用知识图谱面向开放领域,典型实例包括谷歌的“知识图谱”、搜狗的“知识立方体”、yago和dbpedia等。然而,通用知识图谱数据多源于维基百科,难以构建一个完整的全局本体。相比之下,领域知识图谱更侧重于专业知识的描述,在特定行业中表现出更高的针对性,如军事、公安、交通、医疗等领域,适用于复杂的应用分析和辅助决策。这类知识图谱的构建需要专家深度参与,知识结构复杂,质量要求高,粒度精细。例如,“星河”知识图谱作为军事领域的知识图谱,涵盖暗网数据、互联网数据、传统数据库和军事书籍等多种来源,包含10万多条装备实体数据和330个军事本体类别。其他典型的领域知识图谱还包括ibm watson health医疗知识图谱、海致星图金融知识图谱和海信交管云脑交通知识图谱。

2、各行业的研究人员已广泛探索了构建知识图谱的各种方法。在化工领域,尽管已有部分相关研究,但仍处于初步阶段。例如,在化学品安全领域的智能答疑系统中,研究者结合了nb(朴素贝叶斯)算法和bertbilstm-crf模型,构建了一个多分类器来完成问题分类任务,从而搭建知识图谱问答系统。pranav shetty使用240万个材料科学摘要训练了materialsbert语言模型,并对提取的数据进行了分析应用,涵盖燃料电池、超级电容器和聚合物太阳能电池领域,可用于查找摘要中记录的材料属性数据。文本挖掘与自然语言处理(nlp)技术的快速发展,使得科学文本向知识图谱数据集合的转换成为可能。通过将训练好的ner模型应用于聚合物摘要,并结合启发式规则与nlp模型的预测,可以从这些摘要中提取材料属性数据。weiren wang则引入了一种nlp模型,用于从有机和无机化合物、超级合金和铝合金的期刊文章中自动提取化学成分和性质数据,并通过数据科学确定最佳合成设计路线,从指定的起始材料中生产所需合金。

3、随着现代军用装备朝着高可靠性方向发展,高性能氟橡胶及其制品的需求日益迫切。然而,氟橡胶领域的基础研究较少、产品种类有限,且缺乏体系化的知识管理,导致研发进程缓慢。知识图谱凭借其强大的语义表达、存储和推理能力,为互联网时代的化工数据管理和智能应用提供了有效的解决方案。作为人工智能技术的重要组成部分,知识图谱已在医疗、电力、金融等专业领域得到广泛应用,其优势在于处理庞大数据、构建丰富的语义关系、确保高质量表达,并提供用户友好的结构。因此,知识图谱可用于表达氟橡胶研究中的专业知识。然而,由于氟橡胶领域的知识复杂且多样,目前尚无标准化的方法论来构建相关知识图谱。此外,现有的知识图谱尚未充分反映实体之间的相关性或相似性,这使得查询相关信息变得困难。


技术实现思路

1、为了克服现有技术的不足,本专利技术的目的是提供一种基于大语言模型的氟橡胶领域知识图谱构建方法,通过大语言模型自动化知识抽取和处理,显著提高了知识图谱构建的效率,减少了人工标注和数据处理的时间成本。

2、为实现上述目的,本专利技术提供了如下方案:

3、一种基于大语言模型的氟橡胶领域知识图谱构建方法,包括:

4、获取氟橡胶领域的工艺相关知识数据,并对所述工艺相关知识数据进行分类,得到氟橡胶领域分类知识数据;

5、基于预设的chatglm模型,根据所述氟橡胶领域分类知识数据进行知识抽取,以提取关键实体与关系;

6、利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据;

7、利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三元组数据;

8、对所述三元组数据进行知识融合,并使用neo4j数据库进行图谱储存,得到构建好的知识图谱。

9、优选地,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。

10、优选地,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。

11、优选地,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。

12、优选地,所述关系的标注类别包括:性能、制备、步骤、配方、方法和其他。

13、优选地,利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据,包括:

14、使用text2vec-large-chinese模型将所述关键实体对应的氟橡胶关键词的定义转化为特征向量;

15、基于所述特征向量,通过余弦相似度计算所述氟橡胶关键词间的语义相似度;

16、根据所述氟橡胶关键词构建关键词共现矩阵;

17、基于所述关键词共现矩阵,使用点互信息公式计算所述氟橡胶关键词间的关联强度;

18、根据所述语义相似度和所述关联强度进行知识融合,得到实体匹配后的所述融合知识数据。

19、优选地,利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三元组数据,包括:

20、利用chatglm模型和预设的提示词对所述融合知识数据进行解释,得到解释结果;

21、基于所述解释结果,根据chatglm模型生成相关的新实体及关系;

22、根据所述新实体及关系对于所述融合知识数据进行扩充,得到扩充后的三元组数据。

23、优选地,对所述三元组数据进行知识融合,并使用neo4j数据库进行图谱储存,得到构建好的知识图谱,包括:

24、将所述扩充后的三元组数据进行整合,得到知识融合后的三元组数据;

25、基于neo4j数据库,将所述知识融合后的三元组数据进行图谱储存,得到构建好的知识图谱。

26、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:

27、本专利技术提供了一种基于大语言模型的氟橡胶领域知识图谱构建方法,包括:获取氟橡胶领域的工艺相关知识数据,并对所述工艺相关知识数据进行分类,得到氟橡胶领域分类知识数据;基于预设的chatglm模型,根据所述氟橡胶领域分类知识数据进行知识抽取,以提取关键实体与关系;利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据;利用所述chatglm模型对所述融合知识数据进行解释和扩充,得到扩充后的三本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。

3.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。

4.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。

5.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关系的标注类别包括:性能、制备、步骤、配方、方法和其他。

6.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,利用语义相关性与上下文关联分析对所述关键实体与关系进行深度分析,通过语义相似度和关联强度来增强所述关键实体与关系中知识的连接性,得到融合知识数据,包括:

7.根据权利要求6所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,利用所述ChatGLM模型对所述融合知识数据进行解释和扩充,得到扩充后的三元组数据,包括:

8.根据权利要求6所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,对所述三元组数据进行知识融合,并使用Neo4j数据库进行图谱储存,得到构建好的知识图谱,包括:

...

【技术特征摘要】

1.一种基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述工艺相关知识数据是通过专业书籍、专业数据库以及专家知识中获取得到的。

3.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述氟橡胶领域分类知识数据包括:氟橡胶基础知识数据、氟橡胶配方数据和氟橡胶工艺过程数据。

4.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关键实体的标注类别包括:橡胶、原料、描述、配方和实施例。

5.根据权利要求1所述的基于大语言模型的氟橡胶领域知识图谱构建方法,其特征在于,所述关...

【专利技术属性】
技术研发人员:吴亚东苟于朗彭莉娟李慧林周骏褚琦凯刘吉玲刘宇伏宏伟刘雅仙彭耀霆
申请(专利权)人:四川轻化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1