System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种结合智能模型和知识图谱的自然语言处理方法与系统技术方案_技高网

一种结合智能模型和知识图谱的自然语言处理方法与系统技术方案

技术编号:41531038 阅读:6 留言:0更新日期:2024-06-03 23:07
本发明专利技术提出一种结合智能模型和知识图谱的自然语言处理方法与系统,属于人机智能交互技术领域。根据用户输入的会话内容,结合知识图谱和智能模型生成自然语言,作为所述会话内容的响应,从而实现人机只能对话。本发明专利技术实现了对自然语言文本的准确理解和响应,解决了单独使用智能模型未结合领域知识所带来的问题。

【技术实现步骤摘要】

本专利技术属于人机智能交互,尤其涉及一种结合智能模型和知识图谱的自然语言处理方法与系统


技术介绍

1、大模型(智能模型)是指具有超大规模参数的深度神经网络模型,如gpt-3、palm等,它们能够在海量的无标注文本数据上进行自监督预训练,从而学习到丰富的语言知识和通用能力,进而在各种自然语言处理任务上实现强大的迁移学习和微调效果。

2、知识图谱是一种结构化的知识表示方法,它以实体为节点,以关系为边,构建了一个多元图,能够描述世界中的各种事物及其相互联系。知识图谱可以提供丰富的语义信息和逻辑推理能力,从而增强自然语言处理系统的理解和生成能力。


技术实现思路

1、本专利技术提出一种结合智能模型和知识图谱的自然语言处理方案,目的在于实现对自然语言文本的高效理解和生成。

2、本专利技术第一方面提出一种结合智能模型和知识图谱的自然语言处理方法。所述方法包括:

3、步骤s1、针对多个
,分别构建与所述
对应的知识图谱,并将多个所述知识图谱存储至知识库,所述知识图谱包括实体、关系和属性,且所述知识图谱具备查询功能;

4、步骤s2、获取所述多个
的样本数据,利用所述样本数据训练智能模型,经训练的智能模型用于与用户进行语言交互;

5、步骤s3、经训练的智能模型接收所述用户输入的文本内容,从所述文本内容中识别出所述文本内容涉及的
,并从所述知识库中查找与所述
对应的知识图谱,获取所述知识图谱中所有关系的名称;p>

6、步骤s4、基于所述所有关系和所述文本内容,确定与所述文本内容相关的关系和对应的实体,在所述知识图谱中查询与所述文本内容相关的关系和所述对应的实体,每一条查询均返回对应的三元组,所述三元组包括实体、关系和属性;

7、步骤s5、所述经训练的智能模型从返回的若干个三元组中确定与所述文本内容对应的三元组,并将所述对应的三元组以自然语言表述的方式反馈至所述用户。

8、根据本专利技术第一方面的方法,在所述步骤s1中,针对某一
,采集所述某一
内的数据,至少包括文本、结构化数据、半结构化数据、图像、音频,并对所述某一
内的数据进行清洗和标准化处理,以文本分词、实体识别、关系抽取的方式对所述某一
内的数据进行自然语言处理,从而构建包含实体、关系和属性的知识图谱;其中:所述知识图谱具备查询接口,支持基于检索关键词的检索语句查询。

9、根据本专利技术第一方面的方法,在所述步骤s2中:

10、对所述样本数据进行清洗、去噪和标记,并将所述样本数据划分为训练集、验证集和测试集;

11、所述智能模型采用神经网络架构,初始化所述智能模型,使其具有预训练的模型参数,在所述训练集上迭代所述智能模型,利用优化器不断更新所述智能模型的模型参数,从而最小化损失函数;

12、在所述验证集上监控所述智能模型的语言交互性能,利用正则化技术来抵消过拟合效应,在所述测试集上对所述智能模型的语言交互性能进行评估,评估分数高于阈值时完成对所述智能模型的训练。

13、根据本专利技术第一方面的方法,在所述步骤s3中,获取所述知识图谱中所有关系的名称,具体包括:调用所述知识图谱的建表语句,利用所述建表语句构建用于获取所述知识图谱中所有关系的名称的函数语句,并基于所述函数语句进行关系抽取。

14、根据本专利技术第一方面的方法,在所述步骤s4中,在所述知识图谱中查询与所述文本内容相关的关系和所述对应的实体,具体包括:构造用于查询与所述文本内容相关的关系和所述对应的实体的查询语句,通过所述查询语句查询到与所述文本内容相关的关系和所述对应的实体,提取与所述文本内容相关的关系所对应的三元组,以及提取所述对应的实体所对应的三元组,返回各个三元组。

15、本专利技术第二方面提出一种结合智能模型和知识图谱的自然语言处理系统。所述系统包括处理单元,所述处理单元被配置为执行:

16、步骤s1、针对多个
,分别构建与所述
对应的知识图谱,并将多个所述知识图谱存储至知识库,所述知识图谱包括实体、关系和属性,且所述知识图谱具备查询功能;

17、步骤s2、获取所述多个
的样本数据,利用所述样本数据训练智能模型,经训练的智能模型用于与用户进行语言交互;

18、步骤s3、经训练的智能模型接收所述用户输入的文本内容,从所述文本内容中识别出所述文本内容涉及的
,并从所述知识库中查找与所述
对应的知识图谱,获取所述知识图谱中所有关系的名称;

19、步骤s4、基于所述所有关系和所述文本内容,确定与所述文本内容相关的关系和对应的实体,在所述知识图谱中查询与所述文本内容相关的关系和所述对应的实体,每一条查询均返回对应的三元组,所述三元组包括实体、关系和属性;

20、步骤s5、所述经训练的智能模型从返回的若干个三元组中确定与所述文本内容对应的三元组,并将所述对应的三元组以自然语言表述的方式反馈至所述用户。

21、根据本专利技术第二方面的系统,在所述步骤s1中,针对某一
,采集所述某一
内的数据,至少包括文本、结构化数据、半结构化数据、图像、音频,并对所述某一
内的数据进行清洗和标准化处理,以文本分词、实体识别、关系抽取的方式对所述某一
内的数据进行自然语言处理,从而构建包含实体、关系和属性的知识图谱;其中:所述知识图谱具备查询接口,支持基于检索关键词的检索语句查询。

22、根据本专利技术第二方面的系统,在所述步骤s2中:

23、对所述样本数据进行清洗、去噪和标记,并将所述样本数据划分为训练集、验证集和测试集;

24、所述智能模型采用神经网络架构,初始化所述智能模型,使其具有预训练的模型参数,在所述训练集上迭代所述智能模型,利用优化器不断更新所述智能模型的模型参数,从而最小化损失函数;

25、在所述验证集上监控所述智能模型的语言交互性能,利用正则化技术来抵消过拟合效应,在所述测试集上对所述智能模型的语言交互性能进行评估,评估分数高于阈值时完成对所述智能模型的训练。

26、根据本专利技术第二方面的系统,在所述步骤s3中,获取所述知识图谱中所有关系的名称,具体包括:调用所述知识图谱的建表语句,利用所述建表语句构建用于获取所述知识图谱中所有关系的名称的函数语句,并基于所述函数语句进行关系抽取。

27、根据本专利技术第二方面的系统,在所述步骤s4中,在所述知识图谱中查询与所述文本内容相关的关系和所述对应的实体,具体包括:构造用于查询与所述文本内容相关的关系和所述对应的实体的查询语句,通过所述查询语句查询到与所述文本内容相关的关系和所述对应的实体,提取与所述文本内容相关的关系所对应的三元组,以及提取所述对应的实体所对应的三元组,返回各个三元组。

28、本专利技术第三方面公开了一种电子设备。所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所本文档来自技高网...

【技术保护点】

1.一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤S1中,针对某一技术领域,采集所述某一技术领域内的数据,至少包括文本、结构化数据、半结构化数据、图像、音频,并对所述某一技术领域内的数据进行清洗和标准化处理,以文本分词、实体识别、关系抽取的方式对所述某一技术领域内的数据进行自然语言处理,从而构建包含实体、关系和属性的知识图谱;其中:所述知识图谱具备查询接口,支持基于检索关键词的检索语句查询。

3.根据权利要求2所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤S2中:

4.根据权利要求3所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤S3中,获取所述知识图谱中所有关系的名称,具体包括:调用所述知识图谱的建表语句,利用所述建表语句构建用于获取所述知识图谱中所有关系的名称的函数语句,并基于所述函数语句进行关系抽取。

5.根据权利要求4所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤S4中,在所述知识图谱中查询与所述文本内容相关的关系和所述对应的实体,具体包括:构造用于查询与所述文本内容相关的关系和所述对应的实体的查询语句,通过所述查询语句查询到与所述文本内容相关的关系和所述对应的实体,提取与所述文本内容相关的关系所对应的三元组,以及提取所述对应的实体所对应的三元组,返回各个三元组。

6.一种结合智能模型和知识图谱的自然语言处理系统,其特征在于,所述系统包括处理单元,所述处理单元被配置为执行:

7.根据权利要求6所述的一种结合智能模型和知识图谱的自然语言处理系统,其特征在于:

8.根据权利要求7所述的一种结合智能模型和知识图谱的自然语言处理系统,其特征在于:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1-5任一项所述的一种结合智能模型和知识图谱的自然语言处理方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-5任一项所述的一种结合智能模型和知识图谱的自然语言处理方法中的步骤。

...

【技术特征摘要】

1.一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤s1中,针对某一技术领域,采集所述某一技术领域内的数据,至少包括文本、结构化数据、半结构化数据、图像、音频,并对所述某一技术领域内的数据进行清洗和标准化处理,以文本分词、实体识别、关系抽取的方式对所述某一技术领域内的数据进行自然语言处理,从而构建包含实体、关系和属性的知识图谱;其中:所述知识图谱具备查询接口,支持基于检索关键词的检索语句查询。

3.根据权利要求2所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤s2中:

4.根据权利要求3所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤s3中,获取所述知识图谱中所有关系的名称,具体包括:调用所述知识图谱的建表语句,利用所述建表语句构建用于获取所述知识图谱中所有关系的名称的函数语句,并基于所述函数语句进行关系抽取。

5.根据权利要求4所述的一种结合智能模型和知识图谱的自然语言处理方法,其特征在于,在所述步骤s4中,在所...

【专利技术属性】
技术研发人员:尹俊平靳奇
申请(专利权)人:上海张江数学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1