System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大模型的语义优化方法、系统、终端及存储介质技术方案_技高网

基于大模型的语义优化方法、系统、终端及存储介质技术方案

技术编号:43352914 阅读:2 留言:0更新日期:2024-11-19 17:40
本发明专利技术提供了一种基于大模型的语义优化方法、系统、终端及存储介质,该方法包括:获取人机语料数据,并根据所述人机语料数据对大模型进行训练;获取人机交互日志,并根据训练后的所述大模型对所述人机交互日志进行语义标注;根据语义标注结果确定优化语料,并根据所述优化语料对所述人机语料数据进行语义优化。本发明专利技术实施例,通过人机语料数据对大模型进行训练,使得训练后的大模型能有效地对人机交互日志进行语义标注,无需采用人工的方式进行语义标注,基于语义标注结果能自动确定优化语料,无需采用人工的方式进行优化语料的选择,提高了语义优化效率,基于优化语料能自动对人机语料数据进行语义优化,进一步提高了语义优化效率。

【技术实现步骤摘要】

本专利技术涉及人机交互,尤其涉及一种基于大模型的语义优化方法、系统、终端及存储介质


技术介绍

1、随着现代科技和计算机技术的不断发展,人们在与机器的信息交流中,不再拘泥人类对机器的键盘操作,而是需要一种更加方便,自然的交互方式,而语言是人类最重要并且最有效的信息源,实现人机之间的语义交互让机器人听得懂人的话也是人类梦寐以求的事情。语义交互系统的发展,使得这一理想得以实现。语义交互系统上线后,为了进一步提升语义理解准确率,更准确地理解用户的意图和需求,以提供更有效的服务,需要持续进行语义优化工作。

2、现有的语义优化过程中,一般采用人工的方式进行优化语料的选择,进而降低了语义优化效率。


技术实现思路

1、本专利技术实施例的目的在于提供一种基于大模型的语义优化方法、系统、终端及存储介质,以解决现有技术中语义优化效率低下的问题。

2、本专利技术实施例是这样实现的,一种基于大模型的语义优化方法,所述方法包括:

3、获取人机语料数据,并根据所述人机语料数据对大模型进行训练;

4、获取人机交互日志,并根据训练后的所述大模型对所述人机交互日志进行语义标注;

5、根据语义标注结果确定优化语料,并根据所述优化语料对所述人机语料数据进行语义优化。

6、优选的,根据训练后的所述大模型对所述人机交互日志进行语义标注,包括:

7、获取所述人机交互日志中的用户语句,并将所述用户语句输入训练后的所述大模型进行意图识别,得到用户意图;

8、根据所述用户意图确定语义标签,并根据所述语义标签对所述用户语句进行语义标注。

9、优选的,根据语义标注结果确定优化语料,包括:

10、若任一所述语义标签与预设标签相匹配,则将所述语义标签对应的所述用户语句设置为目标语句;

11、获取所述目标语句在所述人机交互日志中的语句位置,得到目标位置,并在所述人机交互日志中,根据所述目标位置进行语料划分,得到所述优化语料。

12、优选的,根据所述目标位置进行语料划分,得到所述优化语料之后,还包括:

13、在所述优化语料中,计算相邻所述用户语句之间的语义相似度;

14、若所述语义相似度大于相似度阈值,则根据相邻所述用户语句的语句时间对所述优化语料进行语料筛选。

15、优选的,根据所述优化语料对所述人机语料数据进行语义优化,包括:

16、获取所述优化语料中的机器语句,并根据所述机器语句的语句编码确定所述人机语料数据中的意图集合;

17、将所述优化语料中的所述用户语句添加至所述意图集合中。

18、优选的,根据所述人机语料数据对大模型进行训练,包括:

19、将所述人机语料数据输入所述大模型进行特征编码,得到语料特征,并对所述语料特征进行向量转换,得到语义向量;

20、根据所述大模型对所述语义向量进行分类,得到预测意图,并根据所述预测意图和所述人机语料数据的意图标签计算模型损失;

21、根据所述模型损失对所述大模型进行参数更新,直至所述大模型收敛,得到训练后的所述大模型。

22、优选的,根据所述优化语料对所述人机语料数据进行语义优化之后,还包括:

23、若接收到针对所述语义标注结果的错误指令,则根据语义优化后的所述人机语料数据对训练后的所述大模型进行参数优化。

24、本专利技术实施例的另一目的在于提供一种基于大模型的语义优化系统,所述系统包括:

25、模型训练模块,用于获取人机语料数据,并根据所述人机语料数据对大模型进行训练;

26、语义标注模块,用于获取人机交互日志,并根据训练后的所述大模型对所述人机交互日志进行语义标注;

27、语义优化模块,用于根据语义标注结果确定优化语料,并根据所述优化语料对所述人机语料数据进行语义优化。

28、本专利技术实施例,通过人机语料数据对大模型进行训练,使得训练后的大模型能有效地对人机交互日志进行语义标注,无需采用人工的方式进行语义标注,基于语义标注结果能自动确定优化语料,无需采用人工的方式进行优化语料的选择,提高了语义优化效率,基于优化语料能自动对人机语料数据进行语义优化,进一步提高了语义优化效率。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的语义优化方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于大模型的语义优化方法,其特征在于,根据训练后的所述大模型对所述人机交互日志进行语义标注,包括:

3.如权利要求2所述的基于大模型的语义优化方法,其特征在于,根据语义标注结果确定优化语料,包括:

4.如权利要求3所述的基于大模型的语义优化方法,其特征在于,根据所述目标位置进行语料划分,得到所述优化语料之后,还包括:

5.如权利要求2所述的基于大模型的语义优化方法,其特征在于,根据所述优化语料对所述人机语料数据进行语义优化,包括:

6.如权利要求1所述的基于大模型的语义优化方法,其特征在于,根据所述人机语料数据对大模型进行训练,包括:

7.如权利要求1所述的基于大模型的语义优化方法,其特征在于,根据所述优化语料对所述人机语料数据进行语义优化之后,还包括:

8.一种基于大模型的语义优化系统,其特征在于,所述系统包括:

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于大模型的语义优化方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于大模型的语义优化方法,其特征在于,根据训练后的所述大模型对所述人机交互日志进行语义标注,包括:

3.如权利要求2所述的基于大模型的语义优化方法,其特征在于,根据语义标注结果确定优化语料,包括:

4.如权利要求3所述的基于大模型的语义优化方法,其特征在于,根据所述目标位置进行语料划分,得到所述优化语料之后,还包括:

5.如权利要求2所述的基于大模型的语义优化方法,其特征在于,根据所述优化语料对所述人机语料数据进行语义优化,包括:

6.如权利要求1所述的基于大模型的语义优化方法...

【专利技术属性】
技术研发人员:桂维忠陈吉胜
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1