基于生成式预训练GPT模型的交互意图信息确定方法技术

技术编号:37799803 阅读:9 留言:0更新日期:2023-06-09 09:29
本申请公开了一种基于生成式预训练GPT模型的交互意图信息确定方法,涉及智慧家庭技术领域,该基于生成式预训练GPT模型的交互意图信息确定方法包括:获取目标对象与智能语音设备进行交互时的原始交互信息;将原始交互信息输入至目标生成式预训练GPT模型,并通过目标生成式预训练GPT模型中的N个编码器中的各个编码器对原始交互信息进行编码,得到N个编码特征向量;基于N个编码特征向量,得到合并特征向量;通过目标生成式预训练GPT模型中的解码器对合并特征向量进行解码,得到目标解码结果;根据目标解码结果,确定目标对象的交互意图信息,采用上述技术方案,解决了如何准确识别用户交互意图的技术问题。别用户交互意图的技术问题。别用户交互意图的技术问题。

【技术实现步骤摘要】
基于生成式预训练GPT模型的交互意图信息确定方法


[0001]本申请涉及智慧家庭
,具体而言,涉及一种基于生成式预训练GPT模型的交互意图信息确定方法。

技术介绍

[0002]目前,随着物联网技术的不断更新迭代,越来越多的联网设备基本都已实现与用户进行交互的功能。随着设备类型和设备数量的激增,用户面对品类丰富的交互设备,也对设备交互的体验感提出了更高的要求,例如用户希望设备能够更准确的识别出用户意图,也即是需要提高意图识别模型的识别能力。但目前的模型结构比较单一,一般是通过消耗大型服务器的算力对意图识别模型进行训练,这种单一模型结构不能在训练过程中灵活调整训练策略,导致模型的识别范畴较小,在多情境下与用户交互时,不能准确识别用户的交互意图。
[0003]相关技术中,存在如何解决准确识别用户交互意图的技术问题。
[0004]针对相关技术中,如何解决准确识别用户交互意图的技术问题,尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种基于生成式预训练GPT模型的交互意图信息确定方法,以至少解决相关技术中,如何准确识别用户交互意图的技术问题。
[0006]根据本申请实施例的一个实施例,提供了一种基于生成式预训练GPT模型的交互意图信息确定方法,包括:获取目标对象与智能语音设备进行交互时的原始交互信息;将所述原始交互信息输入至目标生成式预训练GPT模型,并通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,其中,N为大于或等于2的正整数;对所述N个编码特征向量进行合并,得到合并特征向量;通过所述目标生成式预训练GPT模型中的解码器对所述合并特征向量进行解码,得到目标解码结果;根据所述目标解码结果,确定所述目标对象的交互意图信息。
[0007]在一个示例性实施例中,在将所述原始交互信息输入至目标生成式预训练GPT模型之前,所述方法还包括:在所述原始交互信息属于预设交互信息数据库的情况下,从所述预设交互信息数据库中获取所述原始交互信息的交互类型,其中,所述预设交互信息数据库用于存储多个交互类型的交互信息;将与所述原始交互信息的交互类型对应的GPT模型确定为所述目标生成式预训练GPT模型,其中,不同交互类型对应不同的GPT模型。
[0008]在一个示例性实施例中,在将所述原始交互信息输入至目标生成式预训练GPT模型之前,所述方法还包括:在所述原始交互信息不属于预设交互信息数据库的情况下,对所述原始交互信息进行处理,得到目标交互信息;在所述目标交互信息属于所述预设交互信息数据库的情况下,将与所述目标交互信息的交互类型对应的GPT模型确定为所述目标生成式预训练GPT模型。
[0009]在一个示例性实施例中,所述对所述原始交互信息进行处理,得到目标交互信息,包括:获取与所述原始交互信息的交互类型对应的预设交互信息数据库,其中,所述预设交互信息数据库包括目标交互信息集合;提取所述原始交互信息中的目标关键词;在所述目标交互信息集合中确定与所述目标关键词关联的交互信息,得到一组交互信息,并获取所述一组交互信息中的各个交互信息在所述预设交互信息数据库中出现的次数;将所述一组交互信息中出现的所述次数最高的交互信息确定为所述目标交互信息。
[0010]在一个示例性实施例中,所述对所述原始交互信息进行处理,得到目标交互信息,包括:获取与所述原始交互信息的交互类型对应的预设交互信息数据库,其中,所述预设交互信息数据库包括目标交互信息集合;提取所述原始交互信息的原始意图信息;在所述目标交互信息集合中确定意图信息与所述原始意图信息关联的交互信息,得到一组交互信息,并获取所述一组交互信息中的各个交互信息在所述预设交互信息数据库中出现的次数;将所述一组交互信息中出现的所述次数最高的交互信息确定为所述目标交互信息;或者,在所述目标交互信息集合中确定意图信息与所述原始意图信息的关联度最高的交互信息,得到所述目标交互信息。
[0011]在一个示例性实施例中,通过以下方式对原始GPT模型进行训练,得到所述目标生成式预训练GPT模型:将所述智能语音设备对应的历史交互信息确定为训练样本集合,其中,所述历史交互信息包括i个批次的历史交互语句,所述i个批次的历史交互语句中的每一个批次的历史交互语句均对应于第一类型标签交互语句,和/或第二类型标签交互语句,所述i为正整数;将所述训练样本集合中的第i个批次的历史交互语句输入到第i

1轮迭代训练得到的GPT模型中,并将所述第i个批次的历史交互语句对应的第一类型标签交互语句确定为所述第i

1轮迭代训练得到的GPT模型的输出结果,得到所述目标生成式预训练GPT模型;和/或,将所述训练样本集合中的第i个批次的历史交互语句输入到第i

1轮迭代训练得到的GPT模型中,并将所述第i个批次的历史交互语句对应的第二类型标签交互语句确定为所述第i

1轮迭代训练得到的GPT模型的输出结果,得到所述目标生成式预训练GPT模型。
[0012]在一个示例性实施例中,通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,包括:从所述目标生成式预训练GPT模型中的N个编码器中分别确定出在本地运行的第一编码器和在服务器上运行的第二编码器;根据编码器调整指令调整所述第一编码器的第一编码参数,控制所述第一编码器根据调整后的第一编码参数对所述原始交互信息进行编码,并控制所述第二编码器按照第二编码参数对所述原始交互信息进行编码,得到所述N个编码特征向量;其中,所述第一编码参数为可调参数,所述第二编码参数为固定参数。
[0013]在一个示例性实施例中,通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,包括:从所述目标生成式预训练GPT模型中的N个编码器中分别确定出在本地运行的第一编码器和在服务器上运行的第二编码器;控制所述第一编码器根据第一编码参数对所述原始交互信息进行编码,并控制所述第二编码器按照第二编码参数对所述原始交互信息进行编码,得到所述N个编码特征向量;其中,所述第一编码参数为可调参数,所述第二编码参数为固定参数。
[0014]在一个示例性实施例中,所述对所述N个编码特征向量进行合并,得到合并特征向量,包括:比较所述N个编码特征向量的每一个编码特征向量的向量维度,确定出具有最大
向量维度的第一编码特征向量;在所述N个编码特征向量中存在小于所述最大向量维度的编码特征向量的情况下,将所述小于所述最大向量维度的编码特征向量确定为第二编码特征向量;对所述第二编码特征向量进行线性变换,得到线性变换后的第二编码特征向量,其中,所述第二编码特征向量的向量维度等于所述最大向量维度;对所述第一编码特征向量与第二编码特征向量进行相加,得到所述合并特征向量。
[0015]在一个示例性实施例中,所述对所述N个编码特征向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,包括:获取目标对象与智能语音设备进行交互时的原始交互信息;将所述原始交互信息输入至目标生成式预训练GPT模型,并通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,其中,N为大于或等于2的正整数;对所述N个编码特征向量进行合并,得到合并特征向量;通过所述目标生成式预训练GPT模型中的解码器对所述合并特征向量进行解码,得到目标解码结果;根据所述目标解码结果,确定所述目标对象的交互意图信息。2.根据权利要求1所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,在将所述原始交互信息输入至目标生成式预训练GPT模型之前,所述方法还包括:在所述原始交互信息属于预设交互信息数据库的情况下,从所述预设交互信息数据库中获取所述原始交互信息的交互类型,其中,所述预设交互信息数据库用于存储多个交互类型的交互信息;将与所述原始交互信息的交互类型对应的GPT模型确定为所述目标生成式预训练GPT模型,其中,不同交互类型对应不同的GPT模型。3.根据权利要求1所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,在将所述原始交互信息输入至目标生成式预训练GPT模型之前,所述方法还包括:在所述原始交互信息不属于预设交互信息数据库的情况下,对所述原始交互信息进行处理,得到目标交互信息;在所述目标交互信息属于所述预设交互信息数据库的情况下,将与所述目标交互信息的交互类型对应的GPT模型确定为所述目标生成式预训练GPT模型。4.根据权利要求3所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,所述对所述原始交互信息进行处理,得到目标交互信息,包括:获取与所述原始交互信息的交互类型对应的预设交互信息数据库,其中,所述预设交互信息数据库包括目标交互信息集合;提取所述原始交互信息中的目标关键词;在所述目标交互信息集合中确定与所述目标关键词关联的交互信息,得到一组交互信息,并获取所述一组交互信息中的各个交互信息在所述预设交互信息数据库中出现的次数;将所述一组交互信息中出现的所述次数最高的交互信息确定为所述目标交互信息。5.根据权利要求3所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,所述对所述原始交互信息进行处理,得到目标交互信息,包括:获取与所述原始交互信息的交互类型对应的预设交互信息数据库,其中,所述预设交互信息数据库包括目标交互信息集合;提取所述原始交互信息的原始意图信息;在所述目标交互信息集合中确定意图信息与所述原始意图信息关联的交互信息,得到一组交互信息,并获取所述一组交互信息中的各个交互信息在所述预设交互信息数据库中出现的次数;
将所述一组交互信息中出现的所述次数最高的交互信息确定为所述目标交互信息;或者,在所述目标交互信息集合中确定意图信息与所述原始意图信息的关联度最高的交互信息,得到所述目标交互信息。6.根据权利要求1至5任一项所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,通过以下方式对原始GPT模型进行训练,得到所述目标生成式预训练GPT模型:将所述智能语音设备对应的历史交互信息确定为训练样本集合,其中,所述历史交互信息包括i个批次的历史交互语句,所述i个批次的历史交互语句中的每一个批次的历史交互语句均对应于第一类型标签交互语句,和/或第二类型标签交互语句,所述i为正整数;将所述训练样本集合中的第i个批次的历史交互语句输入到第i

1轮迭代训练得到的GPT模型中,并将所述第i个批次的历史交互语句对应的第一类型标签交互语句确定为所述第i

1轮迭代训练得到的GPT模型的输出结果,得到所述目标生成式预训练GPT模型;和/或,将所述训练样本集合中的第i个批次的历史交互语句输入到第i

1轮迭代训练得到的GPT模型中,并将所述第i个批次的历史交互语句对应的第二类型标签交互语句确定为所述第i

1轮迭代训练得到的GPT模型的输出结果,得到所述目标生成式预训练GPT模型。7.根据权利要求1所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,包括:从所述目标生成式预训练GPT模型中的N个编码器中分别确定出在本地运行的第一编码器和在服务器上运行的第二编码器;根据编码器调整指令调整所述第一编码器的第一编码参数,控制所述第一编码器根据调整后的第一编码参数对所述原始交互信息进行编码,并控制所述第二编码器按照第二编码参数对所述原始交互信息进行编码,得到所述N个编码特征向量;其中,所述第一编码参数为可调参数,所述第二编码参数为固定参数。8.根据权利要求1所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,通过所述目标生成式预训练GPT模型中的N个编码器中的各个编码器对所述原始交互信息进行编码,得到N个编码特征向量,包括:从所述目标生成式预训练GPT模型中的N个编码器中分别确定出在本地运行的第一编码器和在服务器上运行的第二编码器;控制所述第一编码器根据第一编码参数对所述原始交互信息进行编码,并控制所述第二编码器按照第二编码参数对所述原始交互信息进行编码,得到所述N个编码特征向量;其中,所述第一编码参数为可调参数,所述第二编码参数为固定参数。9.根据权利要求1所述的基于生成式预训练GPT模型的交互意图信息确定方法,其特征在于,所述对所述N个编码特征向量进行合...

【专利技术属性】
技术研发人员:赵培邓邱伟田云龙王淼
申请(专利权)人:青岛海尔科技有限公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1