一种信息处理的方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号：40232151 阅读：11 留言：0更新日期：2024-02-02 22:33

本申请提供一种信息处理的方法、装置、设备和计算机可读存储介质，该方法包括：识别接收的语音指令对应的第一文本信息；通过训练好的第一AI模型和训练好的第二AI模型分别对第一文本信息进行语义理解，得到对应的第一理解结果和第二理解结果；至少基于第一理解结果和第二理解结果，响应语音指令。如此，通过利用训练好的第一AI模型和训练好的第二AI模型同时对第一文本信息进行语义理解，获得两种理解结果，并结合至少两种理解结果对语音指令进行响应，实现了至少两种AI模型的语义理解优势的结合，从而能够快速理解简单文本信息的语义，减少文本信息语义理解的错误，提升车载对话系统认知理解能力。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及车载对话，具体涉及一信息处理的方法、装置、设备和计算机可读存储介质。

技术介绍

1、在车载任务型对话场景中，通过对车上用户的语音指令(包括人与人、人与机器的对话)进行语义理解，获得对应的语义理解结果，并根据语义理解结果响应用户的语音指令，从而达到满足用户的车机使用体验的目的。在实际中，为了提升用户的车机使用体验，对语音指令对应语义的正确、快速理解尤为重要。

2、相关技术中，通常利用小模型，如变换器的双向编码器表示模型(bidirectionalencoder representations from transformers，bert)或大模型如生成式预训练变换器模型(generative pre-trained transformer，gpt)对用户语音或可识别文本进行语义理解，小模型可以对简单语义快速理解，但是泛化能力差，对长尾的、复杂的、挑战型的对话理解能力差；大模型的泛化能力强，对各种类型对话的语义理解的准确性高，但是推理速度慢。

技术实现思路

1、本申请提供一种信息处理的方法、装置、设备和计算机可读存储介质，该信息处理的方法能够快速理解简单文本信息的语义，减少文本信息语义的错误理解，提升车载对话系统认知理解能力。

2、本申请的技术方案是这样实现的：

3、本申请实施例提供一种信息处理的方法，包括：识别接收的语音指令的第一文本信息；利用训练好的第一ai模型对所述第一文本信息进行语义理解，得到第一理解结果；以及利用训练好的第二ai模

4、可以理解的是，在本申请实施例提供的信息处理的方法中，识别接收的语音指令对应的第一文本信息；通过训练好的第一ai模型和训练好的第二ai模型分别对第一文本信息进行语义理解，得到对应的第一理解结果和第二理解结果；至少基于第一理解结果和第二理解结果，响应语音指令。如此，由于第一ai模型的训练数据类型多于第二ai模型的训练数据类型，而第一ai模型的至少一个结构参数的值大于第二ai模型的相应结构参数的值，因此，通过利用训练好的第一ai模型和训练好的第二ai模型同时对第一文本信息进行语义理解，获得两种理解结果，并结合至少两种理解结果对语音指令进行响应，实现了至少两种ai模型的语义理解优势的结合，从而能够快速理解简单文本信息的语义，减少文本信息语义理解的错误，提升车载对话系统认知理解能力。

5、在一些实施例中，所述第一理解结果包括表征所述第二理解结果正确性的子结果，所述子结果为所述第一文本信息对应的第一问题类型；所述第一问题类型包括表征所述第二理解结果错误的第一特定类型和表征所述第二理解结果正确第二特定类型。

6、可以理解的是，由于第一理解结果包括表征第二理解结果正确性的子结果，子结果包括第一问题类型，第一问题类型包括第一特定类型和第二特定类型，因此可以根据第一特定类型和第二特定类型对第二理解结果的正确性进行快速预判，而不是直接基于第二理解结果对语音指令进行响应，或者仅基于第一理解结果对语音指令进行响应，提升了语义理解准确性的同时，加快了语音指令响应速度。

7、在一些实施例中，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：若在所述第一问题类型为第一特定类型的情况下并且已基于所述第二理解结果生成第一执行指令，输出第一提示信息；其中，所述第一执行指令用于控制相应对象的工作状态，所述第一提示信息用于提示所述第一执行指令的执行结果是基于错误理解所述语音指令的语义而生成的。

8、可以理解的是，若第一文本信息的第一问题类型为第一特定类型，则表示预判第一理解结果错误，此时若确定已经基于第二理解结果生成了第一执行指令，则可以输出第一提示信息，该第一提示信息可以提示语音指令的发出者第二理解结果错误，且基于第二理解结果生成的第一指令的执行结果是因为错误理解语音指令而导致的，实现向语音指令的发出者认错的目的，提升语音指令的发出者的车机体验。

9、在一些实施例中，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，还包括：若所述第一问题类型为所述第一特定类型且未基于所述第二理解结果生成所述第一执行指令，禁止所述第一执行指令的生成，并输出第二提示信息；所述第二提示信息用于提示用户语音指令正在解析中。

10、可以理解的是，若第一文本信息的第一问题类型为第一特定类型，则表示预判第二理解结果错误，在预判第二理解结果错误但是并未基于第二理解结果生成第一执行指令的情况下，通过禁止生成第一执行指令，可以防止基于错误的第二理解结果响应语音指令，通过输出第二提示信息可以提示用户当前正在解析语音指令，提升用户的车机使用体验。

11、在一些实施例中，所述子结果还包括所述第一文本信息的结构化自然语言理解结果，所述信息处理的方法还包括：若确定检测到所述结构化自然语言理解结果，基于所述结构化自然语言理解结果生成第二执行指令。

12、可以理解的是，在预判第二理解结果错误之后，若检测到第一文本信息的结构化自然语言理解结果，通过基于该结构化自然语言理解结果生成第二执行指令，可以提高对语音指令理解的正确性。

13、在一些实施例中，所述信息处理方法还包括：获取基于所述第二执行指令的执行结果得到的第一文本反馈信息；基于所述第一文本反馈信息，输出语义理解纠正信息和/或第一语音反馈信息。

14、可以理解的是，通过将基于第一文本反馈信息得到的第一语音反馈信息，以及语义理解纠正信息输出，使得语音指令的发出者可以获得语音指令正确的反馈结果，并明确第一语音反馈信息是在对错误的语义理解结果纠正后获得的，提升用户的车机使用体验。

15、在一些实施例中，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：若所述第一问题类型为所述第二特定类型，基于所述第二理解结果响应所述语音指令。

16、可以理解的是，若所述第一问题类型为第二特定类型，则说明基于第一问题类型预判第二理解结果正确，在此情况下直接基于第二理解结果响应语音指令，可以提高语音指令的响应速度。

17、在一些实施例中，所述基于所述第二理解结果响应所述语音指令，包括：获取基于第三执行指令的执行结果得到的第二文本反馈信息，所述第三执行指令的执行结果是基于所述第二理解结果生成的；基于所述第二文本反馈信息，输出第二语音反馈信息。

18、可以理解的是，通过获取基于第三执行指令的执行结果得到的第二文本反馈信息，并基于第二文本反馈信息输出第二语音反馈信息，可以使得语音指令的发出者可以获知语音本文档来自技高网...

【技术保护点】

1.一种信息处理的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一理解结果包括表征所述第二理解结果正确性的子结果，所述子结果为所述第一文本信息对应的第一问题类型；所述第一问题类型包括第一特定类型和第二特定类型，所述第一特定类型指示所述第二理解结果错误，所述第二特定类型指示所述第二理解结果正确。

3.根据权利要求2所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

4.根据权利要求3所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，还包括：

5.根据权利要求3或4所述的方法，其特征在于，所述子结果还包括所述第一文本信息的结构化自然语言理解结果，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求2所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

8.根据权利要求7所述的方法，其特征在于，所述基于所述

9.根据权利要求7所述的方法，其特征在于，所述子结果还包括所述第一文本信息的结构化自然语言理解结果；所述方法还包括：

10.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：将所述第一文本信息和所述第一理解结果作为一个条目存储至预设存储区域。

11.根据权利要求1至4任一项所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

12.根据权利要求11所述的方法，其特征在于，所述第三AI模型的训练数据类型多于所述第二AI模型的训练数据类型。

13.根据权利要求11所述的方法，其特征在于，所述第一理解结果包括所述第一文本信息对应的第一问题类型；所述第三理解结果包括所述第一文本信息对应的第二问题类型；

14.根据权利要求13所述的方法，其特征在于，所述第一问题类型和所述第二问题类型包括所述第一文本信息对应的场景；

15.根据权利要求14所述的方法，所述基于所述目标理解结果响应于所述语音指令，包括：

16.根据权利要求13所述的方法，其特征在于，所述基于所述第一理解结果、所述第二理解结果和第四理解结果第三理解结果响应于所述语音指令，还包括：

17.根据权利要求13所述的方法，其特征在于，所述基于所述第一理解结果、所述第二理解结果和第四理解结果第三理解结果响应于所述语音指令，还包括：

18.根据权利要求13所述的方法，其特征在于，所述基于所述第一理解结果、所述第二理解结果和第三理解结果响应于所述语音指令，还包括：

19.根据权利要求18所述的方法，其特征在于，所述基于所述第二理解结果响应所述语音指令，包括：

20.根据权利要求2所述的方法，其特征在于，所述子结果还包括所述第一文本信息对应的结构化自然语言理解结果；所述利用训练好的第一AI模型对所述第一文本信息进行语义理解，得到第一理解结果，包括：

21.根据权利要求20所述的方法，其特征在于，在检测到所述第一分段标识之后，还包括：

22.根据权利要求21所述的方法，其特征在于，所述方法还包括：

23.根据权利要求1至4任一项所述的方法，其特征在于，还包括：

24.根据权利要求1至4任一项所述的方法，其特征在于，所述利用训练好的第一AI模型对所述第一文本信息进行语义理解，得到第一理解结果，包括：

25.根据权利要求24所述的方法，其特征在于，所述利用训练好的第二AI模型对所述第一文本信息进行语义理解，得到第二理解结果，包括：

26.根据权利要求1至4任一项所述的方法，其特征在于，所述第一AI模型的训练数据类型包括所述第二AI模型的训练数据类型以及不同于所述第二AI模型的训练数据类型的其他数据类型。

27.根据权利要求1至4任一项所述的方法，其特征在于，所述第一AI模型包括第一神经网络模型，所述第二AI模型包括第二神经网络模型；其中，

28.根据权利要求27所述的方法，其特征在于，所述第一神经网络模型的网络层总数大于所述第二神经网络模型的网络层总数。

29.根据权利要求1至4任一项所述的方法，其特征在于，所述第一AI模型的训练过程，包括：

30.根据权利要求29所述的方法，其特征在于，所述获取目标训练数据集，包括：

31.根据权利要求30所述的方法...

【技术特征摘要】

1.一种信息处理的方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

4.根据权利要求3所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，还包括：

5.根据权利要求3或4所述的方法，其特征在于，所述子结果还包括所述第一文本信息的结构化自然语言理解结果，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求2所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

8.根据权利要求7所述的方法，其特征在于，所述基于所述第二理解结果响应所述语音指令，包括：

9.根据权利要求7所述的方法，其特征在于，所述子结果还包括所述第一文本信息的结构化自然语言理解结果；所述方法还包括：

10.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：将所述第一文本信息和所述第一理解结果作为一个条目存储至预设存储区域。

11.根据权利要求1至4任一项所述的方法，其特征在于，所述至少基于所述第一理解结果和所述第二理解结果，响应所述语音指令，包括：

12.根据权利要求11所述的方法，其特征在于，所述第三ai模型的训练数据类型多于所述第二ai模型的训练数据类型。

14.根据权利要求13所述的方法，其特征在于，所述第一问题类型和所述第二问题类型包括所述第一文本信息对应的场景；

15.根据权利要求14所述的方法，所述基于所述目标理解结果响应于所述语音指令，包括：

17.根据权利要求13所述的方...

【专利技术属性】
技术研发人员：唐乾斌，贺刚，王永亮，任伟，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人