基于大语言模型的语音交互方法、装置及智能语音设备制造方法及图纸

技术编号：41768881 阅读：2 留言：0更新日期：2024-06-21 21:46

本申请涉及语音处理技术领域，公开一种基于大语言模型的语音交互方法，包括：在接收到用户输入的语音交互数据的情况下，将语音交互数据转化为问题文本；根据用户的标识信息，调用专属向量库；在问题文本表示用户意图调用语音说明书的情况下，根据问题文本、专属向量库及大语言模型，得到智能语音设备的语音回复信息；控制智能语音设备播报语音回复信息。以此方案，能够利用大语言模型结合问题文本和专属向量库，生成智能的语音回复。从而通过控制智能语音设备播报生成的语音回复的方式，用户无需进行额外的操作，即可获得所需的语音说明书信息，提高用户的使用体验感。本申请还公开一种基于大语言模型的语音交互装置及智能语音设备。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音处理，例如涉及一种基于大语言模型的语音交互方法、装置及智能语音设备。

技术介绍

1、智能语音设备的发展是近年来人工智能领域的一个重要分支，其利用语音识别、自然语言处理等技术，将人的语音转化为文字，并通过对文字的分析理解，作出相应的回应。目前，智能语音设备均配备有详尽的纸质或电子说明书，用户可以通过说明书了解产品特性和操作指南的关键资源。为了方便用户随时查阅，制造商通常会在产品包装或官方网站上提供说明书的存放位置或链接入口。用户可以依靠索引或搜索功能，快速找到特定功能的相关说明，以解决实际使用中遇到的问题。但无论出于哪种方式，用户获取设备专业知识的方式并不便捷。

2、现阶段，相关技术中，用户可以通过输入语音指令的方式，向智能语音设备传递设备专业知识的获取意向；智能语音设备可以通过其搭载的自然语言处理技术，理解用户的具体意向，以提供相应的反馈。但通过这种方式进行语言处理时，很难精准理解用户的实际意向，也就无法针对用户提供个性化的语音交互服务，导致用户体验感下降。

3、需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。

2、本公开实施例提供了一种基于大语言模型的语音

3、在一些实施例中，所述基于大语言模型的语音交互方法包括：在接收到用户输入的语音交互数据的情况下，将语音交互数据转化为问题文本；根据用户的标识信息，调用专属向量库；在问题文本表示用户意图调用语音说明书的情况下，根据问题文本、专属向量库及大语言模型，得到智能语音设备的语音回复信息；控制智能语音设备播报语音回复信息，为用户提供个性化的语音服务。

4、在一些实施例中，所述基于大语言模型的语音交互方法包括：获取用于搭建专属向量库所需的用户隐私文档、用户历史文档及智能语音设备的说明书文档；将用户隐私文档、用户历史文档及智能语音设备的说明书文档添加至知识库文档中，并进行文档处理；利用词嵌入技术将处理后的文档转化为向量矩阵，以得到专属向量库。

5、在一些实施例中，所述基于大语言模型的语音交互方法包括：在用户通过智能语音设备的语音说明书功能完成交互的情况下，判断智能语音设备是否接收到用户的正面反馈；在智能语音设备接收到用户的正面反馈的情况下，将该次交互的对话与预存的文档进行相似度对比；若该次交互的对话与预存的文档的相似度低于预设阈值，将该次交互的对话作为用户历史文档。

6、在一些实施例中，所述基于大语言模型的语音交互方法包括：将用户画像文档作为用户隐私文档；或者，将用户画像文档及用户上传的隐私文档作为用户隐私文档；其中，用户画像文档由用户的标识信息匹配得到，用户画像文档包括用户的收入、资产、婚姻状况、居住情况、家庭组成、年龄、地域中的一种或多种，用户上传的隐私文档包括用户的睡眠相关信息、用户的房屋相关信息中的一种或多种。

7、在一些实施例中，所述基于大语言模型的语音交互方法包括：根据预设的关联关系，将与智能语音设备的标识信息相关联的说明书文档作为智能语音设备的说明书文档。

8、在一些实施例中，所述基于大语言模型的语音交互方法包括：将问题文本进行向量化处理，以得到用户问题向量；将用户问题向量与专属向量库进行对比，以检索出向量相似度最高的文本段；将问题文本及文本段作为大语言模型的输入信息，输出相应的语音回复信息。

9、在一些实施例中，所述基于大语言模型的语音交互方法包括：对语音回复信息进行安全审查；在语音回复信息通过安全审查的情况下，控制智能语音设备播报语音回复信息，为用户提供个性化的语音服务。

10、在一些实施例中，所述基于大语言模型的语音交互方法包括：在语音回复信息未通过安全审查的情况下，控制智能语音设备播报敏感问题回复。

11、在一些实施例中，所述基于大语言模型的语音交互装置包括：处理器和存储有程序指令的存储器，处理器被配置为在运行程序指令时，执行前述的基于大语言模型的语音交互方法。

12、在一些实施例中，所述智能语音设备包括：智能语音设备本体；及前述的基于大语言模型的语音交互装置，安装于智能语音设备本体。

13、本公开实施例提供的基于大语言模型的语音交互方法、装置及智能语音设备，可以实现以下技术效果：

14、能够精准的将语音交互数据转化为问题文本，以结合用户的标识信息调用适用于用户的专属向量库；从而在识别到用户意图调用语音说明书的情况下，利用大语言模型结合问题文本和专属向量库，生成智能的语音回复。该回复不仅准确匹配了用户的问题，还充分考虑了用户的个性化需求，回复内容更加符合用户的期望。同时，通过控制智能语音设备播报生成的语音回复的方式，用户无需进行额外的操作，即可获得所需的语音说明书信息，提高了交互的便捷性和效率及用户的使用体验感。

15、以上的总体描述和下文中的描述仅是示例性和解释性的，不用于限制本申请。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的语音交互方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过以下方式搭建专属向量库：

3.根据权利要求2所述的方法，其特征在于，获取用户历史文档，包括：

4.根据权利要求2所述的方法，其特征在于，获取用户隐私文档，包括：

5.根据权利要求2所述的方法，其特征在于，获取智能语音设备的说明书文档，包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，根据所述问题文本、所述专属向量库及大语言模型，得到智能语音设备的语音回复信息，包括：

7.根据权利要求1至5任一项所述的方法，其特征在于，控制所述智能语音设备播报所述语音回复信息，为用户提供个性化的语音服务，包括：

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.一种基于大语言模型的语音交互装置，包括处理器和存储有程序指令的存储器，其特征在于，所述处理器被配置为在运行所述程序指令时，执行如权利要求1至8任一项所述的基于大语言模型的语音交互方法。

10.一种智能语音设备，其特征在于，包括：

...

【技术特征摘要】

1.一种基于大语言模型的语音交互方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过以下方式搭建专属向量库：

3.根据权利要求2所述的方法，其特征在于，获取用户历史文档，包括：

4.根据权利要求2所述的方法，其特征在于，获取用户隐私文档，包括：

5.根据权利要求2所述的方法，其特征在于，获取智能语音设备的说明书文档，包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，根据所述问题文本、所述专属向量库及大语言模型，得到...

【专利技术属性】
技术研发人员：贾奇伟，李伟，劳春峰，李志宏，
申请(专利权)人：青岛海尔空调器有限总公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人