一种基于认知大模型的语音系统、方法及装置制造方法及图纸

技术编号：41910911 阅读：22 留言：0更新日期：2024-07-05 14:14

本发明专利技术公开了一种基于认知大模型的语音系统、方法及装置，涉及语音识别技术领域，包括语音识别分析模块、语音功能控制模块、反馈提示模块以及语音认知数据库，通过融合了语音识别分析模块、语音功能控制模块和反馈提示模块，语音识别分析模块能够高效地捕获并准确识别人员的语音指令，提高了驾驶的便利性和安全性，同时，通过分析语音指令的置信度，提高了系统对用户意图的理解和识别准确率，从而有效优化了指令的执行可靠性，而反馈提示模块则对语音系统的认知状况进行综合分析，并实时进行反馈和提示，帮助用户更好地了解系统运行状态，提升了用户体验和对系统的信任感。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，具体为一种基于认知大模型的语音系统、方法及装置。

技术介绍

1、基于认知大模型的语音系统在车载智能领域扮演着革命性角色。其技术背景融合了语音识别、自然语言处理、智能控制以及网络连接等多项关键技术，为车辆提供了更智能、便捷的交互功能。该系统能够高效准确地识别车主和乘客的语音指令，将其转化为可执行的指令，如车身信息查询、车辆舒适域模块的控制等。这种直观的交互方式大大提升了驾驶体验的便捷性和安全性。

2、例如公开号为：cn101281745a的专利技术专利，公开了一种车载语音交互系统，包括语音采集模块、语音识别核心模块和语音反馈模块，所述语音识别核心模块包括声学模型和发音字典模块、上下文不相关文法模块，以及路径搜索模块，所述声学模型和发音字典模块用于根据统计算法建立一套对应于口音等变化特点的映射对应表；所述上下文不相关文法模块，用于构建待识别的自然连续语音的文法和规则结构；所述路径搜索模块用于对计算量最大的观察概率计算部分进行近似简化。

3、例如公告号为：cn103730119b的专利技术专利，提供了一种车载人机语音交互系统，包括：语音采集模块；与语音采集模块输出端连接的语音提纯模块；与语音提纯模块输出端连接的语音处理方式选择模块；连接于语音处理方式选择模块输出端和云服务器输入端之间的网络模块；连接于语音处理方式选择模块输出端的系统终端处理器；云服务器；以及车载控制单元模块。

4、基于上述方案可见，如今对基于认知大模型的语音系统分析中还存在一些不足，具体体现在当前的

<br/>

技术实现思路

1、针对现有技术的不足，本专利技术提供了一种基于认知大模型的语音系统、方法及装置，能够有效解决上述
技术介绍
中涉及的问题。

2、为实现以上目的，本专利技术通过以下技术方案予以实现：一种基于认知大模型的语音系统，包括语音识别分析模块，用于识别人员的语音输入指令进行分析处理，并评估人员的语音指令置信度。

3、语音功能控制模块，用于获取置信人员，并分析置信人员的语音指令与各类控制指令的关联度，定位指定控制指令对应的车辆控制元器件进行启用功能执行。

4、反馈提示模块，用于综合分析语音系统的认知状况进行反馈提示。

5、语音认知数据库，用于存储车辆历史语音输入记录信息以及各类控制指令的关键词库。

6、进一步地，所述识别人员的语音输入指令进行分析处理，具体分析过程为：识别人员的语音输入指令并从中提取人员语音特性信息，包括各时间点的人员音量以及人员发声平均语速，并从语音认知数据库中获取车辆历史语音输入记录信息，其中车辆历史语音输入记录信息包括车辆隶属人员的历史语音参照音量、历史语音参照语速、历史语音参照音调波形。

7、初步计算人员的声学匹配符合第一特征值，其计算公式为：

8、式中，α表示人员的声学匹配符合第一特征值，hj表示第j个时间点中的人员音量h0表示车辆隶属人员的历史语音参照音量，ν3表示人员发声平均语速，δν表示历史语音参照语速，a1、a2分别表示设定的发声音量和发声语速对应的声音匹配补偿因子，j表示各时间点的编号，j＝1,2,3,...,m，m表示时间点的总数。

9、根据人员的语音输入指令，构建人员的音调波形图，提取人员的音调波形长度，同时根据车辆隶属人员的历史语音参照音调波形，并将人员的音调波形图与车辆隶属人员的历史语音参照音调波形进行重合比对，得到人员的音调波形单次偏离的最大长度、音调波形重合长度。

10、计算人员的声学匹配符合第二特征值，其计算公式为：

11、式中，β人员的声学匹配符合第二特征值，l1表示人员的音调波形单次偏离的最大长度，l0表示人员的音调波形长度，l2→c表示人员的音调波形图与车辆隶属人员的历史语音参照音调波形之间的音调波形重合长度，b1表示设定的音调波形单位最大偏离长度对应的干扰因子，b2表示设定的音调波形重合长度对应的修正因子，e表示自然常数。

12、计算人员的语音指令置信度，其计算公式为：

13、

14、式中，χ表示人员的语音指令置信度，ε1和ε2分别表示设定的声学匹配符合第一特征值以及声学匹配符合第二特征值对应的权重因子。

15、进一步地，所述获取置信人员，具体过程为：提取人员的语音指令置信度，并根据设定的语音指令置信度阈值，将人员的语音指令置信度与语音指令置信度阈值进行比对，若人员的语音指令置信度高于语音指令置信度阈值，则将人员判定为置信人员。

16、进一步地，所述评估置信人员的语音指令与各类控制指令的关联度，其分析过程为：提取置信人员的语音指令并进行预处理转换为文本形式，并通过自然语言处理对识别出的文本进行处理得到置信人员的语音指令中的控制指令关键词。

17、根据语音数据库中存储的各类控制指令的关键词库，比对得到置信人员的语音指令与各类控制指令关键词的重合数量，评估置信人员的语音指令与各类控制指令的关联度，其计算公式为：

18、式中，δi表示置信人员的语音指令与各类控制指令的关联度，si表示置信人员的语音指令与第i个类控制指令的关键词重合数量,s0表示设定的控制指令的重合界定数量，c1表示设定的重合数量的修正因子，i表示各类控制指令类型的编号，i＝1,2,3,...,n，n表示控制指令的总类型数。

19、进一步地，所述定位指定控制指令对应的车辆控制元器件进行启用功能执行，具体过程为：将置信人员的语音指令与各类控制指令的关联度进行从大到小的顺序依次进行排序，提取排序第一位的控制指令作为指定控制指令并对指定控制指令对应的车辆控制元器件进行启用功能执行。

20、进一步地，所述综合分析语音系统的认知状况进行反馈提示，具体过程为：计算语音系统的识别功能评价值，其计算公式为：

21、式中，ψ为语音系统的识别功能评价值，k为语音系统的第一认知功能评价值，y为语音系统的第二认知功能评价值，τ1和τ2分别表示设定的第一认知功能评价值以及第二认知功能评价值对应的权重因子。

22、依据语音系统的识别功能评价值，并与设定的识别功能评价阈值进行比对，若语音系统的识别功能评价值低于识别功能评价阈值时，则进行反馈提示。

23、进一步地，所述语音系统的第一认知功能评价值，具体分析过程为：设置监测周期，在监测周期中统计语音系统的识别准确率以及指令接收反馈响应间隔时间，并提取语音数据库中存储的识别界定准确率以及单位接收反馈响应间隔时间对应的影响因子。

24、计算语音系统的第一认知功能评价值，其计算公式为：

25、式中，k表示语音系统的第一认知功能评价值，z表示语音系统的识别准确率，δz表示识别界定准确率，ts表示语音指令接收反馈响应间隔时间，η1表示识别准确率的修正系数，η2表示单位接收反馈响应间隔时间对应的影响因子。

26、进一步地，所述语音系统的第二认知功能评价值，具体分析过程为：在监测周期中统计语音系统的指本文档来自技高网...

【技术保护点】

1.一种基于认知大模型的语音系统，其特征在于，包括：

2.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述识别人员的语音输入指令进行分析处理，具体分析过程为：

3.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述获取置信人员，具体过程为：

4.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述评估置信人员的语音指令与各类控制指令的关联度，其分析过程为：

5.根据权利要求3所述的一种基于认知大模型的语音系统，其特征在于：所述定位指定控制指令对应的车辆控制元器件进行启用功能执行，具体过程为：

6.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述综合分析语音系统的认知状况进行反馈提示，具体过程为：

7.根据权利要求6所述的一种基于认知大模型的语音系统，其特征在于：所述语音系统的第一认知功能评价值，具体分析过程为：

8.根据权利要求6所述的一种基于认知大模型的语音系统，其特征在于：所述语音系统的第二认知功能评价值，具体分析过程为：>

9.一种基于认知大模型的语音方法，其特征在于，包括：

10.一种基于认知大模型的语音装置，其特征在于，包括：处理器，以及与处理器连接的内存和网络接口；所述网络接口与服务器中的非易失性存储器连接；所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序，并通过所述内存运行所述计算机程序，以执行上述权利要求1-8中任意一项所述的方法。

...

【技术特征摘要】

1.一种基于认知大模型的语音系统，其特征在于，包括：

2.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述识别人员的语音输入指令进行分析处理，具体分析过程为：

3.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述获取置信人员，具体过程为：

4.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述评估置信人员的语音指令与各类控制指令的关联度，其分析过程为：

5.根据权利要求3所述的一种基于认知大模型的语音系统，其特征在于：所述定位指定控制指令对应的车辆控制元器件进行启用功能执行，具体过程为：

6.根据权利要求1所述的一种基于认知大模型的语音系统，其特征在于：所述综合...

【专利技术属性】
技术研发人员：马磊，冯珍荣，谢雪亮，王斌，
申请(专利权)人：麦田控股集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人