用于自动训练语音识别系统的方法和装置制造方法及图纸

技术编号：44987869 阅读：1 留言：0更新日期：2025-04-15 17:05

本发明专利技术涉及用于自动训练语音识别系统的方法和装置。在一种用于自动训练语音识别系统的方法和装置中，语音识别系统包括一个或更多个NLU引擎，方法包括：获得由一个或更多个NLU引擎输出的NLU结果；基于在NLU结果之间进行比较，生成用于大规模语言模型的提示；通过利用生成的用于大规模语言模型的提示，确定NLU结果是否适当；通过利用确定结果来训练语音识别系统。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种用于自动训练语音识别系统的方法和装置。

技术介绍

1、本部分中的描述仅提供与本专利技术相关的背景信息，并且不构成相关技术。

2、随着最近人工智能技术的发展，应用人工智能的范围也在扩大。能够利用自然语言与用户进行交谈的对话系统(诸如，聊天机器人或虚拟助理)在各个领域中得到利用。为了使对话系统与用户进行交谈，有必要从对话系统的角度理解用户的话语，换句话说，理解输入的消息。为了实现目前的自然语言理解(natural language understanding，nlu)，对话系统需要从对话系统与用户之间的对话中得出当前的语境以及在该语境中预期的用户意图，并且基于确定的当前的语境和/或意图来分析输入的消息。

3、这些语音识别服务的应用范围从家庭扩大到诸如车辆的各个领域。此外，远程信息处理技术包括各种功能。其示例包括实时导航功能，利用互联网的信息搜索功能，以及诸如通过利用车辆位置和天气信息来优化车内环境的功能。

4、语音识别系统广泛地用于日常生活中，例如用于智能手机、智能扬声器和车载信息娱乐系统中。为了构建用于分析话语意图的自然语言理解系统，有必要预先设计一组预期的用户意图，收集句子，并且训练意图分类模型。然而，单靠预定义的意图可能无法完全满足用户不断变化的需求。相应地，需要通过反复地合并在未标记的用户话语中发现的新的意图来扩展意图分类模型。

5、为了扩展意图分类模型，现有的方法需要人类评估者来选择数据并收集句子。目前的方法需要手动标记过程并且耗时且昂贵。此外，存在当多人评

6、包括在本专利技术的该
技术介绍
中的信息仅用于增强对本专利技术的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

1、本专利技术的各个方面致力于提供一种用于自动训练语音识别系统的方法和装置，其通过基于语音识别系统对意图进行分类的结果来发现错误分类并得出新的意图，从而自动训练语音识别系统。

2、本专利技术的方面不限于上面提及的那些方面，并且本领域技术人员将从以下描述中清楚地理解本文中未提及的其他方面。

3、根据本专利技术的一个方面，提供了一种用于自动训练语音识别系统的方法，所述语音识别系统包括一个或更多个nlu引擎，所述方法包括：获得由一个或更多个nlu引擎输出的nlu结果；基于在nlu结果之间进行比较，生成用于大规模语言模型的提示；通过利用生成的用于大规模语言模型的提示，确定nlu结果是否适当，并且通过利用确定结果来训练语音识别系统。

4、根据本专利技术的另一方面，提供了一种用于自动训练语音识别系统的装置，所述语音识别系统包括一个或更多个nlu引擎，所述装置包括存储器和一个或更多个处理器，存储器配置为存储一个或更多个指令，一个或更多个处理器能够操作地连接到存储器并且配置为执行存储在存储器中的一个或更多个指令，其中一个或更多个处理器通过执行一个或更多个指令来执行步骤，所述步骤包括：获得由一个或更多个nlu引擎输出的nlu结果；基于在nlu结果之间进行比较，生成用于大规模语言模型的提示；通过利用生成的用于大规模语言模型的提示，确定nlu结果是否适当；通过利用确定结果来训练语音识别系统。

5、根据本专利技术的示例性实施方案，通过基于意图分类的结果来发现错误分类并得出新的意图，从而可以自动训练语音识别系统。

6、根据本专利技术的示例性实施方案，可以通过自动训练语音识别系统来检测用户持续变化的意图。

7、本专利技术的方法和装置具有其他的特性和优点，这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的，或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述，这些附图和具体实施方式共同用于解释本专利技术的特定原理。

本文档来自技高网...

【技术保护点】

1.一种用于自动训练语音识别系统的方法，所述语音识别系统包括一个或更多个自然语言理解引擎，所述方法包括：

2.根据权利要求1所述的用于自动训练语音识别系统的方法，其中：

3.根据权利要求1所述的用于自动训练语音识别系统的方法，其中，获得由一个或更多个自然语言理解引擎输出的自然语言理解结果包括：通过使以不同方式训练的一个或更多个自然语言理解引擎并行连接，获得自然语言理解结果。

4.根据权利要求3所述的用于自动训练语音识别系统的方法，其中，在自然语言理解结果之间进行比较包括：比较自然语言理解结果，并且筛选预测意图的结果最不同的句子。

5.根据权利要求4所述的用于自动训练语音识别系统的方法，其中，确定自然语言理解结果是否适当包括：确定利用大规模语言模型预测意图的结果是否适当并推断正确的意图。

6.根据权利要求5所述的用于自动训练语音识别系统的方法，其中，通过利用确定结果来训练语音识别系统包括：基于由大规模语言模型正确推断的结果来训练语音识别系统。

7.根据权利要求1所述的用于自动训练语音识别系统的方法，其中，获得由

8.根据权利要求7所述的用于自动训练语音识别系统的方法，其中，在自然语言理解结果之间进行比较包括：在整个意图集不包括的聚类之中筛选包括最多样本的聚类，并且选择代表性句子。

9.根据权利要求8所述的用于自动训练语音识别系统的方法，其中，确定自然语言理解结果是否适当包括：通过利用聚类的代表性句子来检测新的意图并生成新的意图标签。

10.根据权利要求9所述的用于自动训练语音识别系统的方法，其中，通过利用确定结果来训练语音识别系统包括：基于新生成的意图标签来训练语音识别系统。

11.一种用于自动训练语音识别系统的装置，所述语音识别系统包括一个或更多个自然语言理解引擎，所述装置包括：

12.根据权利要求11所述的用于自动训练语音识别系统的装置，其中：

13.根据权利要求11所述的用于自动训练语音识别系统的装置，其中，获得由一个或更多个自然语言理解引擎输出的自然语言理解结果包括：通过使以不同方式训练的一个或更多个自然语言理解引擎并行连接，获得自然语言理解结果。

14.根据权利要求13所述的用于自动训练语音识别系统的装置，其中，在自然语言理解结果之间进行比较包括：比较自然语言理解结果，并且筛选预测意图的结果最不同的句子。

15.根据权利要求14所述的用于自动训练语音识别系统的装置，其中，通过利用确定结果来训练语音识别系统包括：基于由大规模语言模型正确推断的结果来训练语音识别系统。

16.根据权利要求11所述的用于自动训练语音识别系统的装置，其中，获得由一个或更多个自然语言理解引擎输出的自然语言理解结果包括：对由一个或更多个经训练的自然语言理解引擎输出的自然语言理解结果执行标签间的对比学习和聚类。

17.根据权利要求16所述的用于自动训练语音识别系统的装置，其中，在自然语言理解结果之间进行比较包括：在整个意图集不包括的聚类之中筛选包括最多样本的聚类，并且选择代表性句子。

18.根据权利要求17所述的用于自动训练语音识别系统的装置，其中，确定自然语言理解结果是否适当包括：通过利用聚类的代表性句子来检测新的意图并且生成新的意图标签。

19.根据权利要求18所述的用于自动训练语音识别系统的装置，其中，通过利用确定结果来训练语音识别系统包括：基于新生成的意图标签来训练语音识别系统。

...

【技术特征摘要】

1.一种用于自动训练语音识别系统的方法，所述语音识别系统包括一个或更多个自然语言理解引擎，所述方法包括：

2.根据权利要求1所述的用于自动训练语音识别系统的方法，其中：

7.根据权利要求1所述的用于自动训练语音识别系统的方法，其中，获得由一个或更多个自然语言理解引擎输出的自然语言理解结果包括：对由一个或更多个经训练的自然语言理解引擎输出的自然语言理解结果执行标签间的对比学习和聚类。

10.根据权利要求9所述的用于自动训练语音识别系统的方法，其中，通过利用确定结果来...

【专利技术属性】
技术研发人员：千昌祐，
申请(专利权)人：现代自动车株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人