有效地实施语音识别字典的系统和方法技术方案

技术编号：4079294 阅读：215 留言：0更新日期：2012-04-11 18:40

本发明专利技术包括有效地实施语音识别字典的系统和方法，可以包括被构造成将输入语音数据与来自根据优化的普通话汉语音素集实施的词汇词典的音素串进行比较的识别器。该优化的普通话汉语音素集可以通过利用音位变体和音位变化技术有效地实施。此外，前述的词汇字典可以通过利用统一的字典优化技术实施以提供稳健且精确的语音识别。此外，词汇字典可以实施为优化的字典以在语音识别过程中精确地识别北方普通话汉语语音或南方普通话汉语语音。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

一般地说本专利技术涉及电子语音识别系统，更具体地说涉及有效地实施普通话汉语 (Mandarin Chinese)语音识别字典的系统和方法。
技术介绍
描述实施系统用户与电子设备进行稳健且有效的人机通信是系统设计者和制造商们非常重视的考虑因素。电子设备的语音控制操作是用于多种系统用户的理想接口。例如，语音控制操作允许用户同时执行其它的任务。例如，一个人在驾驶机车的同时，通过语音控制可以操作电子管理器。对于那些具有身体障碍或其它特殊要求的用户来说电子系统的免提操作是比较理想的。电子设备的免提操作可以通过各种语音启动的电子系统实现。语音启动的电子系统由此有利地允许用户在其使用常规的输入设备不方便或者可能有危险的情况下与电子设备进行人机通信。电子娱乐系统也可以利用语音识别技术来允许用户通过向某一系统说话而与其交互。然而，有效地实施这种系统对系统设计者来说可是一种巨大的挑战。例如，增加系统的功能和性能的进一步需求可能要求更大的系统处理能力和要求其它的硬件资源。由于增加了生产成本和操作的无效率，在处理或硬件要求方面的增加也相应地导致了不利的影响。此外，增强系统执行各种高级操作的系统能力虽然可以给系统用户提供其它的优点，但也导致了对各种系统部件的控制和管理的增加。例如，有效地识别在普通话汉语语言中的字和词的增强的电子系统得益于有效的实施方案，因为要求大量且复杂的数字数据。因此，对于所有的前述原因，实施系统用户与电子设备人机通信的稳健且有效的方法一直是系统设计者和制造者重要的考虑因素。
技术实现思路
根据本专利技术，公开了一种有效地实施普通话汉语...

【技术保护点】
一种用于执行语音识别过程的系统，包括：识别器，该识别器被构造成将输入语音数据与来自根据优化的音素集实施的词汇字典的音素串进行比较，所述优化的音素集利用音位变体变化技术以小型化的方式来实施，所述词汇字典利用一种或多种字典优化技术来实施；和处理器，该处理器被构造成控制所述识别器，以便由此执行所述语音识别过程；其中所述优化的音素集表示音调语言的各种不同的声音而不利用作为在所述优化的音素集中的不同音素部分的对应音调信息。

【技术特征摘要】
US 2003-3-31 10/403747一种用于执行语音识别过程的系统，包括识别器，该识别器被构造成将输入语音数据与来自根据优化的音素集实施的词汇字典的音素串进行比较，所述优化的音素集利用音位变体变化技术以小型化的方式来实施，所述词汇字典利用一种或多种字典优化技术来实施；和处理器，该处理器被构造成控制所述识别器，以便由此执行所述语音识别过程；其中所述优化的音素集表示音调语言的各种不同的声音而不利用作为在所述优化的音素集中的不同音素部分的对应音调信息。2.权利要求1的系统，其中所述识别器和所述处理器作为消费电子设备的部分来实施。3.权利要求1的系统，其中在执行所述语音识别过程的同时，所述优化的音素集节省处理资源和存储器资源。4.权利要求1的系统，其中每个所述音素串包括来自所述优化的音素集的不同的音素序列，每个所述音素串对应于来自所述词汇字典的不同的字。5.权利要求4的系统，其中所述识别器比较所述输入语音数据和来自所述词汇字典的所述音素串的隐式马尔可夫模型，以便由此在所述语音识别过程期间选择所识别的字。6.权利要求1的系统，其中所述音位变体变化技术将多个音位变体或音位映射到对应的字典条目。7.权利要求6的系统，其中所述多个音位变体或音位包括所述字典条目的发音变化。8.权利要求6的系统，其中所述优化的音素集以语音学技术来实施，以便单独提供辅音音素和元音音素，所述优化的音素集以小型化的方式来实施，以便仅包括最低要求数量的所述辅音音素和所述元音音素。9.权利要求1的系统，其中区域变化技术将所述输入语音数据的区域变化映射到所述词汇字典中的对应的条目。10.权利要求9的系统，其中所述输入语音数据的每个所述区域变化根据地理区域而呈现明显的发音变化，所述明显的发音变化被确定超过预先确定的可接受的变化阈值。11.权利要求1的系统，其中所述词汇字典包括且合并具有不应归于区域变化的可替换发音的自由音位或音位变体变化的单独条目。12.一种用于执行语音识别过程的方法，包括如下的步骤将识别器构造成比较输入语音数据和来自根据优化的音素集实施的词汇字典的音素串，所述优化的音素集利用音位的和音位变体的变化技术以小...

【专利技术属性】
技术研发人员：X梅嫩德斯皮达尔，吕静雯，L奥罗伦肖，段镭，
申请(专利权)人：索尼电子有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人