语音识别装置以及语音识别方法制造方法及图纸

技术编号：3046948 阅读：184 留言：0更新日期：2012-04-11 18:40

一种语音识别装置以及语音识别方法，借由较高的精度以及较少的处理量对语音识别的结果作正误判断。借由对照声音模型ＨＭＭｓｂ与语音的特征矢量Ｖ（ｎ）求取表示最大优度的声音模型的识别结果ＲＣＧ与表示最大优度值的第一记录ＦＳＣＲ，与表示其次优度值的第二记录ＳＳＣＲ，而借由将以前述第一记录ＦＳＣＲ及第二记录ＳＳＣＲ为依据的评价值ＦＳＣＲＸ（ＦＳＣＲ－ＳＳＣＲ）与预先设定的基值ＴＨＤ比较，来判断识别结果为正或为误。识别结果ＲＣＧ若判断为正确时则对声音模型ＨＭＭｓｂ实行说话人适应处理，而识别结果ＲＣＧ若判断为误，则不对声音模型ＨＭＭｓｂ进行说话人适应处理，借此方式以提高说话人适应处理的精度等。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种借由说话人适应处理实行语音识别的。而且，本专利技术还涉及一种使用实施过说话人适应处理的语音模型实行语音识别的。
技术介绍
语音识别很困难的主要原因，一般被认为是由于说话人的语音受发音器官及语音习惯等个人差异影响。以往，对于这些存在个人差异影响的语音，作为常用的语音识别算法，主要使用MLLR(Maximum Likelihood Linear Regression)与MAP(Maximum a Posteriori)等说话人适应处理来提高对于特定说话人语音的识别率。这种说话人适应处理方法，利用许多非特定人的语音预先形成以音素或者单词为单位的许多声音模型(初期的声音模型)，然后借由应作说话人适应处理的说话人语音的特征量，对这些声音模型进行说话人适应处理。但是，为了实行适当的说话人适应处理，必须参照语音识别结果，对音素或单词单位的声音模型实施说话人适应处理。也就是，以具体的事例来说明，当说话人讲出“东京”时，只有在该语音被正确识别为“东京”时，才需要将“东京”的声音模型作说话人适应处理，若根据错误识别的结果将“东京”的声音模型作说话人适应处理，则变成实行错误的说话人适应处理之情况。假设说话人讲出“东京”时，将其语音误识别为“京都”，则当对“京都”的声音模型以“东京”的语音特征量实行说话人适应处理时，无法实施适当的说话人适应处理，从而会降低说话人适应处理后的语音识别率。因此，作为实行说话人适应处理时的前提条件，准确的判断语音与语音识别的结果是否一致，也就是准确的判断语音识别的结果是否正确很重要。但是，按照现有的说话人适应处理方法，因为判断语音...

【技术保护点】
一种语音识别装置，其对声音模型借由语音的特征矢量实施说话人适应处理；其具备有：语音识别装置，借由对照上述声音模型与语音的特征矢量而输出表示得到最大优度（相似度）的声音模型的识别结果，与表示上述最大优度的值的第一记录，与表示其次的优度值的第二记录；判断装置，将依据上述第一记录与第二记录的评价值与预先设定的基值（阈值）作比较，在上述评价值相对于基值呈一定关系的情况下则判断前述识别结果为正确；说话人适应处理装置，借由上述判断装置判断上述识别结果为正确时对前述声音模型实施说话人适应处理。

【技术特征摘要】
JP 2002-4-26 126939/2002;JP 2002-5-17 142998/20021.一种语音识别装置，其对声音模型借由语音的特征矢量实施说话人适应处理；其具备有语音识别装置，借由对照上述声音模型与语音的特征矢量而输出表示得到最大优度(相似度)的声音模型的识别结果，与表示上述最大优度的值的第一记录，与表示其次的优度值的第二记录；判断装置，将依据上述第一记录与第二记录的评价值与预先设定的基值(阈值)作比较，在上述评价值相对于基值呈一定关系的情况下则判断前述识别结果为正确；说话人适应处理装置，借由上述判断装置判断上述识别结果为正确时对前述声音模型实施说话人适应处理。2.根据权利要求1所述的语音识别装置，其中前述判断装置在上述评价值相对于基值不呈一定关系的情况下判断上述识别结果为误，而上述说话人适应处理装置在判断上述识别结果为误时不对前述声音模型实施说话人适应处理。3.根据权利要求1所述的语音识别装置，其中前述评价值根据上述第一记录与第二记录的差值进行计算。4.根据权利要求2所述的语音识别装置，其还具备一装置，在前述判断装置判断前述识别结果为错误时则禁止上述识别结果的输出，并且作出表示上述识别结果为错误的信息提示。5.一种语音识别方法，根据语音的特征矢量对声音模型实施说话人适应处理；其具备有第一步骤，对照上述声音模型与语音的特征矢量而求取表示得到最大优度的声音模型的识别结果，与表示前述最大优度的值的第一记录，及表示其次优度值的第二记录；第二步骤，将依据前述第一记录与第二记录得出的评价值与预先设定的基值作比较，在上述评价值相对于基值呈一定关系的情况下判断上述识别结果为正确；第三步骤，在上述第二步骤中，在判断前述识别结果为正确时则对前述声音模型实施说话人适应处理。6.根据权利要求5所述的语音识别方法，其在上述第二步骤中在上述评价值相对于前述基值不呈一定关系的情况下则判断上述识别结果为误，而在上述第三步骤中在判断上述识别结果为误时则不对上述声音模型实施说话人适应处理。7.根据权利要求5所述的语音识别方法，其中前述评价值借由上述第一记录与第二记录的差值作计算。8.根据权利要求6所述的语音识别方法，其在前述第二步骤中在判断前述识别结果为错误时则禁止上述识别结果的输出，同时还作出表示上述识别结果为错误的信息提示。9.一种语音识别装置，具备有记忆装置，具有初期语音模型；一杂音适应装置，借由在对上述记忆装置的初期语音模型实行说话人适应处理时的背景杂音，实施以杂音适应处理来产生杂音适应模型；说话人适应参数计算装置，对上述杂音适应处置所产生的前述杂音适应模型借由上述说话人适应处理时所说话的语音实行说话人适应计算，从而计算出将上述杂音适应模型变换为杂音叠加说话人适应模型用的说话人适应参数；语音模型更新装置，在对上述记忆装置的初期语音模型借由上述说话人适应处理参数实施说话人适应处理以产生说话人适应模型，而将该说话人适应模型取代前述初期语音模型从而更新记忆于上述记忆装置。10.根据权利要求9所述的语音识别装置，其还具备有在语音识别时实行语音识别处理的识别处理装置，并且上述杂音适应装置借由上述语音识别时的非说话期间的背景杂音对更新记忆于上述记忆装...

【专利技术属性】
技术研发人员：外山聡一，
申请(专利权)人：日本先锋公司，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人