一种个性化的语音识别的方法及装置制造方法及图纸

技术编号:8301237 阅读:231 留言:0更新日期:2013-02-07 05:23
本发明专利技术提供了一种个性化的语音识别的方法及装置,其中个性化的语音识别的方法包括:A.确定待识别语音是否属于授权用户,如果是,则利用所述授权用户对应的语音识别模型对所述待识别语音进行识别,否则执行步骤B;B.确定所述待识别语音所属方言类别,并利用所述待识别语音所属方言类别对应的语音识别模型对待识别语音进行识别。通过上述方式,本发明专利技术可以提高在各种用户下的语音识别的精度。

【技术实现步骤摘要】
一种个性化的语音识别的方法及装置
本专利技术涉及语音识别技术,特别涉及一种个性化的语音识别方法及装置。
技术介绍
语音识别技术在很多领域都有重要的应用,例如语音拨号、语音导航等应用,都依赖语音识别技术。语音识别效果的好坏,直接影响到各种与语音识别相关的应用的效果好坏。语音识别模型所具有的描述语音到文本的能力,是影响语音识别效果好坏的关键因素。现有技术采用相同的语音识别模型对各种用户的语音进行识别,由于相同的语音识别模型,很难描述不同用户的语音差异,因此,采用这种方式进行语音识别,很多情况下的 识别精度不佳,难以满足用户语音识别的个性化需求。
技术实现思路
本专利技术所要解决的技术问题是提供一种个性化的语音识别方法及装置,以提高在各种用户下的语音识别的精度。本专利技术为解决技术问题而采用的技术方案是提供一种个性化的语音识别的方法,包括:A.确定待识别语音是否属于授权用户,如果是,则利用所述授权用户对应的语音识别模型对所述待识别语音进行识别,否则执行步骤B ;B.确定所述待识别语音所属方言类另IJ,并利用所述待识别语音所属方言类别对应的语音识别模型对待识别语音进行识别。根据本专利技术之一优选实施例,所述方法进一步包括当无法确定所述待识别语音所属方言类别时,利用通用语音识别模型对待识别语音进行识别。根据本专利技术之一优选实施例,所述步骤A中,对所述待识别语音进行识别后进一步包括根据用户对识别结果的反馈及所述待识别语音,优化所述授权用户对应的语音识别丰吴型。根据本专利技术之一优选实施例,所述步骤B中,对所述待识别语音进行识别后进一步包括根据用户对识别结果的反馈及所述待识别语音,优化所述待识别语音所属方言类别对应的语音识别模型。根据本专利技术之一优选实施例,确定待识别语音是否属于授权用户的步骤包括提取待识别语音的声学特征,并确定所述待识别语音的声学特征与所述授权用户对应的声学模板之间的匹配度是否满足要求,如果是,则确定所述待识别语音属于所述授权用户,否则确定所述待识别语音不属于所述授权用户。根据本专利技术之一优选实施例,确定所述待识别语音所属方言类别的步骤包括将所述待识别语音的声学特征分别与各方言类别对应的声学模板进行比对,当各比对结果中的最大匹配度超过设定值时,将该最大匹配度对应的方言类别作为所述待识别语音所属方言类别。本专利技术还提供了一种个性化的语音识别的装置,包括第一识别单元,用于确定待识别语音是否属于授权用户,如果是,则利用所述授权用户对应的语音识别模型对所述待识别语音进行识别,否则触发第二识别单元执行;第二识别单元,用于确定所述待识别语音所属方言类别,并利用所述待识别语音所属方言类别对应的语音识别模型对待识别语音进行识别。根据本专利技术之一优选实施例,所述装置进一步包括第三识别单元,用于当所述第二识别单元无法确定所述待识别语音所属方言类别时,利用通用语音识别模型对待识别语音进行识别。根据本专利技术之一优选实施例,所述装置进一步包括第一优化单元,用于在所述第一识别单元对所述待识别语音进行识别后,根据用户对识别结果的反馈及所述待识别语音,优化所述授权用户对应的语音识别模型。根据本专利技术之一优选实施例,所述装置进一步包括第二优化单元,用于在所述第二识别单元对所述待识别语音进行识别后,根据用户对识别结果的反馈及所述待识别语音,优化所述待识别语音所属方言类别对应的语音识别模型。根据本专利技术之一优选实施例,所述第一识别单元确定待识别语音是否属于授权用户的方式包括提取待识别语音的声学特征,并确定所述待识别语音的声学特征与所述授权用户对应的声学模板之间的匹配度是否满足要求,如果是,则确定所述待识别语音属于所述授权用户,否则确定所述待识别语音不属于所述授权用户。根据本专利技术之一优选实施例,所述第二识别单元确定所述待识别语音所属方言类别的方式包括将所述待识别语音的声学特征分别与各方言类别对应的声学模板进行比对,当各比对结果中的最大匹配度超过设定值时,将该最大匹配度对应的方言类别作为所述待识别语音所属方言类别。由以上技术方案可以看出,本专利技术通过确定待识别语音的归属类型,从而可以利用与待识别语音的归属类型相适应的语音识别模型对待识别语音进行识别,能够很好地提 高待识别语音的识别精度。如果待识别语音属于授权用户,则可以选择个人用户适用的语音识别模型对待识别语音进行识别,即使待识别语音不属于授权用户,也可以选择与待识别语音的方言相适应的语音识别模型对待识别语音进行识别,通过这种方式,可以智能适应待识别语音的特点,能够充分提高在各种用户下的语音识别精度。附图说明图I为本专利技术中个性化的语音识别的方法的流程示意图;图2为本专利技术中确定待识别语音是否属于授权用户的一个实施例的流程示意图;图3为本专利技术中语音识别过程的一个实施例的流程示意图;图4为本专利技术中个性化的语音识别的装置的实施例一的结构示意框图;图5为本专利技术中个性化的语音识别的装置的实施例二的结构示意框图;图6为本专利技术中个性化的语音识别的装置的实施例三的结构示意框图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。请参考图1,图I为本专利技术中个性化的语音识别的方法的流程示意图。如图I所示,该方法包括步骤SlOl :确定待识别语音是否属于授权用户,如果是,则利用授权用户对应的语音识别模型对待识别语音进行识别,否则执行步骤S102。步骤S102 :确定待识别语音所属方言类别,并利用待识别语音所属方言类别对应的语音识别模型对待识别语音进行识别。下面对上述步骤进行具体说明。 本专利技术中的授权用户,指的是具有注册信息或可标识的身份信息的用户。如果授权用户是具有注册信息的用户,则步骤SlOl在确定待识别语音是否属于授权用户时,可通过待识别语音所属用户提交的当前身份信息与注册信息是否匹配来判断待识别语音是否属于授权用户。此外,授权用户也可以是具有可标识的身份信息的用户,这里所指的可标识的身份信息,包括预先通过授权用户的语音样本训练得到的声学模板。与之对应的,步骤SlOl确定待识别语音是否属于授权用户的方式包括提取待识别语音的声学特征,并确定待识别语音的声学特征与授权用户对应的声学模板之间的匹配度是否满足要求,如果是,则确定待识别语音属于授权用户,否则确定待识别语音不属于授权用户。请参考图2,图2为本专利技术中确定待识别语音是否属于授权用户的一个实施例的流程示意图。其中比对是为了确定待识别语音的声学特征与授权用户对应的声学模板之间的匹配度是否满足要求,如确定待识别语音的声学特征与授权用户的声学模板之间的余弦距离是否满足最低限值要求。为了确定待识别语音是否属于授权用户,在对语音样本和待识别语音进行特征提取时,可选择的声学特征包括说话人声道长度信息等,此外,这里的声学特征还可以是本领域技术人员在进行说话人确认时使用的其他特征,本专利技术对此不做限制。如果待识别语音是属于授权用户的,则本专利技术中,将利用与授权用户对应的语音识别模型对待识别语音进行识别。其中与授权用户对应的语音识别模型,是预先利用授权用户的语音标注样本训练得到的。请参考图3,图3为本专利技术中语音识别过程的一个实施例的流程示意图。图2中的授权用户的声学模板,只需要授权用户的语音样本即可训练得到,而图3中的授权用户对应的语音识别模型,则是通过授权本文档来自技高网...

【技术保护点】
一种个性化的语音识别的方法,包括:A.确定待识别语音是否属于授权用户,如果是,则利用所述授权用户对应的语音识别模型对所述待识别语音进行识别,否则执行步骤B;B.确定所述待识别语音所属方言类别,并利用所述待识别语音所属方言类别对应的语音识别模型对待识别语音进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘俊启胡星郭志峰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1