英文人名识别方法和装置制造方法及图纸

技术编号:12358364 阅读:88 留言:0更新日期:2015-11-20 14:22
本发明专利技术提出一种英文人名识别方法和装置,该英文人名识别方法包括:接收用户输入的语音,所述语音中包括英文人名;通过加载的中文识别声学模型和已构建的识别网络对所述用户输入的语音进行识别,获取所述语音的识别结果,所述语音的识别结果中包括所述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作,本发明专利技术实现成本低,并且由于本发明专利技术加载的是中文识别声学模型,不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率,同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。

【技术实现步骤摘要】

本专利技术涉及语音识别
,尤其涉及一种英文人名识别方法和装置
技术介绍
近年来,语音识别技术飞速发展,越来越多的用户使用语音功能,通过语音控制机器与机器交流,其中对于人名的识别功能也逐渐成为了每个识别系统的必备功能,广泛应用于通过语音寻找通讯录联系人,语音发短信,发邮件等场景中。随着国际化大潮的到来,通讯录中的英文人名越来越多。英文人名识别技术也越来越成为语音识别系统中不可或缺的一部分。但是现有的英文人名识别技术存在以下问题和缺陷:(I)耗费的时间和成本巨大,这是由于声学模型训练是一项极其耗费机器和时间的技术,另外,对于英文人名语料的获取和整理也同样需要消耗大量的人力和经费;(2)识别正确率的影响,由于目前还没有完善的中英文混合解码方案,导致中英文混合解码对其他非英文内容的识别会产生影响,从而降低整体的识别准确率。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种英文人名识别方法。该方法通过加载的中文识别声学模型和已构建的识别网络对用户输入的语音中的英文人名进行识别,由于无需进行额外的模型训练和语料收集等工作,实现成本低,并且不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率。本专利技术的第二个目的在于提出一种英文人名识别装置。为了实现上述目的,本专利技术第一方面实施例的英文人名识别方法,包括:接收用户输入的语音,所述语音中包括英文人名;通过加载的中文识别声学模型和已构建的识别网络对所述用户输入的语音进行识别,获取所述语音的识别结果,所述语音的识别结果中包括所述英文人名的识别结果。本专利技术实施例的英文人名识别方法,接收用户输入的包括英文人名的语音之后,通过加载的中文识别声学模型和已构建的识别网络对上述用户输入的语音进行识别,获取上述语音的识别结果,上述语音的识别结果中包括上述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作,上述英文人名识别方法实现成本低,并且由于该方法加载的是中文识别声学模型,不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率,同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。为了实现上述目的,本专利技术第二方面实施例的英文人名识别装置,包括:接收模块,用于接收用户输入的语音,所述语音中包括英文人名;识别模块,用于通过加载的中文识别声学模型和已构建的识别网络对所述接收模块接收的用户输入的语音进行识别,获取所述语音的识别结果,所述语音的识别结果中包括所述英文人名的识别结果。本专利技术实施例的英文人名识别装置,接收模块接收用户输入的包括英文人名的语音之后,识别模块通过加载的中文识别声学模型和已构建的识别网络对上述用户输入的语音进行识别,获取上述语音的识别结果,上述语音的识别结果中包括上述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作,上述英文人名识别装置实现成本低,并且由于该装置加载的是中文识别声学模型,不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率,同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。【附图说明】本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术英文人名识别方法一个实施例的流程图;图2为本专利技术英文人名识别方法中构建识别网络一个实施例的流程图;图3为本专利技术英文人名识别方法中分词过程一个实施例的流程图;图4(a)?图4(b)为本专利技术英文人名识别方法中通过决策树确定发音一个实施例的不意图;图5为本专利技术英文人名识别装置一个实施例的结构示意图;图6为本专利技术英文人名识别装置另一个实施例的结构示意图。【具体实施方式】下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1为本专利技术英文人名识别方法一个实施例的流程图,如图1所示,该英文人名识别方法可以包括:步骤101,接收用户输入的语音,上述语音中包括英文人名。步骤102,通过加载的中文识别声学模型和已构建的识别网络对上述用户输入的语音进行识别,获取上述语音的识别结果,上述语音的识别结果中包括上述英文人名的识别结果。上述英文人名识别方法中,接收用户输入的包括英文人名的语音之后,通过加载的中文识别声学模型和已构建的识别网络对上述用户输入的语音进行识别,获取上述语音的识别结果,上述语音的识别结果中包括上述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作,上述英文人名识别方法实现成本低,并且由于该方法加载的是中文识别声学模型,不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率,同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。进一步地,在本专利技术图1所示实施例步骤102之前,还包括构建识别网络的步骤,图2为本专利技术英文人名识别方法中构建识别网络一个实施例的流程图,如图2所示,可以包括:步骤201,对上述用户使用的终端设备中保存的通讯录和/或已知人名列表中的英文人名进行分词。本实施例中,对上述用户使用的终端设备中保存的通讯录和/或已知人名列表中的英文人名进行分词,分词的每个部分具有一个特定的发音,这里采用分词的优先级如下:长词根,元音,辅音这样的顺序,例如:“Bart”可以分词为“B”、“ar”和“t”。具体地,参见图3,图3为本专利技术英文人名识别方法中分词过程一个实施例的流程图,如图3所示,步骤201可以包括:步骤301,在分词列表单元中查找与上述英文人名对应的子项。以英文人名“Bart”为例,从分词列表单元中查找到的与上述英文人名对应的子项包括 “ b ”、“ a ”、“ ar ”、“ t ” 和 “ rt ” 等。步骤302,根据长度优先和元音优先的原则对查找到的子项进行筛选。举例来说,可以先按照长度优先的原则进行筛选,例如留下长度为2的子项,这样筛选后获得的子项为“ar”和“rt”;然后再按照元音优先的原则进行筛选,获得的子项为“ ar ”。当然,也可以先按照元音优先的原则进行筛选,再按照长度优先的原则进行筛选,本实施例对长度优先和元音优先的原则的使用顺序不作限定。步骤303,将筛选获得的子项作为分词点,对上述英文人名进行分词。这里的分词点是指以筛选获得的子项作为对英文人名进行分词的切分点,例如:上例中筛选获得的子项为“ar”,以“ar”作为分词点,可以将“Bart”分为3部分,“B”、“ar”和“t”,也就是说,筛选获得的子项作为分词的一部分,筛选获得的子项的左右两侧的字符分别作为分词的一部分。如果筛选获得的子项的左侧部分和/或右侧部分的字符的长度还比较长,可以将筛选获得的子项的左侧部分和/或右侧部分的字符按照步骤301?步骤3当前第1页1 2 3 本文档来自技高网...
英文人名识别方法和装置

【技术保护点】
一种英文人名识别方法,其特征在于,包括:接收用户输入的语音,所述语音中包括英文人名;通过加载的中文识别声学模型和已构建的识别网络对所述用户输入的语音进行识别,获取所述语音的识别结果,所述语音的识别结果中包括所述英文人名的识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐立亮彭守业
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1