当前位置: 首页 > 专利查询>株式公司CS专利>正文

一种应用于家庭网络的语音识别方法技术

技术编号:7796190 阅读:224 留言:0更新日期:2012-09-24 17:48
本发明专利技术涉及一种应用于家庭网络的语音识别方法,尤其是一种应用于家庭网络的通过语音识别机器来进行语音识别的方法。在本发明专利技术中,因语音识别机的模式可根据周边状况进行变更,即时处理语音识别,降低对非指令语音的错误识别,因此可在噪音环境中提高指令的识别率,可自动适应语音识别数据库中未有的语音者的音色,记录声学模型并对其进行识别,从而提高识别率,还可统一多个区域中的同种指令,减少过于繁多的指令,使语音识别的准确率大大提高,同时有效地减少错误识别。

【技术实现步骤摘要】

本专利技术涉及ー种语音识别方法,尤其是一种通过语音识别机器来进行语音识别的方法。
技术介绍
随着网络技术的发达,使用ー个输入/输出装置来控制由网络连接在一起的远程机器的系统也随之上市。 不仅如此,以语音指令来控制由网络所连接的机器的系统也日益 以往技术中的语音识别系统存在杂音影响机器控制及特定语音者语音识别率降低等缺陷和极限。就特定语音者语音识别率降低这一点来说,虽然可以通过适应化来弥补这ー缺陷,但给用户带来诸多的不便。不仅如此,为了通过语音来控制多个机器,需要在每个机器内储存不同的指令,从而导致指令过多、过于繁琐,致使识别率降低。
技术实现思路
本专利技术所要解决的技术问题是提供ー种应用于家庭网络的语音识别方法,语音识别方法通过语音识别来控制由网络连接的机器,可随时输入语音,无需其他特别准备,即可通过语音识别即时准确地识别指令及非指令的其他声音,从而減少错误识别的频率,并自动适应语音者的语音;不仅如此,还可以提高特定语音者的语音识别率,同时可实现多个机器的控制指令统ー化,并提高语音识别的准确率。本专利技术解决上述技术问题的技术方案如下语音识别方法,包括即时接收语音输入的阶段SI ;測定上述SI阶段中所输入的所述语音的強弱及持续时间的阶段S2 ;将所述S2阶段中所測定的所述语音的強弱及持续时间与任意值相比,并按默音、弱音、强音对所述语音进行分类的阶段S3 ;根据所述S3阶段中的分类,若为默音,则计算默音的持续时间,并持续维持语音输入待机状态,若为弱音或強音,则进行语音识别处理的阶段S4 ;根据所述S4阶段进行的语音识别处理,进行制定单位语音识别处理的阶段S5 ;根据所述S5阶段的結果,决定是否对整体语音进行语音识别处理,并进行处理准备的阶段S6 ;根据所述S6阶段,若决定执行整体语音的语音识别处理,则对整体语音进行语音识别处理的阶段S7 ;根据所述S7阶段的結果,决定是否认证语音识别处理的结果,并控制机器,进行识别语音适应化的阶段S8 ;在所述S6阶段中,不对所述整体语音进行语音识别时,或根据所述S8阶段,不认证所述语音的识别结果时,则根据所述S3阶段中所決定的语音分类,若为弱音时,则转换为噪音模式,若为强音吋,则转换为拒绝模式的阶段S9。进一歩,最好还包括在所述S3阶段中,根据事先制定的強弱,可将所述语音分为三个等级,在所述S2阶段中所測定的语音音量若为最低的第一等级时,则所述语音分到默音类;若所述语音的音量属于高于所述第一等级的第二等级,且所述语音的音长为任意值吋,则所述语音分到弱音类;若所述语音的音量为最高的第三等级,且所述语音的音长满足任意值时,则所述语音分到强音类的SlO阶段。进一歩,最好还包括在所述S5阶段的所述制定単位的语音识别处理进行的过程中,若识别关键字时,将所述关键字最末音素传向虚拟机的对数似然比与各自的声学模型对比,记忆具有最高值的声学模型的阶段S11。最好还包括在所述S6阶段中,所述语音识别结果与已存指令一致,并决定对所述整体语音进行第二次识别的阶段S12。最好还包括在所述S12阶段中,决定进行所述第二次语音识别时,将所述Sll阶段中所记忆的所述声学模型换为第二次识别模式的准备阶段S13。最好还包括在所述S13阶段中,将所述已准备的声学模型用于数据库,并进行第二次语音识别的阶段S14。最好还包括在所述S8阶段中,若所述第二次语音识别结果被认证,根据所述认证结果控制机器的阶段S15 ;及在所述S8阶段中,储存语音,并进行所储存语音的适应化作 业,更新具有发音的语音者的音色特征的声学模型的阶段S16。进一歩,最好还包括在所述S16阶段中,检查是否有具有所述语音者音色特征的数据库的阶段S17 ;及在所述S16阶段中,若未有所述音色的数据库时,在所述语音适应化的作业中,更新所述已识别的语音音色数据库的阶段S18。最好还包括在所述S17阶段中,检查所述Sll阶段中,与所述各自的声学模型对比后,是否存在具有最高值的所述声学模型的阶段S19 ;及在所述S19阶段中,若检查到在所有的声学模型中不存在具有最高值的所述声学模型吋,记录没有具有与所述SI阶段中所输入的所述语音类似音色的声学模型的阶段S20。最好还包括在所述S15阶段的所述机器控制中,将事前语音识别所设置的区域用户名记为控制区域用户名的阶段S21 ;及判断在所述S8阶段中,所认证的所述识别结果是区域选择指令还是机器控制指令的阶段S22 ;以及在所述S22阶段中,若判定为区域选择指令吋,将所述区域用户名变更记为所述控制区域用户名的阶段S23 ;及在所述S22阶段中,若判定为机器控制指令时,控制所述控制区域用户名所属区域机器的阶段S24。进一歩,最好还包括在所述S23阶段中,在变更记忆所述控制区域用户名后,在一定时间后,将所述所设置的区域用户名复原为所述控制区域用户名的阶段S25。进一歩,最好还包括在所述S9阶段中,在不认证所述S8阶段中的所述识别结果时,根据所述Sio阶段所分类的语音种类另行划分计算点,増加各种类所述计算点的阶段S26 ;及在所述S26阶段中,若各个计算点先到达所定的任意值时,识别机的状态若为所述弱音时则变更为噪音模式,若为所述強音时则变更为拒绝模式的阶段S27 ;以及在所述S4阶段中,若所述默音计算点先到达所定临限值时,变为基本模式的阶段S28。最好还包括根据所述S28阶段所变更的模式,若为拒绝模式时,拒绝除所述基本模式变换指令外的所有指令的识别,若为噪音模式时,人为地降低所输入语音的強弱,控制所述SlO阶段中的属于第二等级的噪音,若为基本模式时,进行正常识别的阶段S29 ;及在所述S8阶段的所述拒绝模式状态下,若先定的基本模式复原指令的识别被认证时,将所述语音识别机的模式变更为所述基本模式的阶段S30。本专利技术的有益效果是语音识别机的模式可根据周边状况进行变更,即时处理语音识别,降低对非指令语音的错误识别,在噪音环境中提高指令的识别率,可自动适应语音识别数据库中未有的语音者的音色,记录声学模型并对其进行识别,从而提高识别率,可统ー多个区域中的同种指令,減少繁多的指令,使语音识别的准确率大大提高,同时有效地减少错误识别。附图说明图I是本专利技术实施方式的家庭网络系统的概述结构图;图2是本专利技术实施方式的语音识别方法的整体流程图;图3是图2的语音识别处理过程的详细流程图; 图4是图2的第一次识别结果处理过程的详细流程图;图5是图2的第二次识别结果处理进行过程的详细流程图;图6是图2的模式转换处理过程的详细流程图;图7是本专利技术实施方式的根据控制用户名变更的机器控制过程的流程图。具体实施例方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。图I是本专利技术实施方式的家庭网络系统的概述结构图。如图I所示,本专利技术的语音识别家庭网络系统可在每个区域设置语音识别机器,每个语音识别机器通过有线或无线与控制照明等装置的控制机连接。控制机根据用户的操作来控制机器,分析由语音识别机所传送的指令,从而来控制机器。各区域的语音识别机具有固有的位置用户名,控制机分析上述用户名,并控制所属区域内所设置的相应语音识别机位置上的机器。图2是本专利技术实施方式的语音识别方法的整体流程图。如图2所示,系统开始运作后,语音识别机本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于家庭网络的语音识别方法,其特征在于,所述语音识别方法包括即时接收语音输入的阶段Si ;测定上述SI阶段中所输入的所述语音的强弱及持续时间的阶段S2;将所述S2阶段中所测定的所述语音的强弱及持续时间与任意值相比,并按默音、弱音、强音对所述语音进行分类的阶段S3;根据所述S3阶段中的分类,若为默音,则计算默音的持续时间,并持续维持语音输入待机状态,若为弱音或强音,则进行语音识别处理的阶段S4;根据所述S4阶段进行的语音识别处理,进行制定单位语音识别处理的阶段S5;根据所述S5阶段的结果,决定是否对整体语音进行语音识别处理,并进行处理准备的阶段S6;根据所述S6阶段,若决定执行整体语音的语音识别处理,则对整体语音进行语音识别处理的阶段S7;根据所述S7阶段的结果,决定是否认证语音识别处理的结果,并控制机器,进行识别语音适应化的阶段S8;在所述S6阶段中,不对所述整体语音进行语音识别时,或根据所述S8阶段,不认证所述语音的识别结果时,则根据所述S3阶段中所决定的语音分类,若为弱音时,则转换为噪音模式,若为强音时,则转换为拒绝模式的阶段S9。2.根据权利要求I所述的应用于家庭网络的语音识别方法,其特征在于,所述语音识别方法还包括在所述S3阶段中,根据事先制定的强弱,将所述语音分为三个等级,在所述S2阶段中所测定的语音音量若为最低的第一等级时,则所述语音分到默音类;若所述语音的音量属于高于所述第一等级的第二等级,且所述语音的音长为任意值时,则所述语音分到弱音类;若所述语音的音量为最高的第三等级,且所述语音的音长满足任意值时,则所述语音分到强音类的SlO阶段。3.根据权利要求I所述的应用于家庭网络的语音识别方法,其特征在于,所述语音识别方法还包括在所述S5阶段的所述制定单位的语音识别处理进行的过程中,若识别关键字时,将所述关键字最末音素传向虚拟机的对数似然比与各自的声学模型对比,记忆具有最高值的声学模型的阶段Sll ;及 在所述S6阶段中,所述语音识别结果与已存指令一致,并决定对所述整体语音进行第二次识别的阶段S12 ;及 在所述S12阶段中,决定进行所述第二次语音识别时,将所述Sll阶段中所记忆的所述声学模型换为第二次识别模式的准备阶段S13 ;及 在所述S13阶段中,将所述已准备的声学模型用于数据库,并进行第二次语音识别的阶段S14。4.根据权利要求I所述的应用于家庭网络的语音识别方法,其特征在于,所述语音识别方法还包括在所述S8阶段中,若所述第二次语音识别结果被认证,根据所述认证结果控制机器的阶段S15 ;及 在所述S8阶段中,储存所述语音,并进行所储存语音的适应化作业,更新具有发音的语音者的音色特征的声学模型的阶段S16。5.根据权利要求4所述的应用于家庭...

【专利技术属性】
技术研发人员:林东伸方英奎
申请(专利权)人:株式公司CS
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1