本发明专利技术公开了一种语音识别方法,包括:步骤一:用户对语音指令进行输入训练,打开语音上传网络端口,并将语音指令通过语音上传网络端口上传至网络服务器;步骤二:网络服务器对语音指令进行特征提取,提取成功后生成用户语音特征包,并将用户语音特征包下载到本地语音识别库;步骤三:断开语音上传网络端口;步骤四:根据本地语音识别库进行语音识别,识别成功后执行语音指令。本发明专利技术一种语音识别方法可以有效保护用户隐私的语音识别方法,在保证语音识别正确率前提下,杜绝用户隐私泄露问题。
【技术实现步骤摘要】
本专利技术涉及,具体涉及一种具有隐私保护功能的语音识别方法,本专利技术属于语音识别领域。
技术介绍
基于语音识别的控制方案和用户手动输入控制指令相比更加方便,在用户体验上更具优势,人们对语音识别有需求。但是现有的语音识别方法都需要依靠联网解析来完成,这对识别造成一定限制,如果不能联网那么语音识别任务就无法完成,另外还有个致命的缺点,那就是不能保护用户隐私,一旦网络被不法分子入侵,那用户的隐私就会暴露无遗,特别是对于卧室等私人空间,用户隐私的保护显得尤为重要!在语音识别时,语音识别系统实时采集环境中的音频,通过网络上传并识别,这过程中,如果有不法分子通过技术手段窃取上传的数据,将使得用户隐私遭受严重泄露。
技术实现思路
为解决现有技术的不足,本专利技术的目的在于提供,以解决现有技术语音识别过程需要依赖网络解析,识别过程用户隐私容易泄露的技术问题。为了实现上述目标,本专利技术采用如下的技术方案: ,其特征在于,包括如下步骤: 步骤一:用户对语音指令进行输入训练,打开语音上传网络端口,并将语音指令通过语音上传网络端口上传至网络服务器; 步骤二:网络服务器对语音指令进行特征提取,提取成功后生成用户语音特征包,并将用户语音特征包下载到本地语音识别库; 步骤三:断开语音上传网络端口 ; 步骤四:根据本地语音识别库进行语音识别,识别成功后执行语音指令。前述的,其特征在于,所述步骤一包括: 步骤Ia:验证用户权限,如果用户权限通过,执行步骤Ib ; 步骤Ib:判断本地语音识别库是否建立,如果建立,执行步骤四,如果没有建立,执行步骤Ic ; 步骤Ic:用户对语音指令进行输入训练; 步骤Id:打开语音上传网络端口,将语音指令通过语音上传网络端口上传至网络服务器。前述的,其特征在于,所述步骤Ia中,验证用户权限的方式包括:密码验证或指纹验证。前述的,其特征在于,所述步骤Id包括: 步骤Idl:打开语音上传网络端口 ; 步骤ld2:对用户语音输入进行监听; 步骤ld3:如果语音上传网络端口收到语音,执行步骤ld4,否则执行步骤ld2 ; 步骤ld4:将语音信息存入临时寄存器; 步骤ld5:判断语音上传网络端口是否打开,如果打开执行步骤ld6,否则将临时寄存器里的语音信息送入本地语音识别库; 步骤ld6:将临时寄存器里的语音信息上传至网络服务器; 前述的,其特征在于,所述步骤二包括: 步骤2a:网络服务器对语音指令进行特征提取,提取成功转下一步,否则转步骤ld2: 步骤2b:语音指令计数加I,进行下一条语音指令输入训练; 步骤2c:判断语音指令计数数值是否等于最低要求数; 步骤2d:等于最低要求数转步骤2e,否则转步骤ld2: 步骤2e:用户语音跟读识别训练结束,生成该用户语音识别特征包,下载到本地存储语音识别库。前述的,其特征在于,所述步骤2a包括:用户对每一个语音指令进行的输入训练至少需要两次,两次之间误差不超过5%才可以判定训练成功,否则需要重新进行输入训练。前述的,其特征在于,所述步骤2e包括:在下载本地存储语音识别库后,要求用户输入用户信息,设置用户优先级顺序。前述的,其特征在于,管理员具有管理员权限的用户可以调整已存在用户的优先级顺序。前述的,其特征在于,所述步骤三包括: 步骤3a:断开语音联网端口 ; 步骤3b:将临时寄存器里的语音信息送入本地语音识别库。前述的,其特征在于,网络服务器采用频率谱、功率谱的均值、峰值特征信息对语音指令进行特征提取。本专利技术的有益之处在于:本专利技术可以有效保护用户隐私的语音识别方法,在保证语音识别正确率前提下,杜绝用户隐私泄露问题。【附图说明】图1是本专利技术的一个优选实施的结构示意图; 图2是基于图1的进一步详细实施示意图。【具体实施方式】以下结合附图和具体实施例对本专利技术作具体的介绍。参照图1所示,本专利技术,本专利技术特征在于先将采集到用户语音信息存储在临时存储单元里,根据语音上传网络端口的开闭状态将当前用户语音上传网络服务器进行识别或送人本地语音识别库进行识别;采用线上联网用户语音训练特征提取,将提取的用户语音特征包下载在本地存储单元后断开语音上传网络端口,仅依靠本地存储的用户语音识别特征包进行用户语音控制指令识别,具体流程如下: 步骤一:用户对语音指令进行输入训练,打开语音上传网络端口,并将语音指令通过语音上传网络端口上传至网络服务器; 步骤二:网络服务器对语音指令进行特征提取,提取成功后生成用户语音特征包,并将用户语音特征包下载到本地语音识别库; 步骤三:断开语音上传网络端口; 步骤四:根据本地语音识别库进行语音识别,识别成功后执行语音指令。可见,本专利技术需要用户首先进行联网关键语音指令输入训练,依托网络服务器识别完成一个特有的语音识别包存入本地语音识别库,之后断开语音上传网络断开,仅依靠本地语音识别库进行语音识别,杜绝用户语音隐私泄露。图2是本专利技术具体的流程图。对于步骤一,图2增加了权限验证的过程。同时增加了一开始的语音识别初始化过程。语音初始化包括将用户关键语音指令计数置零。在权限验证中: 步骤Ia:验证用户权限,如果用户权限通过,执行步骤Ib ;验证用户权限的方式包括:密码验证或指纹验证; 步骤Ib:判断本地语音识别库是否建立,如果建立,执行步骤四,如果没有建立,执行步骤Ic ; 步骤Ic:用户对语音指令进行输入训练,这一步首先提示用户进行语音输入跟读训练,用户跟着对语音指令进行输入训练,作当前第1页1 2 本文档来自技高网...
【技术保护点】
一种语音识别方法,其特征在于,包括如下步骤:步骤一:用户对语音指令进行输入训练,打开语音上传网络端口,并将语音指令通过语音上传网络端口上传至网络服务器;步骤二:网络服务器对语音指令进行特征提取,提取成功后生成用户语音特征包,并将用户语音特征包下载到本地语音识别库;步骤三:断开语音上传网络端口;步骤四:根据本地语音识别库进行语音识别,识别成功后执行语音指令。
【技术特征摘要】
【专利技术属性】
技术研发人员:朱晓庆,孙泉明,付涛,王晓东,
申请(专利权)人:普天智能照明研究院有限公司,杭州鸿雁电器有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。