【技术实现步骤摘要】
本专利技术涉及语音信号处理领域,尤其涉及一种语音输入方法和装置。
技术介绍
近年来,随着语音识别技术的发展,用户可以通过语音指令实现移动设备的操控,也可以通过语音实现文字的编辑输入等。其中,系统可以通过对用户输入的语音信号进行语音识别,并显示识别结果实现文字的编辑输入。然而,当用户输入语音信号中存在同音字或者有噪声等干扰时,识别结果的全部或部分可能出错;此时用户需要手动删除错误的部分后重新输入,操作复杂。
技术实现思路
本专利技术的实施例提供一种语音输入方法和装置,能够简化用户的操作。—方面,提供一种语音输入方法,包括:对用户输入的初始语音信息进行语音识另IJ,得到首次识别结果后显示;接收用户在所述初始语音信息后输入的二次语音信息;判断所述二次语音信息是否指示修改;如果指示,根据所述二次语音信息对所述首次识别结果进行修改后显示。另一方面,提供一种语音输入装置,包括:第一显示单元,用于对用户输入的初始语音信息进行语音识别,得到首次识别结果后显不;语音接收单元,用于接收用户在所述初始语音信息后输入的二次语音信息;指示确认单元,用于判断所述二次语音信息是否指示修改;修改显示单元,用于如果指示,根据所述二次语音信息对所述首次识别结果进行修改后显示。本专利技术实施例提供的语音输入方法和装置,当用户在初始语音信息后输入的二次语音信息指示修改时,可以直接根据用户输入的二次语音信息对首次识别结果进行修改后显示,从而实现语音输入。本专利技术实施例提供的技术方案,解决了现有技术中用户需要手动删除错误的部分后重新输入,操作复杂的问题,能够提高语音输入的效率。附图说明为了更清楚地说 ...
【技术保护点】
一种语音输入方法,其特征在于,包括:对用户输入的初始语音信息进行语音识别,得到首次识别结果后显示;接收用户在所述初始语音信息后输入的二次语音信息;判断所述二次语音信息是否指示修改;如果指示,根据所述二次语音信息对所述首次识别结果进行修改后显示。
【技术特征摘要】
1.一种语音输入方法,其特征在于,包括: 对用户输入的初始语音信息进行语音识别,得到首次识别结果后显示; 接收用户在所述初始语音信息后输入的二次语音信息; 判断所述二次语音信息是否指示修改; 如果指示,根据所述二次语音信息对所述首次识别结果进行修改后显示。2.根据权利要求1所述的语音输入方法,其特征在于,所述判断所述二次语音信息是否指示修改,包括: 将所述二次语音信息与所述初始语音信息进行音频比对,得到相似度值; 根据所述相似度值与预设的阈值的关系判断所述二次语音信息是否指示修改。3.根据权利要求2所述的语音输入方法,其特征在于,所述将所述二次语音信息与所述初始语音信息进行音频比对,得到相似度值的步骤,包括: 分别将所述初始语音信息和所述二次语音信息进行压缩,得到初始压缩语音和二次压缩语音; 分别提取所述初始压缩语音和所述二次压缩语音的音频特征参数,得到初始音频参数和二次音频参数; 将所述初始音频参数和所述二次音频参数分别进行欧式距离运算,得到相似距离; 根据所述相似距离确定相似度值。4.根据权利要求2所述的语音输入方法,其特征在于,所述根据所述二次语音信息对所述首次识别结果进行修改后显示,包括: 对所述二次语音信息进行语音识别,得到至少一个二次识别结果; 从所述至少一个二次识别结果中获取目标识别结果; 根据所述目标识别结果对所述首次识别结果进行修改后显示。5.根据权利要求1所述的语音输入方法,其特征在于,所述判断所述二次语音信息是否指示修改,包括: 对所述二次语音信息进行语义分析,得到分析结果; 根据所述分析结果判断所述二次语音信息是否指示修改。6.根据权利要求5所述的语音输入方法,其特征在于,所述根据所述二次语音信息对所述首次识别结果进行修改后显示,包括: 根据所述分析结果获取修改位置和目标语音信息; 对所述目标语音信息进行语音识别,得到至少一个二次识别结果; 从所述至少一个二次识别结果中获取目标识别结果; 根据所述目标识别结果和所述修改位置对所述首次识别结果进行修改后显示。7.根据权利要求4或6所述的语音输入方法,其特征在于,所述从所述至少一个二次识别结果中获取目标识别结果,包括: 根据所述至少一个二次识别结果的使用频率获取目标识别结果;或者, 根据所述至少一个二次识别结果与所述首次识别结果的关联度获取目标识别结果。8.根据权利要求1所述的语音输入方法,其特征在于,所述得到首次识别结果后显示,包括: 得到首次识别结果后以覆盖浮层的方式显示; 或者得到首次识别结果后以闪烁的方式显示。9.根据权利要求1所述的语音输入方法,其特征在于,如果未指示,还包括: 对所述二次语音信息进行语音识别,得到二次识别结果; 在所述首次识别结果后显示所述二次识别结果。10.一种语音输入装置,其特征在于,包括: 第一显示单元,用于对用户输入的初始语音信息进行语音识别,得到首次识别结果后显示; 语音接收单元,用于接收用户在所...
【专利技术属性】
技术研发人员:张然,邵颖,王力劭,
申请(专利权)人:北京车音网科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。