一种语音翻译方法和语音翻译设备技术

技术编号:19964415 阅读:42 留言:0更新日期:2019-01-03 12:55
本申请实施例提供了一种语音翻译方法和语音翻译设备,通过用户语音成分对齐获取两路语音信号中同一个用户的用户语音成分的时间差,根据时间差将两路语音信号进行信号叠加,将其中一个用户的用户语音成分的语音能量进行增强,得到属于该用户的语音增强信号,当两个用户同时说话时,可分别获取两个用户各自的用户语音成分的时间差,并根据时间差得到分别对应两个用户的语音增强信号,然后,根据增强语音信号就能够分别生成两个用户的译文语音信号。因此,本申请实施例提供的技术方案,能够全双工地翻译对话双方的说话内容,且一方说话不会导致另一方的译文信号输出中断,从而,在保证输出完整翻译语音的同时,提高对话双方的交流效率。

A Speech Translation Method and a Speech Translation Equipment

【技术实现步骤摘要】
一种语音翻译方法和语音翻译设备
本申请涉及计算机
,尤其涉及一种语音翻译方法和语音翻译设备。
技术介绍
语言不通的两个对话者在进行语音交流时,可以使用翻译机对双方的对话内容进行翻译,从而实现对话双方的有效交流。在现有技术中,一种翻译机的工作方式是:对话一方在说话时按压一次(或保持按住)翻译机的特定按键,使翻译机开始采集对话一方的语音信息,在对话一方再次按压(或松开)翻译机的特定按键时,翻译机停止采集语音信息,同时对已采集到的语音信息进行翻译,并输出翻译后的语音。可见,现有技术中,翻译机采集语音信息和输出翻译语音要通过两个步骤进行,且无法同时接受并翻译对话双方的语音信息,从而导致对话双方交流效率过低,使对话缺乏连贯性。为了尝试提高对话双方通过翻译机进行对话交流时的效率,现有技术对翻译机提供了一种改良的工作方式,采用语音激活检测的方式检测对话者是否在说话,并采集有对话一方说话时的语音信息,从而,使用户无需通过按压特定按键的方式操作翻译机采集信息,这种方法仅简化了翻译机的操作过程,接收采集语音信息和输出翻译语音依然是需要通过两个步骤进行,对话双方交流依然效率过低。现有技术对翻译机还提供了另一种改良的工作方式,在翻译机输出翻译语音时,可以在接收到任何一方对话内容后中断当前输出,并转换为采集语音信息的状态,从而一定程度上提高对话双方的交流效率,但是,中断翻译机的语音输出会导致翻译语音的不完整,造成对话双方交流信息丢失。由此可见,现有技术中翻译机的工作方式无法保证输出完整翻译语音的同时,提高对话双方的交流效率。
技术实现思路
本申请实施例提供了一种语音翻译方法和语音翻译设备,以解决现有技术翻译机的工作方式无法保证输出完整翻译语音的同时,提高对话双方的交流效率的问题。第一方面,根据本申请实施例,提供了一种语音翻译方法,包括:通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个。第二方面,根据本申请实施例,提供了一种语音翻译设备,包括:设备本体;分布设置在所述设备本体两端的两个拾音单元,用于采集包含用户语音成分的两路语音信号;设置在所述设备本体中心处的播放单元,用于输出译文语音信号;设置于设备本体内部的信号处理模块,用于执行以下程序步骤:对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个。由以上技术方案可知,本申请实施例提供了一种语音翻译方法和语音翻译设备,其中,所述方法包括:通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个。用户语音成分对齐能够获取两路语音信号中同一个用户的用户语音成分的时间差,根据时间差将两路语音信号进行信号叠加,就能够将其中一个用户的用户语音成分的语音能量进行增强,得到属于该用户的语音增强信号,当两个用户同时说话时,可分别获取两个用户各自的用户语音成分的时间差,并根据时间差得到分别对应两个用户的语音增强信号,然后,根据增强语音信号就能够分别生成两个用户的译文语音信号。因此,本申请实施例提供的语音翻译方法和语音翻译设备,能够全双工地翻译对话双方的说话内容,且一方说话不会导致另一方的译文信号输出中断,从而,在保证输出完整翻译语音的同时,提高对话双方的交流效率。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请一示例性实施例示出的一种语音翻译方法的流程图;图2是本申请一示例性实施例示出的一种语音翻译方法步骤S130的流程图;图3是本申请一示例性实施例示出的一种语音翻译方法步骤S140的流程图;图4是本申请一示例性实施例示出的一种语音翻译方法更新时间差的流程图;图5是本申请一示例性实施例示出的设置翻译设备工作状态的流程图;图6是本申请一示例性实施例示出的一种语音翻译设备的结构示意图;图7是本申请一示例性实施例示出的一种语音翻译设备的结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。为了解决现有技术翻译机的工作方式无法保证输出完整翻译语音的同时,提高对话双方的交流效率的问题,本申请实施例提供了一种语音翻译方法和语音翻译设备。下面是本申请的方法实施例。图1是本申请一示例性实施例示出的一种语音翻译方法的流程图。该方法可应用于翻译机、机器人等设备中。参见图1所示,该方法可以包括以下步骤:步骤S110,通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;本申请实施例中,翻译设备设置有两个拾音单元。为了便于描述本申请的技术方案,本申请实施例中将两个拾音单元分别称作第一拾音单元和第二拾音单元。翻译设备在使用时,对话双方各自位于靠近第一拾音单元一侧和靠近第二拾音单元一侧,其中,靠近第一拾音单元一侧的用户称作第一用户,靠近第二拾音单元一侧的用户称作第二用户。当第一用户和第二用户的其中之一说话时,两个拾音单元会分别采集包含用户语音成分的语音信号,从而得到两路语音信号,本申请实施例中将第一拾音单元采集的语音信号称作第一路语音信号,将第二拾音单元采集的语音信号称作第二路语音信号。优选地,第一拾音单元和第二拾音单元在翻译设备上的距离应尽量远,例如设置在翻译设备的两端,以减小两个拾音单元之间可能出现的电磁干扰。本申请实施例中,每个拾音单元可以包含一个麦克风或者是包含多个麦克风组成的麦克风阵列。如果拾音单元只包含一个麦克风,那么这两个拾音单元的麦克风型号或性能参数应该相同,如果拾音单元包含一个麦克风阵列,那么这两个麦克风阵列中麦克风的布局、型号或性能参数应该相同,使两个拾音单元不存在硬件上的差异,消除硬件差异对采集语音信号造成的影响。步骤S120,对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;由于第一拾音单元和第二拾音单元在翻译设备上分布设置,用户到每个拾音单元的距离不同而产生距离差,当其中一个用户说话时,用户语音经过空气传输后会在不同的时刻先后被两个拾音单元采集到(例如:当第一用户说话时,第一用户的用户语音会先传输到第一拾音单元,并经过一个时间差后,传输到第二拾音单元),从而使两个本文档来自技高网
...

【技术保护点】
1.一种语音翻译方法,其特征在于,包括:通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个。

【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括:通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个。2.根据权利要求1所述的方法,其特征在于,所述根据时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号,包括:根据用户位置确定两个拾音单元中的近端拾音单元和远端拾音单元;所述近端拾音单元获取两路所述语音信号中的近端语音信号,所述远端拾音单元获取两路所述语音信号中的远端语音信号;根据所述时间差,对所述远端语音信号向前移位修正,生成远端移位语音信号;将所述远端移位语音信号与所述近端语音信号进行信号叠加,生成所述增强语音信号。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述时间差,对所述近端语音信号向后移位修正,生成近端移位语音信号;使用所述近端移位语音信号抵消所述远端语音信号。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取信号对齐后的两路所述语音信号的相关度;分析所述相关度是否低于预设阈值;如果低于预设阈值,则重新获取所述时间差。5.根据权利要求1所述的方法,其特征在于,当所述译文信号包括译文语音信号时,所述根据增强语音信号生成译文信号,包括:使用预设的语种识别模型,获取所述增强语音信号对应的语种;使用对应语种的语音识别模型将所述增强语音信号识别成待翻译文本;将所述待翻译文本翻译成预设语...

【专利技术属性】
技术研发人员:牛歌
申请(专利权)人:北京帝派智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1