基于逆向文本共识的多翻引擎协作语音翻译系统与方法技术方案

技术编号:28497444 阅读:28 留言:0更新日期:2021-05-19 22:33
本发明专利技术提出基于逆向文本共识的多翻引擎协作语音翻译系统与方法。所述系统包括:语音输入子系统:用于输入待译语音;第一语音翻译子系统:用于对待译语音进行翻译输出第一语音翻译结果;第二文本翻译子系统、共识判断子系统以及输出子系统;第二文本翻译子系统包括多个文本翻译引擎;将第一语音翻译子系统输出的每个第一语音翻译结果作为第二文本翻译子系统的多个文本翻译引擎的输入,第二文本翻译子系统输出多个文本翻译结果;共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断;所述输出子系统基于翻译结果共识判断输出对应于所述待译语音的翻译记录文件。本发明专利技术还提出基于上述系统实现的语音翻译方法。提出基于上述系统实现的语音翻译方法。提出基于上述系统实现的语音翻译方法。

【技术实现步骤摘要】
基于逆向文本共识的多翻引擎协作语音翻译系统与方法


[0001]本专利技术属于语音智能翻译
,尤其涉及一种基于逆向文本共识的多翻引擎协作语音翻译系统与方法。

技术介绍

[0002]随着人类社会、经济和文化的日益全球化,持不同母语的人在旅游、会议、商贸、体育等许多场合中的交流变得越来越频繁,语言上的障碍也愈见明显。于是,人们迫切希望计算机能够具有更高的智能以充当克服人类语言障碍的中间角色,实现人与人之间的自由交流。这种由计算机系统实现的从一种自然语言的语音到另一种自然语言语音的翻译就是我们通常所说的语音翻译(Speech

to

Speech Translation)。由于人们之间的日常交流通常是以自然语语形式进行的,研究自然口语的自动翻译往往具有更广阔的应用前景,目前国际上开展语音翻译技术的研究一般也都是基于自然口语的,因此,语音翻译又常被称为口语自动翻译(Automatic Spoken Language Translation,简写为SLT)。
[0003]目前口语自动翻译的研究和应用有两个典型应用场景:一是不同语言使用者之间面对面的日常口语沟通交流;二是会议场景下讲者面向广大听众的演讲交流会议场景下。由于会议具有领域专业性,其涉及的大量专业术语和行业相关的语言表达,给机器翻译带来较大挑战。
[0004]对此,中国专利技术专利申请CN202011016786.8针对实时翻译场景,聚焦于由语音识别引擎提供的连续语音的转写文本,即先辨识出待处理的当前文本其中是否混杂着多种语种字词,当判定为混语种文本后进而结合语句之间的时间间隔以及在先语句的语种,即处理当前文本之前所使用的翻译方向,得到切换阈值,最后根据该切换阈值以及当前待处理文本中的不同语种字词的占比,决策是否需要将处理当前文本之前所使用的翻译方向进行切换。
[0005]重要的高端会议(例如多国首脑会议、多用户高端会议)通常需要准确记录与会者的实时发言。但是由于会议通常需要保持实时性,避免较长延迟,现有的系统都只能直接保存所有与会者发言记录,这显然增大了数据存储量与传输量,尤其是在远程会议中会带来较大的传输成本。如果不记录所有发言,则需要人工对不同语种的翻译结果进行校对,又降低了工作效率,且需要增加人工成本。
[0006]因此,如何有效的针对多语种多用户的远程会议生成有效的会议记录,并自动化的识别出可能存在的翻译争议,成为亟待解决的技术问题。

技术实现思路

[0007]为解决上述技术问题,本专利技术提出一种基于逆向文本共识的多翻引擎协作语音翻译系统与方法。所述系统包括:语音输入子系统:用于输入待译语音;第一语音翻译子系统:用于对待译语音进行翻译输出第一语音翻译结果;第二文本翻译子系统、共识判断子系统以及输出子系统;第二文本翻译子系统包括多个文本翻译引擎;将第一语音翻译子系统输
出的每个第一语音翻译结果作为第二文本翻译子系统的多个文本翻译引擎的输入,第二文本翻译子系统输出多个文本翻译结果;共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断;所述输出子系统基于翻译结果共识判断输出对应于所述待译语音的翻译记录文件。
[0008]本专利技术还提出基于上述系统实现的语音翻译方法。
[0009]具体来说,在本专利技术的第一个方面,提供一种基于逆向文本共识的多翻引擎协作语音翻译系统,所述系统包括:
[0010]语音输入子系统:所述语音输入子系统用于输入待译语音;
[0011]第一语音翻译子系统:所述第一语音翻译子系统用于对所述待译语音进行翻译,输出第一语音翻译结果;
[0012]作为本专利技术的一个改进,所述系统还包括第二文本翻译子系统、共识判断子系统以及输出子系统;
[0013]作为上述改进的关键技术手段之一,所述第二文本翻译子系统包括多个文本翻译引擎;
[0014]将所述第一语音翻译子系统输出的每个第一语音翻译结果作为所述第二文本翻译子系统的多个文本翻译引擎的输入,所述第二文本翻译子系统输出多个文本翻译结果;
[0015]作为本专利技术的一个改进,所述共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断;
[0016]所述输出子系统基于所述翻译结果共识判断输出对应于所述待译语音的翻译记录文件。
[0017]作为本专利技术的一个改进,所述第一语音翻译子系统包括多个第一语音翻译引擎;
[0018]所述第一语音翻译引擎将所述待译语音翻译为目标语种的第一语音翻译结果;
[0019]所述第二文本翻译子系统的所述文本翻译引擎将所述第一语音翻译结果翻译为对应所述待译语音语种的文本翻译结果。
[0020]作为上述改进的关键技术手段之一,所述共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断,具体包括:
[0021]计算所述多个文本翻译结果之间的两两相似度,构建第一相似度矩阵。
[0022]判断所述第一相似度矩阵是否稳定;
[0023]如果不稳定,则输出对应于所述待译语音的翻译记录文件。
[0024]在本专利技术的第二个方面,提供一种基于逆向文本共识的多翻引擎协作语音翻译方法,所述方法基于第一语音翻译方法和第二文本翻译方法实现,
[0025]具体的,所述方法包括如下步骤:
[0026]S700:接收待译语音;
[0027]S701:采用第一语音翻译方法将所述待译语音翻译为目标语种的第一语音翻译结果;
[0028]S702:采用第二文本翻译方法,将所述第一语音翻译结果翻译为待译语音语种的多个第二文本翻译结果;
[0029]S703:计算所述多个第二文本翻译结果之间的两两相似度,构建第一相似度矩阵;
[0030]S704:判断所述第一相似度矩阵是否稳定;如果不稳定,则生成对应于所述待译语
音的翻译记录文件并保存到系统日志中。
[0031]作为进一步的改进,所述步骤S704进一步包括:
[0032]S7041:判断所述第一相似度矩阵是否稳定;
[0033]如果不稳定,则进入下一步步骤S7042:
[0034]S7042:采用第三文本识别方法,将所述待译语音转化为第三待译文本;
[0035]S7043:采用第四相似度比对方法,计算所述第三待译文本与所述多个第二文本翻译结果之间的多个文本相似度;
[0036]S7044:若所述多个文本相似度均低于预定阈值,则生成对应于所述待译语音的翻译记录文件并保存到系统日志中。
[0037]在本专利技术的第三个方面,提供基于前述第一个方面的系统实现的多翻引擎协作语音翻译方法。
[0038]本专利技术的上述方法可以通过计算机形式的程序指令自动化的实现。因此,在本专利技术的第四个方面,提供一种计算机可读存储介质,其上存储有计算机可执行程序指令,通过包含处理器和存储器以及多个功能子系统的终端设备,执行所述程序指令,用于实现前述第二个或者第三个方面所述的方法。
[0039本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于逆向文本共识的多翻引擎协作语音翻译系统,所述系统包括:语音输入子系统:所述语音输入子系统用于输入待译语音;第一语音翻译子系统:所述第一语音翻译子系统用于对所述待译语音进行翻译,输出第一语音翻译结果;其特征在于:所述系统还包括第二文本翻译子系统、共识判断子系统以及输出子系统;所述第二文本翻译子系统包括多个文本翻译引擎;将所述第一语音翻译子系统输出的每个第一语音翻译结果作为所述第二文本翻译子系统的多个文本翻译引擎的输入,所述第二文本翻译子系统输出多个文本翻译结果;所述共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断;所述输出子系统基于所述翻译结果共识判断输出对应于所述待译语音的翻译记录文件。2.如权利要求1所述的一种基于逆向文本共识的多翻引擎协作语音翻译系统,其特征在于:所述第一语音翻译子系统包括多个第一语音翻译引擎;所述第一语音翻译引擎将所述待译语音翻译为目标语种的第一语音翻译结果;所述第二文本翻译子系统的所述文本翻译引擎将所述第一语音翻译结果翻译为对应所述待译语音语种的文本翻译结果。3.如权利要求1所述的一种基于逆向文本共识的多翻引擎协作语音翻译系统,其特征在于:所述共识判断子系统基于所述多个文本翻译结果,进行翻译结果共识判断,具体包括:计算所述多个文本翻译结果之间的两两相似度,构建第一相似度矩阵。4.如权利要求3所述的一种基于逆向文本共识的多翻引擎协作语音翻译系统,其特征在于:所述输出子系统基于所述翻译结果共识判断输出对应于所述待译语音的翻译记录文件,具体包括:判断所述第一相似度矩阵是否稳定;如果不稳定,则输出对应于所述待译语音的翻译记录文件。5.如权利要求3或4所述的一种基于逆向文本共识的多翻引擎协作语音翻译系统,其特征在于:所述输出子系统基于所述翻译结果共识判断输出对应于所述待译语音的翻译记录文件,具体包括:判断所述第一相似度矩阵是否稳定;如果不稳定,则将所述待译语音转化为待译文本;计算所述多个文本翻译结果与所述待译文本之间的多个第二相似度;若每个所述第二相似度均低于预定阈值,则输出对应于所述待译语音的翻译记录文件。6.如权利要求1或4所述的一种基于逆向文本共...

【专利技术属性】
技术研发人员:何征宇
申请(专利权)人:传神语联网网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1