机器翻译装置和机器翻译方法制造方法及图纸

技术编号：13138881 阅读：103 留言：0更新日期：2016-04-07 00:16

本发明专利技术涉及一种机器翻译装置和机器翻译方法。根据一个实施例，一种机器翻译装置包括：语音识别部，其接收源语言的语音输入，识别所述源语言的所述语音输入并且生成所述源语言的文本，所述源语言的所述语音输入是按次序的输入，所述源语言的所述文本是语音识别的结果和分析信息；分割部，其基于所述分析信息，判定待处理单位的分割位置和翻译顺序信息，所述待处理单位是语义单位，每个所述语义单位表示所述源语言的所述文本的部分含义；机器翻译部，其将所述待处理单位按次序翻译成目标语言；翻译控制部，其基于所述翻译顺序信息排列翻译后的单位，并且生成所述目标语言的文本；以及输出部，其输出所述目标语言的所述文本。

全部详细技术资料下载

【技术实现步骤摘要】

在此描述的实施例一般地涉及机器翻译装置和相关方法。
技术介绍
近年来，开发了用于口语的自然语言处理。例如，用于使用个人数字助理翻译旅行会话的机器翻译技术是一个不断发展的领域。旅行会话中的句子和用户之间的对话通常很短。当完整地输入每个句子并且执行机器翻译处理时，在用户之间的意图交流的准确性方面几乎没有难度。另一方面，具有口语的另一种表达，被称为独白，例如演讲报告或简介会。在独白中，一个说话者说出至少一段，该段具有涉及单个主题的数个句子。当独白经受机器翻译处理时，在说话者完全说出该段之前，段中的每个句子需要逐步经受机器翻译处理。逐步执行机器翻译处理实现说话者对听众进行意图传达的高准确性。这种机器翻译处理被称为“渐进翻译”或“同步翻译”。同步翻译连续地输入话语作为源语言文本，将源语言文本分割成要适当地处理的单位，并且将这些单位翻译成目标语言。但是，口语不同于书面语(例如，校对者编辑的报纸文章和用户手册)，并且口语没有指示分割句子和从句的标点符号。因此，在口语中难以适当地分割句子和从句。为了解决上面的困难，第2007-18098号日本公开披露了由停顿(其间说话者停止说话的很短时间)和执行的形态分析来分割源语言文本，并且由预定模式修正分割位置以便将独白分割成待处理单位。但是，仅渐进翻译各单位不会变换句子结构并且因此生成的机器翻译结果实现说话者对听众进行意图传达的低准确性。例如，考虑以下情况:对话语进行语音识别处理，并且输入源语言文本(日语文本)“77° y ?更新?:八'夕'?修正汾遅札τ来週(乙* 9分析该日语文本以便分割三个待处理单位(三个从句)“77...

【技术保护点】
一种机器翻译装置，包括：处理器，包括：语音识别部，其接收源语言的语音输入，识别所述源语言的所述语音输入并且生成所述源语言的文本，所述源语言的所述语音输入是按次序的输入，所述源语言的所述文本是语音识别的结果和分析信息；分割部，其基于所述分析信息，判定待处理单位的分割位置和翻译顺序信息，所述待处理单位是语义单位，每个所述语义单位表示所述源语言的所述文本的部分含义；机器翻译部，其将所述待处理单位按次序翻译成目标语言；翻译控制部，其基于所述翻译顺序信息排列翻译后的单位，并且生成所述目标语言的文本；以及输出部，其输出所述目标语言的所述文本。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：园尾聪，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人