【技术实现步骤摘要】
机器翻译方法和装置
本专利技术涉及数据处理
,尤其涉及一种机器翻译方法和装置。
技术介绍
当需要进行翻译时,翻译设备可以采用机器翻译模型,对词汇进行翻译,得到翻译 结果。传统的机器翻译模型,从人工构建的双语训练数据出发,使用统计的方法来计算出翻 译概率和目标语言的语言模型概率。 但是,采用传统的机器翻译模型难以确定准确的翻译结果,例如,对于英文句子 give me a shot,存在多种合理的翻译结果,例如,给我照相,给我打一枪,向我击球 进攻等。而单独看这个输入的句子give me a shot,采用目前的传统的机器翻译模型 是无法确定哪个翻译结果是最优的。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。 为此,本专利技术的一个目的在于提出一种机器翻译方法,该方法可以提高翻译结果 的准确度。 本专利技术的另一个目的在于提出一种机器翻译装置。 为达到上述目的,本专利技术第一方面实施例提出的机器翻译方法,包括:获取待翻译 的文本;获取预先建立的机器翻译模型,其中,所述机器翻译模型是根据外部世界场景信息 建立的;采用所述机器翻译模型,对所述待翻译的文本进行翻译,得到翻译结果。 本专利技术第一方面实施例提出的机器翻译方法,通过采用基于外部世界场景信息确 定的机器翻译模型进行翻译,可以在翻译时考虑外部世界场景信息因素,得到更符合外部 世界场景的翻译结合,提高翻译结果的准确度。 为达到上述目的,本专利技术第二方面实施例提出的机器翻译装置,包括:第一获取模 块,用于获取 ...
【技术保护点】
一种机器翻译方法,其特征在于,包括:获取待翻译的文本;获取预先建立的机器翻译模型,其中,所述机器翻译模型是根据外部世界场景信息建立的;采用所述机器翻译模型,对所述待翻译的文本进行翻译,得到翻译结果。
【技术特征摘要】
1. 一种机器翻译方法,其特征在于,包括: 获取待翻译的文本; 获取预先建立的机器翻译模型,其中,所述机器翻译模型是根据外部世界场景信息建 立的; 采用所述机器翻译模型,对所述待翻译的文本进行翻译,得到翻译结果。2. 根据权利要求1所述的方法,其特征在于,还包括:建立所述机器翻译模型,所述建 立所述机器翻译模型,包括: 获取外部世界场景信息; 建立语言模型以及建立短语翻译模型,其中,所述语言模型和/或所述短语翻译模型 是根据所述外部世界场景信息建立的; 根据所述语言模型和所述短语翻译模型,建立所述机器翻译模型。3. 根据权利要求2所述的方法,其特征在于,当所述语言模型是根据所述外部世界场 景信息建立时,所述建立语言模型,包括: 根据所述外部世界场景信息建立基于外部世界场景信息的语言模型,并将所述基于外 部世界场景信息的语言模型确定为用于建立机器翻译模型的语言模型;或者, 根据所述外部世界场景信息建立基于外部世界场景信息的语言模型,以及,获取传统 的语言模型,根据所述基于外部世界场景信息的语言模型和所述传统的语言模型,确定用 于建立机器翻译模型的语言模型。4. 根据权利要求3所述的方法,其特征在于,所述根据所述基于外部世界场景信息的 语言模型和所述传统的语言模型,确定用于建立机器翻译模型的语言模型,包括: 对所述基于外部世界场景信息的语言模型和所述传统的语言模型进行线性对数处理, 将线性对数处理后的模型确定为用于建立机器翻译模型的语言模型。5. 根据权利要求2所述的方法,其特征在于,所述获取外部世界场景信息,包括: 采用所述用户使用的设备,对所述用户所在外部世界场景进行识别,得到所述外部世 界场景信息,所述用户使用的设备包括:可穿戴设备,或者,移动设备。6. 根据权利要求1-5任一项所述的方法,其特征在于,所述获取待翻译的文本,包括:接收文本信息,将所述文本确定为待翻译的文本;或者, 接收语音信息,对所述语音信息进行语音识别,将语音识别结果确定为待翻译的文本; 或者, 接收图片信息,对所述图片信息进行OCR识别,将OCR识别结果确定为待翻译的文本。7. 根据权利要求6所述的方法,其特征在于,所述待翻译的文本是非用户语言,翻译结 果是用户语言,所述方法还包括: 获取用户输入的用户语言的输入语音,所述输入语音包括:当前输入的输入语音,和/ 或,历史输入的输入语音; 对所述用户语言的输入语音进行语音识别,得到语音识别结果; 根据所述语音识别结果和所述翻译结果,对所述机器翻译模型进行修正。8. -种机器...
【专利技术属性】
技术研发人员:吴先超,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。