多格式嵌入式文件的翻译制造技术

技术编号:33141164 阅读:13 留言:0更新日期:2022-04-22 13:51
一种方法包括由服务器接收来自用户的对多格式嵌入式文件MFEF文档的翻译的请求,其中,该MFEF文档包括多个嵌入式元素。响应于对MFEF文档的请求,服务器自动地识别嵌入式元素的元素类型,其中,嵌入式元素包括第一元素类型和第二元素类型。服务器还从多个嵌入式元素之中识别外语嵌入式元素,其中,外语嵌入式元素是采用与用户的优选语言不同的语言的嵌入式元素。服务器选择翻译器来翻译外语嵌入式元素,包括选择用于翻译第一元素类型的外语嵌入式元素的第一翻译器和用于翻译第二元素类型的外语嵌入式元素的第二翻译器。的外语嵌入式元素的第二翻译器。的外语嵌入式元素的第二翻译器。

【技术实现步骤摘要】
【国外来华专利技术】多格式嵌入式文件的翻译


[0001]本专利技术一般涉及机器翻译。更具体地说,本专利技术涉及多格式嵌入式文件(MFEF)的机器翻译。

技术介绍

[0002]多格式嵌入式文件(MFEF)通常用于世界各地的许多地方,尤其是在其中对因特网的访问容易获得且经常被使用的工业化地区。MFEF是包含不同格式的多个媒体元素(例如,文本、图像、音频和视频元素)的文件。MFEF的示例包括超文本(HTML)文件,以及许多其它公知的文件格式,诸如与桌面出版、演示、字处理软件相关联的文件格式。媒体元素在MFEF中的使用持续增长,因为正在进行的因特网和联网技术改进使得共享更大的富媒体文件更快且更容易。

技术实现思路

[0003]说明性实施例提供了一种用于翻译多格式嵌入文件(MFEF)文档的嵌入式元素的计算机实现的方法、计算机系统、以及计算机程序产品。在一个实施例中,所述方法包括由服务器接收来自用户的对多格式嵌入式文件MFEF文档的翻译的请求,其中,所述MFEF文档包括多个嵌入式元素。响应于对所述MFEF文档的请求,所述服务器自动地:识别所述嵌入式元素的元素类型,其中,所述嵌入式元素包括第一元素类型和第二元素类型;从所述多个嵌入式元素之中识别外语嵌入式元素,所述外语嵌入式元素是采用与所述用户的优选语言不同的语言的嵌入式元素;以及选择适当的翻译器来翻译所述外语嵌入式元素,其中,选择第一翻译器来翻译第一元素类型的外语嵌入式元素,以及选择第二翻译器来翻第二元素类型的译外语嵌入式元素。该方面的其它实施例包括对应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,每一者均被配置成执行该方法的动作。
附图说明
[0004]在所附权利要求中阐述了被认为是本专利技术的特性的新颖特征。然而,通过参考以下结合附图对说明性实施例的详细描述,将最好地理解本专利技术本身及其优选使用模式、进一步的目标和优点,其中:
[0005]图1描述了其中可以实现说明性实施例的数据处理系统的网络的框图;
[0006]图2描绘了其中可以实现说明性实施例的数据处理系统的框图;
[0007]图3描绘了根据说明性实施例的由具有不同语言的多个媒体元素的MFEF所生成的屏幕;
[0008]图4A描绘了根据说明性实施例的网络配置的框图;
[0009]图4B描绘了根据说明性实施例的网络配置的框图;
[0010]图4C描绘了根据说明性实施例的网络配置的框图;
[0011]图5描绘了根据说明性实施例的用于翻译MFEF文档的示例性MFEF翻译系统的框
图;
[0012]图6描绘了根据说明性实施例的MFEF数据结构的实施例的框图;以及
[0013]图7描绘了根据说明性实施例的用于翻译MFEF文档的示例性过程的流程图。
具体实施方式
[0014]关于网站描述的某些实施例仅作为示例,而不是暗示对说明性实施例的任何限制。关于网站描述的实施例同样可用于在说明性实施例的范围内的具有嵌入式元素的任何文档。结合web浏览器而使用MFEF文档描述的任何描述或示例同样适用于在不使用web浏览器的情况下被访问的MFEF文档。
[0015]随着在线广告商竞争用户的注意力并且宽带因特网连接继续扩展,MFEF中的媒体元素的实现已经变得越来越普遍。因特网广告以许多形式出现。除了图形图像可以寄存在广告客户网站的网页上以外,传统形式的因特网广告与传统的用图形图像做广告没有什么不同。利用这样的网页广告,零售商有机会吸引观看者的注意力,并且如果成功,则将进行销售。然而,尽管因特网广告具有到达全世界受众的潜力,但广告中的媒体元素(诸如音频、视频和图像)通常仅与讲广告中所用语言的用户有效地交流。在线翻译服务能够翻译网站的纯文本元素,但是不翻译图像、视频或音频元素中的书面或口头词语。
[0016]用于描述本专利技术的说明性实施例总体上致力于并解决上述缺少对MFEF的所有外语元素进行翻译的问题。如本文所使用的术语“外语”及其变型通常是指除用户的一种或多种优选语言之外的任何语言。说明性实施例认识到,嵌入式元素的语言很大程度上取决于MFEF文档的创建者和贡献者,并且因此可能由全世界任何地方的具有对MFEF文档的写访问的用户来决定。目前存在用于网站的有限翻译的在线服务,但是其限于翻译网站的纯文本部分,而不翻译其他类型的嵌入式元素,诸如图像、音频和视频类型的元素。
[0017]说明性实施例认识到,通过解析MFEF文档以识别和评估所有嵌入式元素,或者简单地通过评估MFEF文档的所有部分,可以在MFEF文档的元素中识别出语言障碍。一旦识别了MFEF文档中的语言障碍,就应该纠正语言障碍。
[0018]例如,假设MFEF文档的单个元素是唯一的用户外语元素,而其余的多个元素采用用户优选的语言。例如,在交互式网站上以外语提交的用户评论和在商业网站上采用外语的广告是这种情况的示例。说明性实施例认识到,在一些这样的情况下,补救该问题与仅翻译单个元素而不影响MFEF文档的其余部分一样简单。
[0019]例如,诸如网站上的贡献者或广告商之类的用户可能不熟悉世界范围内将访问网站的其他用户的语言。当用户试图用他们的贡献或广告来联系广泛的受众时,受众被限于可以说出或阅读针对贡献或广告所使用的语言的那些人。许多其他不熟悉贡献或广告所使用的语言的用户可能没有翻译元素的方法,或者可能没有花费时间来试图找到翻译元素的方法。结果,语言障碍限制了用户联系网站的某些访问者的能力。
[0020]作为进一步的结果,在在线广告的情况下,语言障碍潜在地对用户的商业和广告预算具有负面影响。一方面,广告商可能由于语言障碍而错过对不能理解广告的访问者的销售。而且,即使广告不被呈现给的所有访问者理解,用户仍然可能被期望为广告被显示的每个实例付费。因此,由于潜在的销售损失和向对广告中使用的语言不熟悉的访问者做广告的费用,这种情况增加了对广告商的业务的负面影响。
[0021]说明性实施例还认识到,在用户方面需要很大努力的情况下,语言障碍问题的补救可能不是有效的。例如,可以创建各种翻译服务,这些翻译服务要求用户主动地分离MFEF文档的特定元素,并逐个元素地找出这样的翻译服务,这显著地中断了用户浏览各种网站的能力。例如,执行在线研究的用户可能更喜欢继续搜索以他们自己的优选语言呈现的信息,而不是花费时间来找到翻译其它语言的元素的方式。与继续以他们的母语搜索信息相比,一些用户可能认为这是低效的。
[0022]说明性实施例还认识到,在未保留原始MFEF文档的框架或布局,从而以与原始元素相同的布局提供翻译后的元素的情况下,对语言障碍问题的补救可能是无效的。例如,在MFEF文档的特定布局的上下文之外,嵌入式元素可能失去某种含义,例如以特定顺序发布的评论或提供与特定图像相关联的内容的音频元素。在这种情况下,如果用户接收到在原始MFEF的布局的上下文之外的翻译,则确定翻译后的元素如何适合原始图像并理解在翻译期间丢失的上下文可能是非常困难且耗时的。
[0023]因此,说明性实施例认识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:由服务器接收来自用户的对多格式嵌入式文件MFEF文档的翻译的请求,其中,所述MFEF文档包括多个嵌入式元素;响应于对所述MFEF文档的请求,所述服务器自动地:识别所述嵌入式元素的元素类型,其中,所述嵌入式元素包括第一元素类型和第二元素类型;从所述多个嵌入式元素之中识别外语嵌入式元素,所述外语嵌入式元素是采用与所述用户的优选语言不同的语言的嵌入式元素;以及使用被选择用于翻译所述第一元素类型的外语嵌入式元素的第一翻译器和被选择用于翻译所述第二元素类型的外语嵌入式元素的第二翻译器来翻译所述外语嵌入式元素。2.根据权利要求1所述的方法,其中,所述请求包括与所述MFEF文档的位置有关的位置信息。3.根据权利要求2所述的方法,其中,所述位置信息包括统一资源定位符URL。4.根据权利要求1所述的方法,其中,所述请求包括所述MFEF文档。5.根据权利要求1所述的方法,其中,所述元素类型包括文本格式和非文本格式。6.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:刘速梁洋D
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1