一种云翻译输入法及系统,涉及云计算、机器翻译、计算机辅助翻译、概率词典和输入法等领域。所述云翻译输入法通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,提高了翻译用户输入译文的效率,且支持任何语言的输入。所述云翻译输入系统采用基于云服务的架构实现,设有客户端和服务器端;客户端设有控制模块和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。
【技术实现步骤摘要】
本专利技术涉及云计算、机器翻译、计算机辅助翻译、概率词典和输入法等领域,尤其是涉及一种云翻译输入法及系统。
技术介绍
目前,涉及翻译输入法的中国专利申请有:公开(公告)号为CN102662490A,申请人为北京语智云帆科技有限公司的“一种具有辅助翻译功能的输入方法”;公开(公告)号为CN101034407,申请人为传神联合(北京)信息技术有限公司的“一种翻译过程中基于场景词库的快速输入法”。这类输入法利用用户当前正在翻译的原文信息,对候选词表进行扩充和调序,从而提高用户译文输入的效率,可简称为“翻译输入法”。以上的翻译输入法都是采用基于词典的方法,通过选取原文中出现的词语并在机读词典中查询对应的翻译,将这些翻译加入候选词表并对其进行调序。这种基于词典的方法仅考虑了词语级别的翻译,未考虑词语所在上下文对词义的影响,难以解决自然语言中大量存在的歧义现象。此外,现有的翻译辅助输入法都是采用本地输入法的方式实现,未引入云服务架构,导致不能采用更大规模的多语言的语料、词典、术语表等数据资源,不能引入支持强制解码的机器翻译等对计算机运算能力要求较高的先进解码技术,也不能实现跨平台特性。
技术实现思路
本专利技术的目的在于解决现有技术中存在的上述问题,提供基于机器翻译引擎并适用于任何语言、任何输入码编码规则的跨平台,可有效提高翻译用户输入译文效率的一种云翻译输入法及系统。云翻译输入法,包括以下步骤:SI,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行输入码解码,将解码得到的词语及其概率放入候选词表;S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;S8,向用户界面返回候选词表,并支持用户自造词。在步骤S2中,所述输入码解码的过程中支持模糊码规则,不仅支持双向模糊码(即一对模糊码中,二者可以任意互换使用),而且支持单向模糊码(即一对模糊码中,前者可以代表后者,但后者不能代表前者)。本专利技术具有充分的通用性,只要提供概率词典、从特定源语言到目标语言的机器翻译引擎、相应的术语识别模块,所述云翻译输入法可适用于任何语言的任何输入码编码规则。云翻译输入系统采用云服务的方式为用户提供云翻译输入法的功能。云翻译输入系统设有客户端和服务器端;客户端设有控制模块和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。客户端程序执行步骤SI,并将用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的输入码发送至服务器端;接收到服务器端返回的候选词表后,执行步骤S8。服务器端程序接收客户端发送的内容,执行步骤S2?S7,并将候选词表返回客户端。翻译输入系统支持用户自定义模糊码规则,具体为:翻译输入系统采用基于云服务的架构实现,支持用户自定义的个性化模糊码规则。所述翻译输入系统提供了用户自定义模糊码的界面,用户可以自行定义从任意输入码串到任意输入码串的单向或双向模糊码规则。客户端程序每次向服务器端发送请求时,会同时发送当前生效的模糊码规则。服务器端程序在执行权利要求1所述的步骤S2时能自动根据这些模糊码规则进行输入码的解码。本专利技术通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,支持单向和双向模糊码,适用于任何语言的任何输入码编码规则,本专利技术与现有的翻译输入法相比,具有以下有益效果:1、通过引入机器翻译引擎和强制解码技术,有效预测译文内容,使候选词表及其排序更为准确科学,从而提高了译文输入的效率;2、该翻译输入法是一套独立的输入法,不依赖于任何现有的输入法,能够独立为用户提供自定义模糊码规则、用户词典等提高用户输入效率的功能;3、同时支持双向和单向模糊码,更利于在某些特定语言(如:汉语、藏语)的音码输入法中对某些特定方言(如:汉语的南方口音,藏语的拉萨口音、安多口音等)进行兼容性支持;4、该输入法的设计与语言和编码规则无关,具有充分的通用性,对于任意一对特定的源语言和目标语言,仅需提供该目标语言的概率词典、从该源语言到该目标语言的机器翻译引擎和相应的术语识别模块,即可在该输入法中实现翻译辅助功能;5、采用基于云服务的系统架构,有利于访问更大规模的语言资源,有利于支持机器翻译引擎及输入法解码过程在服务器端的高效运行,避免了对用户客户端资源的过度占用;6、采用基于云服务的系统架构,有利于化解输入法依赖特定平台的问题,确保了输入法的跨平台特性;7、采用基于云服务的系统架构,有利于用户词典等用户相关信息和用户设置在多个平台间的同步。【附图说明】图1是本专利技术实施例1中所述云翻译输入法的流程图。图2是本专利技术实施例2中所述翻译输入系统的结构示意图。【具体实施方式】为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图,对本专利技术进行进一步详细说明。应当理解,此处所描述的【具体实施方式】仅用以解释本专利技术,并不用于限定本专利技术。实施例1参照图1,本实施例中所述云翻译辅助输入法,该输入法包括以下步骤:SI,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行解码,将解码得到的词语及其概率放入候选词表;S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;...
【技术保护点】
一种云翻译输入法,其特征在于包括以下步骤:S1,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行输入码解码,将解码得到的词语及其概率放入候选词表;S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;S8,向用户界面返回候选词表,并支持用户自造词。
【技术特征摘要】
【专利技术属性】
技术研发人员:史晓东,陈毅东,王博立,
申请(专利权)人:厦门大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。