一种具有辅助翻译功能的输入方法,用来在进行翻译的时候给予用户相关内容提示,其特征在于该方法包括以下步骤:读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。本发明专利技术将专业领域词库集成于输入法当中,有效提高了翻译过程中文本的输入效率。
【技术实现步骤摘要】
本专利技术涉及语言文字的输入方法
,尤其是涉及到在语言翻译中提供计算机辅助翻译功能的语言文字快速输入方法。
技术介绍
随着社会科技与经济的高速发展,不同语种之间的信息交流已经成为信息交往中的重要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。目前翻译行业普遍存在的问题是翻译需求与日俱增、但翻译力量尤其是高端翻译人员严重紧缺,翻译工作效率低、成本高。翻译人员主要有以下障碍1)需要花费大量的时间来查询和翻译专业词汇;2)需要通过长期学习来提高个人技能,很难利用同业积累的知识和数据;3)缺少实用且易操作的工具来减少翻译过程中的大量重复和简单的劳动;4)缺少将人工决策和机器智能有效结合的、能处理复杂翻译任务的工具。由于上述障碍的存在,面对各种领域的翻译需求,大量的专业词汇的存在经常会导致译者需要进行大量的界面切换,通过各种电子词典或者词典网站获得相应专业词汇的翻译,然后再切换回翻译界面,浪费了大量的时间,同时也容易打断译者的思路。语言输入法是翻译工作中所必需的工具,对目标语言的输入完全依赖于输入法,但是目前常用的输入法除了具有一定的历史记忆功能(例如,能记住用户输入过的词或者句子,在用户再次进行相同词或者句子输入时,快速的给出提示),并不能给译者的翻译工作提供更多的帮助。译者经常会遇到利用输入法不能有针对性的快速输入的问题,需要输入的字词在输入法对应的词库中并不存在,或者由于使用频率的关系,排在比较靠后的位置,仍旧需要译者在字词选择栏中加以多次翻页才能找到需要输入的字词,这无疑对译者翻译效率的提高产生了较大的瓶颈。授权公告号为CN100524313C的中国专利技术专利公开了一种翻译过程中基于场景词库的快速输入法,在用户进行输入的过程中,读取并识别待翻译句中的待翻译词汇,然后从场景词库中取得与所述待翻译词汇对应的词条,将该词条注入到用户所使用的输入法自带的词库中,并将该词条在输入法输入框中的显示顺序优先级调到可以被首次选取输入的位置,加快用户的输入速度。其中,在将从场景词库中取得对应的词条注入到用户所使用的输入法词库的过程中,需要首先检测输入法,根据不同的输入法采取不同的方式将取得的 词条注入到用户所使用的输入法自带的词库中。此专利技术解决了现有的输入方法中不能对特定文本尤其是翻译文本进行有针对性的快速输入的不足,在不改变用户输入法习惯的情况下,采用词库与词汇注入的方案,在现有输入法的基础上,通过在翻译输入的过程中暂时的、有针对性地修改字词的显示顺序(词频),有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。但是由于上述的专利技术是游离于输入法之外的,致使在其应用的过程当中,场景词库当中的词汇和输入法中的词汇不能有机的结合,场景词库中的词汇不论其出现的概率大小,一律出现在输入框的最前面部分(即使其出现概率极低),在一定程度上影响了用户的输入。而且该专利技术需要将场景词库中的相关词条注入到输入法词库当中,需要进行与输入法的交互,应用的难度相对较大。
技术实现思路
本专利技术正是为了解决上述问题而提出的,其目的在于,提供一种具有辅助翻译功能的快速输入方法,其可在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。本专利技术的具有辅助翻译功能的快速输入方法,包括如下步骤读取待翻译句子;识别待翻译句子中所有可能的术语;从该句子所对应的领域字典中获取术语的翻译,从普通的双语电子字典中获取所有待译非术语词汇的翻译,建立一个高优先级树,将这些 翻译结果及词汇对应的概率放入这个高优先级树中;当用户输入文字时,同时匹配输入法当中的一般词汇树和高优先级树,并根据其概率进行对匹配的结果进行综合排序;在一句话输入结束后,清除本句的高优先级树词汇列表;重复上述的过程,直至所有待翻译句子输入完毕。其中,在进行待译非术语词汇翻译的时候,所利用的资源是普通的双语电子字典;在进行待译术语翻译的时候,利用的资源是与当前待译句子领域相对应的领域术语字典,这样,所获取的术语翻译就是该领域所对应的术语翻译,而不会取得该术语在其他领域内的翻译(相同的术语在不同的领域中经常有不同的翻译方式)。根据本专利技术,解决了现有的输入法以及各种计算机辅助翻译软件不能直观快捷的对翻译过程中的待翻译文本中的词汇已经专业术语进行提示的不足,在翻译过程中不改变用户的关注焦点的情况下,将专业领域词库集成于输入法当中,根据待翻译句子和用户的输入给出各种翻译提示,使用户能够快速的选取他们需要输入的词汇或者句子,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。附图说明图I为本专利技术所提的具有辅助翻译功能的输入法的系统结构图。图2为本专利技术所提的具有辅助翻译功能的输入法的方法流程图。图3为本专利技术实施例所显示的术语提示功能示意图。图4为本专利技术实施例所提的输入视窗示意图。图5为本专利技术实施例所提的输入视窗示意图。图6为本专利技术实施例所提的输入视窗示意图。具体实施例方式以下,通过参考附图来详细地说明本专利技术的特征、优点,本专利技术就会变得更加清楚了。图I是本专利技术所提的具有辅助翻译功能的输入法的系统结构图,利用该图来说明本专利技术的系统运作。如图I所示,本专利技术的输入系统100含有输入获取模块101、原文读取模块102、术语识别模块103、词典查询模块104、候选生成模块105及显示输出模块106。输入获取模块101获取用户的输入,并将其传送到候选生成模块105。原文读取模块102读取用户需要翻译的原文,并将其传送到术语识别模块103。术语识别模块103对待译原文中的术语进行识别,并将结果传送到词典查询模块104。词典查询模块104对传送来的待译原文中的词汇在词典中找到相应的译文,并且记录下来。对于原文中的术语,根据用户指定的领域信息,查询相应的领域相关的术语词 典,这个术语词典可以是人工编纂或者从本领域大规模文本语料当中提取出来的,对于其他词汇,查询普通的双语电子词典,并将查询到的词汇及其概率(词汇的概率是从大规模文本语料当中统计而来,并根据用户的使用进行调整)存入高优先级树当中。候选生成模块105对由用户的输入所生成的词汇树和高优先级树(词汇树和高优先级树都是以TRIE树的模式进行组织的)合并,两个树中的词汇进行综合排序。综合排序的方法是将每一个词汇对应一个整形数据,这个数据中包含是否为用户自定义词汇,对应输入单元的长度,是否是高优先级树中的数据,是否为整句最优路径上的节点,得分;其中得分包含术语概率,语言模型概率,用户自定义权重。所有的数据按照这个整形数的大小进行排序。排序的结果由显示输出模块106进行输出,供用户进行选择。根据本专利技术的上述结构,由于引入了待翻译句子的信息,将术语词典引入输入法当中,减少了用户在翻译过程中查询词典的工作;在用户的输入过程当中,将用户的输入与术语词典信息相结合,可以减少用户的在进行翻译工作时的击键次数,从而加快翻译的速度。接着,结合图I本专利技术所提的具有辅助翻译功能的输入法的系统架构图以及图2本专利技术所提的具有辅助翻译功能的输入法的方法流程图,以一个实施例来解说本专利技术的本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:胡日勒,魏勇鹏,万鑫,田尊崇,
申请(专利权)人:北京语智云帆科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。