一种文字转换方法及装置制造方法及图纸

技术编号:4930862 阅读:188 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种文字转换方法,用于提高自然语言自动翻译的准确性。所述方法包括:根据获得的第一语言文字表达的词得到与词对应的语义项;根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;根据第二语言的语法规则将第二语言文字表达的词组织成句子。本发明专利技术还公开了用于实现所述方法的装置和系统。

【技术实现步骤摘要】

本专利技术涉及计算机及通信领域,特别是涉及文字转换方法及装置
技术介绍
伴随着信息技术的发展以及全球网络的一体化趋势,机器翻译技术也得以不断提高,翻译软件的辅助翻译作用愈专利技术显。目前,国内的机器翻译软件就不下百种,根据这些软件的翻译特点,大致可以分为三大类词典翻译类、汉化翻译类和专业翻译类。词典翻译类仅是提供词的查找和翻译,无法提供句子或文章的翻译。 对于汉化翻译类,在平时的翻译过程中,句型相同或相似的句子也经常出现,软件大多采用的是语法树结构的翻译内核,这种内核适用于比较有规律的语句,而对于变化多端的自然语言,采用千篇一律的翻译模式,往往不能奏效。另一种以语法模式为主的翻译内核,是基于传统语法树和以自然语言为基础的一种广义语法结构,计算机根据这些规则举一反三地进行翻译,在不断学习新语法的情况下,高质量的参考译文就出现了。广义语法的基础是句型和类别,这使语法的表现形式更简单、易用,并可分类继承,提高了系统的专业翻译水平。然而该方法仍存在一定的局限性,对灵活的自然语言翻译仍不够准确。 专业翻译类是一种人工辅助翻译方式,需要有外语基础的工作人员来辅助完成翻译工作,无法自动完成较理想的翻译工作。 综上,现有的翻译方法所实现的翻译结果均不理想。
技术实现思路
本专利技术实施例提供一种文字转换方法及装置,用于提高自然语言自动翻译的准确性。 —种文字转换方法,包括以下步骤 根据获得的第一语言文字表达的词得到与词对应的语义项; 根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项; 根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词; 根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。 —种用于实现文字转换的装置,包括 语义查询模块,用于根据获得的第一语言文字表达的词得到与词对应的语义项; 语义转换模块,用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项; 词查找模块,用于根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词; 组织模块,用于根据第二语言的语法规则将第二语言文字表达的词组织成句子。 —种用于实现文字转换的系统,包括 第一用户设备,用于获得第一语言表达文字的句子;以及获得该句子的句法代码;根据该句法代码以通用句法结构的形式将该句子输出给用户,和/或,根据该句法代码将该句子中每个词对应的语义项输出给用户,并将用户确认后的句法代码发送给服务器和第二用户设备;其中,句法代码用于表示通用句法结构,并且当通用句法结构的各结构对应有词时,句法代码还包括与句子中每个词的语义项对应的语义代码; 服务器,用于判断本地是否存有第一语言表达的句子所对应的句法代码;若有,则将所述句子的句法代码发送给第一用户设备;否则,根据第一语言表达的句子获得该句子的句法代码并发送给第一用户设备,或者,指示第一用户设备根据第一语言表达的句子获得该句子的句法代码; 第二用户设备,用于根据获得的句法代码中的语义代码获得第二语言文字表达的词,并根据第二语言的语法表达规则和句法代码将第二语言文字表达的词组织成句子。 本专利技术实施例根据第一语言的词查找与其具有相同或相近含义的第二语言的词,从而实现第一语言到第二语言的翻译,并且文字转换结果更准确。附图说 明 附图说明图1为本专利技术实施例中文字转换方法的主要流程图; 图2为本专利技术实施例中文字转换方法的详细流程图; 图3为本专利技术实施例中第一语言操作界面的示意图; 图4为本专利技术实施例中第二语言操作界面的示意图; 图5为本专利技术实施例中根据用户的输入和指示进行文字转换方法的详细流程图; 图6为本专利技术实施例中包含语义项输入的操作界面的示意图; 图7为本专利技术实施例中装置的主要结构图; 图8为本专利技术实施例中装置的详细结构图; 图9为本专利技术实施例中系统的结构图。具体实施例方式专利技术人发现,自然语言通讯的基本原则是语义约定通讯,可以首先基于自然语言学常识推导出各种自然语言通用的句子语义约定基本定律,然后再根据这组定律进行多种语言之间的文字转换。 定律1 :各种自然语言词汇及固定搭配短语的语义,均可用本语言基础词汇进行语义约定(例如,朗曼英语词典用1000多常用词汇对任意词汇、固定搭配短语进行语义约定);并且,一种自然语言的基础词汇,可以对其他语言的任意词汇进行语义约定(用一种自然语言的常用词汇对其他自然语言的任意词汇符号进行语义描述)。 定律2 :从定律1可以自然引申出基础词汇语义约定定律各种自然语言基础词汇的语义彼此循环约定(例如,'好''坏'的反义词。'父亲'儿子的爸爸。'美'美丽、漂亮、好看.......。)。 定律3 :自然语言语义符号冗余定律在不参照句子以外上下文的前提下,如果一个句子中缺损某个语义符号(包括词汇、语法、句法规则符号表达式)不影响读者理解语义,并且读者知道缺损的是什么符号,则此符号属于习惯性表达冗余符号(例如,汉语中的大多数量词、英语中的不定冠词、不可能实现的虚拟语气表达规则)。对于不同自然语言之间的语义信息通讯而言,此类冗余符号不需要进行语义约定。 定律4 :只有各种自然语言通用的语法概念才是必要语法概念。虽然各种自然语言的语法概念的表达形式不同,虽然自然语言翻译既可以直译也可以意译。但是,无论直译还是意译,任何一种自然语言翻译的译文语法转换过程,都是在凭空添加原文中没有的译文特殊语法概念。因此,各种自然语言的特殊语法概念实际上均满足缺损某个词汇、语法、句法规则符号表达式不影响读者理解语义,并且读者知道缺损的是什么符号的冗余成分判定条件。 定律5 :任何一个不规范的句子语义表达式(含词汇语义和语法语义)均可以用规范的句子语义表达式进行语义约定(例如,任何一个固定搭配句子、成分缺损句子、口语句子,均可以用一个规范的书面语体句子表达式进行语义约定)。 从实用层面上讲,从上述定律出发,将有可能产生一种各种自然语言通用的、能够保障语义信息传递质量的自然语言语义约定翻译方法。 本专利技术实施例通过第一语言文字的词来查找与该词的语义项对应的第二语言文字的词,即根据相同或相近的语义项,将第一语言文字转换为第二语言文字,使得转换结果更准确。本专利技术实施例中的语义项是指词的含义解释。如,词好的含义1 :形容词与坏相对,优、精、良、妙、出色(0001-1);含义2:名称友爱、友善、友好、和睦、投机(0001-2)。含义1和含义2所指的内容即为语义项,0001-1和0001-2为语义项对应的语义代码。参见图l,本实施例中文字转换的主要方法流程如下 步骤101 :根据获得的第一语言文字表达的词得到与词对应的语义项。步骤102 :根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项。 步骤103 :根据查找到的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词。步骤104 :根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。 所述的语法表达规则是指语法概念的表达规则。例如,英语、汉语主要用句子中词汇排序来表达句子成分(如主语、宾语)语法概念,俄语则在词汇符号中直接标识主格、宾格表达句子成分。英语用添加专用符号+动词变形表达过去完成时时态概念,汉语则用独立词汇符号已经....过了 表达过去完成时时态概念。 其中,第一语本文档来自技高网...

【技术保护点】
一种用于实现文字转换的装置,其特征在于,包括:语义查询模块,用于根据获得的第一语言文字表达的词得到与词对应的语义项;语义转换模块,用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;词查找模块,用于根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;组织模块,用于根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。

【技术特征摘要】
一种用于实现文字转换的装置,其特征在于,包括语义查询模块,用于根据获得的第一语言文字表达的词得到与词对应的语义项;语义转换模块,用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;词查找模块,用于根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;组织模块,用于根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。2. 如权利要求1所述的装置,其特征在于,还包括接口模块,用于通过为用户提供的 操作界面,获得用户根据第一语言文字表达的词输入的与词对应的语义项;语义查询模块还用于根据获得的语义项所包含的词,查找与该词对应的语义项; 组织模块还用于将组织成的句子作为第二语言文字表达的语义项传输给词查找模块;词查找模块用于将获得的第二语言文字表达的语义项作为第二语言文字表达的词。3. 如权利要求1所述的装置,其特征在于,还包括结构分析模块,用于将获得的第一 语言文字表达的词对应到通用句法结构的各结构中;组织模块用于根据第二语言的语法表达规则和各词在通用句法结构中所对应的结构, 将第二语言文字表达的词组织成句子。4. 如权利要求3所述的装置,其特征在于,组织模块用于根据第二语言的语法表达规则和包括语义代码的通用句法结构的句法代码,将第二语言文字表达的词组织成句子。5. 如权利要求3所述的装置,其特征在于,还包括接口模块,用于通过为用户提供的操作界面获得用户将获得的词对应到通用句法结构的各结构中的操作。6. 如权利要求3所述的装置,其特征在于,语义查询模块用于当得到与词对应的多个 语义项时,根据用户的指示从多个语义项中确定一个语义项,或者,根据语义项的使用频率 从多个语义项中确定一个使用频率最高的语义项,或者,根据该词的词性从多个语义项中 确定一个语义项。7. 如权利要求1所述的装置,其特征在于,还包括接口模块,用于获得点击组织成的 句子或句子中的词的操作;语义查询模块还用于通过点击组织成的句子中的词来查询该词对应的语义项。8. —种文字转换方法,其特征在于,包括以下步骤 根据获得的第一语言文字表达的词得到与词对应的语义项; 根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项; 根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词; 根据第二语言的语法规则将第二语言文字表达的词组织成句子。9. 如权利要求8所述的文字转换方法,其特征在于,根据获得的第一语言文字表达的 词得到与词对应的语义项的步骤包括通过为用户提供的操作界面,获得用户根据第一语 言文字表达的词输入的与词对应的语义项;根据与词对应的语义项获得对应的第二语言文字表达的语义项的步骤包括 根据获得的语义项所包含的词,查找与该词对应的语义项; 根据查找到的语义项查找对应的语义代码或第二语言文字表达的语义项;根据查找到的语义代码或第二语言文字表达的...

【专利技术属性】
技术研发人员:刘莎
申请(专利权)人:北京思在信息技术有限责任公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1