一种基于语义模板的问题自动翻译方法及其系统技术方案

技术编号:2825917 阅读:271 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于语义模板的问题自动翻译方法及其系统,其中该方法包括:模板获取步骤,用于获取与用户提出的问题最相关的语义模板;模板映射步骤,用于将最相关的语义模板映射到目标语言模板,得到问题的可填充项及可填充项对应于目标语言模板中的语义标签;语义选择步骤,用于对可填充项进行自动翻译,得到可填充项的所有语义;利用语义标签从所有语义中选择可填充项的最佳语义,将最佳语义填充到目标语言模板中,得目标语言问题。本发明专利技术能够对交互式问答系统中用户提出的问题进行自动翻译,实现了不同语言用户之间的无障碍交流。

【技术实现步骤摘要】

本专利技术涉及问题自动翻译方法,特别是涉及一种基于语义模板的问题自动翻译方法及其系统
技术介绍
对于大多数仅掌握一门语言的人来说,如何有效、准确地理解其他语言的文章是一个亟待解决的问题。由于问答系统中的用户对他们所要得到的信息带有明显的主动性,翻译在解决不同国家用户间的交流障碍方面,显得尤为重要。目前,已经开发出一些翻译工具,如Altavista(http://babelfish.altavista.com/)、Google(http://translate.google.com/translate_t?)Yahoo(http://fanyi.cn.yahoo.com/translate_txt)。但是,因为可以借助现有的一些词典,这些词典在单词或者短语的层面上的翻译效果尚可。但是,在整个句子的结构的理解方面尚有很大不足。由于不同语言的语法、表达方式不尽相同,并不奇怪上面几种翻译工具在实际应用中不理想,例如,对于句子“What is thecolor of rose”,其翻译结果分别为“什么是颜色上升了”,“什么是颜色上升了”,“是什么颜色的玫瑰”。正因如此,目前还没有哪个翻译工具能够取代人工翻译。因此,有必要提出一种基于语义模板的问题自动翻译方法及其系统,用于对交互式问答系统中用户提出的问题进行自动翻译,实现不同语言用户之间的无障碍交流。
技术实现思路
本专利技术所要解决的技术问题在于提供一种基于语义模板的问题自动翻译方法及其系统,对交互式问答系统中用户提出的问题进行自动翻译,在不同语言用户之间实现了无障碍的交流,获得了较好的用户体验。为了实现上述目的,本专利技术提供了一种基于语义模板的问题自动翻译方-->法,应用于交互式问答系统,其特征在于,包括:模板获取步骤,用于获取与用户提出的问题最相关的语义模板;模板映射步骤,用于将所述最相关的语义模板映射到目标语言模板,得到所述问题的可填充项及所述可填充项对应于所述目标语言模板中的语义标签;语义选择步骤,用于对所述可填充项进行自动翻译,得到所述可填充项的所有语义;利用所述语义标签从所述所有语义中选择所述可填充项的最佳语义,将所述最佳语义填充到所述目标语言模板中,得目标语言问题。所述的基于语义模板的问题自动翻译方法,其中,所述模板获取步骤中,进一步包括:当用户以自由文本提问时,先通过命名实体识别器对该问题进行结构分析,获得该问题的基本结构,再将所述基本结构与模板数据库中的模板进行匹配,获得最相关的语义模板;或当用户利用语义模板提问时,将该语义模板作为最相关的语义模板。所述的基于语义模板的问题自动翻译方法,其中,所述模板映射步骤中,进一步包括:根据所述最相关的语义模板及不同语言模板对照表或对应关系将所述最相关的语义模板映射到所述目标语言模板的步骤。所述的基于语义模板的问题自动翻译方法,其中,所述语义选择步骤中,进一步包括:通过由翻译工具接口提供的翻译工具对所述可填充项进行自动翻译,得到所述所有语义的步骤。所述的基于语义模板的问题自动翻译方法,其中,所述语义选择步骤中,进一步包括:计算所述可填充项的所有语义与所述语义标签之间的相似度,并选择相似度最大的语义作为所述最佳语义的步骤;以如下公式计算所述可填充项的所有语义与所述语义标签之间的相似度:Sim(S1i,L1)=αDis(S1i,L1)+α]]>Dis(S1i,L1):语义S1i与语义标签L1在概念层级中的最短路径;α:协同因数;-->Sim(S1i,L1):语义S1i与语义标签L1之间的相似度;以如下公式计算所述可填充项的最佳语义:S(w1)=argMaxiSim(S1i,L1)]]>S(w1):可填充项w1的最佳语义。为了实现上述目的,本专利技术还提供了一种基于语义模板的问题自动翻译系统,应用于交互式问答系统,其特征在于,包括:模板获取模块,用于获取与用户提出的问题最相关的语义模板;模板映射模块,用于将所述最相关的语义模板映射到目标语言模板,得到所述问题的可填充项及所述可填充项对应于所述目标语言模板中的语义标签;语义选择及问题生成模块,连接所述模板获取模块、所述模板映射模块,用于对所述可填充项进行自动翻译,得到所述可填充项的所有语义;利用所述语义标签从所述所有语义中选择所述可填充项的最佳语义,将所述最佳语义填充到所述目标语言模板中,得目标语言问题。所述的基于语义模板的问题自动翻译系统,其中,所述模板获取模块当用户以自由文本提问时,先通过命名实体识别器对该问题进行结构分析,获得该问题的基本结构,再将所述基本结构与模板数据库中的模板进行匹配,获得最相关的语义模板;或当用户利用语义模板提问时,将该语义模板作为最相关的语义模板。所述的基于语义模板的问题自动翻译系统,其中,所述模板映射模块根据所述最相关的语义模板及不同语言模板对照表或对应关系将所述最相关的语义模板映射到所述目标语言模板的步骤。所述的基于语义模板的问题自动翻译系统,其中,所述语义选择及问题生成模块包括:可填充项翻译模块,用于通过由翻译工具接口提供的翻译工具对所述可填充项进行自动翻译,得到所述所有语义;可填充项语义选择模块,连接所述可填充项翻译模块,用于利用所述语义标签从所有语义中选择所述最佳语义;问题生成模块,连接所述模板映射模块、所述可填充项语义选择模块,用于将所述最佳语义填充到所述目标语言模板中,生成所述目标语言问题。所述的基于语义模板的问题自动翻译系统,其中,所述可填充项语义选择-->模块通过计算所述可填充项的所有语义与所述语义标签之间的相似度,并选择相似度最大的语义作为所述最佳语义;以如下公式计算所述可填充项的所有语义与所述语义标签之间的相似度:Sim(S1i,L1)=αDis(S1i,L1)+α]]>Dis(S1i,L1):语义S1i与语义标签L1在概念层级中的最短路径;α:协同因数;Sim(S1i,L1):语义S1i与语义标签L1之间的相似度;以如下公式计算所述可填充项的最佳语义:S(w1)=argMaxiSim(S1i,L1)]]>S(w1):可填充项w1的最佳语义。本专利技术提供了一种基于语义模板的问题自动翻译方法及其系统,能够对交互式问答系统中用户提交的问题进行自动翻译,在不同语言用户之间实现了无障碍的交流,获得了较好的用户体验。以下结合附图和具体实施例对本专利技术进行详细描述,但不作为对本专利技术的限定。附图说明图1为本专利技术基于语义模板的问题自动翻译方法流程图;图2为本专利技术基于语义模板的问题自动翻译系统结构图;图3A为本专利技术实现自动翻译的一实施例;图3B为本专利技术实现自动翻译的用户界面示意图。具体实施方式下面结合附图和具体实施方式对本专利技术的技术方案作进一步更详细的描述。如图1所示,为本专利技术基于语义模板的问题自动翻译方法流程图。该流程描述了一种基于语义模板的问题自动翻译方法,该方法能对交互式问答系统中用户提出的问题进行自动翻译,具体步骤包括:步骤S101,模板获取,获取与用户所提出的问题最相关的语义模板。-->进一步地,该步骤S101中,包括一模板获取的具体方法:当用户以自由文本提问时,首先通过命名实体识别器(Named EntityIdentification,NER)对该问题进行本文档来自技高网...

【技术保护点】
一种基于语义模板的问题自动翻译方法,应用于交互式问答系统,其特征在于,包括:模板获取步骤,用于获取与用户提出的问题最相关的语义模板;模板映射步骤,用于将所述最相关的语义模板映射到目标语言模板,得到所述问题的可填充项及所述可填充项对应于所述目标语言模板中的语义标签;语义选择步骤,用于对所述可填充项进行自动翻译,得到所述可填充项的所有语义;利用所述语义标签从所述所有语义中选择所述可填充项的最佳语义,将所述最佳语义填充到所述目标语言模板中,得目标语言问题。

【技术特征摘要】
1、一种基于语义模板的问题自动翻译方法,应用于交互式问答系统,其特征在于,包括:模板获取步骤,用于获取与用户提出的问题最相关的语义模板;模板映射步骤,用于将所述最相关的语义模板映射到目标语言模板,得到所述问题的可填充项及所述可填充项对应于所述目标语言模板中的语义标签;语义选择步骤,用于对所述可填充项进行自动翻译,得到所述可填充项的所有语义;利用所述语义标签从所述所有语义中选择所述可填充项的最佳语义,将所述最佳语义填充到所述目标语言模板中,得目标语言问题。2、根据权利要求1所述的基于语义模板的问题自动翻译方法,其特征在于,所述模板获取步骤中,进一步包括:当用户以自由文本提问时,先通过命名实体识别器对该问题进行结构分析,获得该问题的基本结构,再将所述基本结构与模板数据库中的模板进行匹配,获得最相关的语义模板;或当用户利用语义模板提问时,将该语义模板作为最相关的语义模板。3、根据权利要求1所述的基于语义模板的问题自动翻译方法,其特征在于,所述模板映射步骤中,进一步包括:根据所述最相关的语义模板及不同语言模板对照表或对应关系将所述最相关的语义模板映射到所述目标语言模板的步骤。4、根据权利要求1、2或3所述的基于语义模板的问题自动翻译方法,其特征在于,所述语义选择步骤中,进一步包括:通过由翻译工具接口提供的翻译工具对所述可填充项进行自动翻译,得到所述所有语义的步骤。5、根据权利要求1、2或3所述的基于语义模板的问题自动翻译方法,其特征在于,所述语义选择步骤中,进一步包括:计算所述可填充项的所有语义与所述语义标签之间的相似度,并选择相似度最大的语义作为所述最佳语义的步骤;以如下公式计算所述可填充项的所有语义与所述语义标签之间的相似度:Sim(S1i,L1)=αDis(S1i,L1)+α]]>Dis(S1i,L1):语义S1i与语义标签L1在概念层级中的最短路径;α:协同因数;Sim(S1i,L1):语义S1i与语义标签L1之间的相似度;以如下公式计算所述可填充项的最佳语义:S(w1)=argMaxiSim(S1i,L1)]]>S(w1):可填充项w1的最佳语义。6、一种基于语义模板的问题自动翻译系统,应用于交互式问答系统,其特征在于,包括:模板获取模块,用于获取与用户提出的问题最相...

【专利技术属性】
技术研发人员:刘文印郝天永张加龙
申请(专利权)人:北京百问百答网络技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1