一种互联网网页翻译方法技术

技术编号：4088823 阅读：262 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种互联网网页翻译方法，该方法包括步骤：对结构规范化内容的分析，分离为框架部分与内容部分，框架部分如网页内容单元的属性名称，框架内容部分如网页内容单元的内容；对框架部分只译一次，原文存储于文本Ａ，译文存储于文本Ｂ；对内容部分，在数据库中建立两个表，对应于原文语言的表Ｃ与待译语言的表Ｄ；有了具体的网页内容单元记录，先将内容存储于原文语言表里的对应项；对于原文语言表里的填进的内容，一一对应翻译，填入对应于待译语言表里的对应项。采用本发明专利技术提供的翻译法，避免了长语句翻译时由于不同语种语序不同导致的译文意思失真，同时框架部分只译一次，省略了部分处理译文时间，提高了效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，应用于互联网物联网信息科技领域。
技术介绍
现有的互联网网页翻译技术，比如谷歌翻译，谷歌的网页翻译系统在当今互联网界得到了广泛的应用，主要用于粘贴文字翻译与网页整篇翻译。其各部分的连接关系较直观，基本部分有三部分。第一部分为空白框，供用户粘贴写入需翻译内容，或网页地址；第二部分为后台处理，对用户粘贴内容或网址网页全文翻译；第三部分为显示部分，显示由第二部分转来的翻译结果。谷歌翻译系统简单实用，其不足之处是对内容不加区分整块翻译返回，对较长文字段的翻译，由于各语种语序习惯不同，意思经常会杂乱叠加或意思失真。特别是对于有规范化内容结构的网页，如电子商务网站对产品的介绍，许多网页都是一种框架结构，通常框架(Frame)的内容是不变的，而具体的内容(Content)在变，这时会产生重复翻译。
技术实现思路
本专利技术针对目前自动翻译存在的问题，提供，设计了一个框架与内容分离的翻译系统以提高自动翻译系统的准确率与效率。本专利技术对网页从一种语言到另一种语言的翻译，尤其对于有规范化内容结构的网页，如电子商务网站对产品的介绍提供技术方案，步骤如下A、对网页页面进行分析，将页面文本分离为框架文本与内容文本；B、对框架文本只译一次，原文存储于第一文本，译文存储于第二文本；C、对内容文本，在数据库中建立两个表，分别为原文语言表与待译语言表；D、读取具体的网页内容文本，将内容文本的每个单元存储于原文语言表里的对应项；E、对于原文语言表里填进的内容一一翻译，将翻译结果填入待译语言表里的对应项；F、第一文本通过数据库连接从原文语言表中取一个记录，...

【技术保护点】
一种互联网网页翻译方法，其特征是：该方法包括以下步骤：Ａ、对网页页面进行分析，将页面文本分离为框架文本与内容文本；Ｂ、对框架文本只译一次，原文存储于第一文本，译文存储于第二文本；Ｃ、对内容文本，在数据库中建立两个表，分别为原文语言表与待译语言表；Ｄ、读取具体的网页内容文本，将内容文本的每个单元存储于原文语言表里的对应项；Ｅ、对于原文语言表里填进的内容一一翻译，将翻译结果填入待译语言表里的对应项；Ｆ、第一文本通过数据库连接从原文语言表中取一个记录，与网页格式框架结合，形成原文网页；第二文本通过数据库连接从待译语言表中取一个记录，与网页格式框架结合，形成译文网页。

【技术特征摘要】

【专利技术属性】
技术研发人员：俞晓华，
申请(专利权)人：无锡诺宝科技发展有限公司，
类型：发明
国别省市：32[中国|江苏]

全部详细技术资料下载我是这个专利的主人