一种基于语料大数据的智能翻译方法技术

技术编号:32644040 阅读:32 留言:0更新日期:2022-03-12 18:22
本发明专利技术公开了一种基于语料大数据的智能翻译方法,具体涉及语料翻译领域,包括如下步骤:步骤一、语言识别,步骤二、语句汇总,步骤三、语句修正,步骤四、数据更新,步骤五、语义翻译,步骤六、翻译排版输出。本发明专利技术通过设置语句修正和语义翻译,当用语者采用多国语言混合使用,同时采用的词汇较为新潮时可以进行精准的对应解析和翻译,同时按照对应国家的用语习惯解析语义进行翻译,同时对国内地方语言进行解析,避免导致倾听者无法理解叙述者含义的情况,防止由于国家和地区用语习惯的不同,导致难以进行清楚的了解叙述者的表达含义的情况。难以进行清楚的了解叙述者的表达含义的情况。难以进行清楚的了解叙述者的表达含义的情况。

【技术实现步骤摘要】
一种基于语料大数据的智能翻译方法


[0001]本专利技术涉及语料翻译
,更具体地说,本专利技术涉及一种基于语料大数据的智能翻译方法。

技术介绍

[0002]对于现在的社会,国际交流之间越来越频繁,随之带来的翻译量越来越大,文件包含的语言种类也越来越多。
[0003]专利申请公布号CN112487791A的专利技术专利公开了一种多语言混合智能翻译方法,属于智能翻译
,包括如下步骤:S1,导入文献;S2,遍历文献,并分析出文献中含有的语言种类;S3,根据文献内的语言种类分别进行翻译;S4,显示译文,此方法翻译多语言文献,效率高,准确率高,显示效果好。
[0004]但是在实际使用时,当用语者采用多国语言混合使用,同时采用的词汇较为新潮时难免会导致倾听者无法理解叙述者含义的情况,同时由于国家和地区用语习惯的不同,导致难以进行清楚的了解叙述者的表达含义。

技术实现思路

[0005]为了克服现有技术的上述缺陷,本专利技术的实施例提供一种基于语料大数据的智能翻译方法,通过设置语句修正和语义翻译,按照对应国家的用语习惯解析语义进行翻译,同时对国内地方语言进行解析,避免导致倾听者无法理解叙述者含义的情况,防止由于国家和地区用语习惯的不同,导致难以进行清楚的了解叙述者的表达含义的情况,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于语料大数据的智能翻译方法,包括如下步骤:
[0007]步骤一、语言识别:首先通过汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块这些常用语言进行语言识别,当统一语句中含有多国语言时,将语言进行分段翻译组合,同时根据用语习惯进行整合;
[0008]步骤二、语句汇总:之后将整合后的语句传输到中央服务器中进行数据处理,之后将语句进行二次修正;
[0009]步骤三、语句修正:之后中央服务器将语句与通过将各个区域的语言习惯进行汇总集成的区域语言内涵模块内部进行修正,同时具有海量的译本数据的译本数据库模块进行算法选择,同时将语句与含有大量民族语言习惯数据的汉语习惯模块进行修正,从而更改为需要输出的习惯用语;
[0010]步骤四、数据更新:通过外网连接模块与国外的相关语言网站进行外网连接,实时更新相关的词汇用语习惯和当前流行的热潮词汇,通过中央服务器对具有内涵词汇进行对比;
[0011]步骤五、语义翻译:通过对汉语、英语、法语、日语和俄语进行解析,之后通过各个
区域的数据库模块对对应语言的语义进行解析,解析出当地区域语言所要表述的含义,之后转换成需要输出语言的语言词汇;
[0012]步骤六、翻译排版输出:当语句经过上述国家语言习惯的对比后通过语音翻译模块进行语音输出,通过文字翻译模块进行文字输出,同时当语句中出现不同国家语言混合的情况时,对上述经过语义对比后的语句进行词汇排版。
[0013]在一个优选地实施方式中,所述步骤一中的汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块中各个模块都是对各个国家的语言和习惯数据进行汇总和整合,从而形成的对应的数据库模块。
[0014]在一个优选地实施方式中,所述步骤二中的中央服务器负责对整体数据进行输送和接收,同时对数据对接和更新处理。
[0015]在一个优选地实施方式中,所述步骤三中区域语言内涵模块主要通过对地方方言进行语言整合,添加了小范围语言的用语习惯的相关数据。
[0016]在一个优选地实施方式中,所述步骤四中外网连接模块对外进行数据连接,主要对各个国家的语言、地方特色的语言和实时网络更新的词汇进行更新,填空数据库的数据储备。
[0017]在一个优选地实施方式中,所述步骤五中当处于汉语翻译时,通过将语句输入到汉语语义讲解模块内部,通过对汉语进行语义对比分析,解析出是否含有内在含义后进行输出,处于英语翻译时,通过将语句输入到英语语义讲解模块内部,通过对英语进行语义对比分析,解析出是否含有内在含义后进行输出。
[0018]在一个优选地实施方式中,所述步骤五中当处于法语翻译时,通过将语句输入到法语语义讲解模块内部,通过对法语进行语义对比分析,解析出是否含有内在含义后进行输出,当处于日语翻译时,通过将语句输入到日语语义讲解模块内部,通过对日语进行语义对比分析,解析出是否含有内在含义后进行输出。
[0019]在一个优选地实施方式中,所述步骤六中当处于俄语翻译时,通过将语句输入到俄语语义讲解模块内部,通过对俄语进行语义对比分析,解析出是否含有内在含义后进行输出。
[0020]本专利技术的技术效果和优点:
[0021]1、通过设置语句修正和语义翻译,与现有技术相比,中央服务器将语句与通过将各个区域的语言习惯进行汇总集成的区域语言内涵模块内部进行修正,同时具有海量的译本数据的译本数据库模块进行算法选择,同时将语句与含有大量民族语言习惯数据的汉语习惯模块进行修正,从而更改为需要输出的习惯用语,通过对汉语、英语、法语、日语和俄语进行解析,之后通过各个区域的数据库模块对对应语言的语义进行解析,解析出当地区域语言所要表达的含义,之后转换成需要输出语言的语言词汇,当用语者采用多国语言混合使用,同时采用的词汇较为新潮时可以进行精准的对应解析和翻译,同时按照对应国家的用语习惯解析语义进行翻译,同时对国内地方语言进行解析,避免导致倾听者无法理解叙述者含义的情况,防止由于国家和地区用语习惯的不同,导致难以进行清楚的了解叙述者的表达含义的情况;
[0022]2、通过设置翻译排版输出,与现有技术相比,当语句经过上述国家语言习惯的对比后通过语音翻译模块进行语音输出,通过文字翻译模块进行文字输出,同时当语句中出
现不同国家语言混合的情况时,对上述经过语义对比后的语句进行词汇排版,有效的解决了当遇到多国语言混合语句的翻译;
[0023]3、通过设置语言识别,与现有技术相比,通过汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块这些常用语言进行语言识别,当统一语句中含有多国语言时,将语言进行分段翻译组合,同时根据用语习惯进行整合,对国家的语言习惯进行数据整合,避免词不达意的情况。
附图说明
[0024]图1为本专利技术的步骤示意图。
[0025]图2为本专利技术的模块示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]如附图1

2所示的一种基于语料大数据的智能翻译方法,包括如下步骤:
[0028]步骤一、语言识别:首先通过汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块这些常用语言进行语言识别,当统一语句中含有多国语言时,将语言进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语料大数据的智能翻译方法,其特征在于,包括如下步骤:步骤一、语言识别:首先通过汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块这些常用语言进行语言识别,当统一语句中含有多国语言时,将语言进行分段翻译组合,同时根据用语习惯进行整合;步骤二、语句汇总:之后将整合后的语句传输到中央服务器中进行数据处理,之后将语句进行二次修正;步骤三、语句修正:之后中央服务器将语句与通过将各个区域的语言习惯进行汇总集成的区域语言内涵模块内部进行修正,同时具有海量的译本数据的译本数据库模块进行算法选择,同时将语句与含有大量民族语言习惯数据的汉语习惯模块进行修正,从而更改为需要输出的习惯用语;步骤四、数据更新:通过外网连接模块与国外的相关语言网站进行外网连接,实时更新相关的词汇用语习惯和当前流行的热潮词汇,通过中央服务器对具有内涵词汇进行对比;步骤五、语义翻译:通过对汉语、英语、法语、日语和俄语进行解析,之后通过各个区域的数据库模块对对应语言的语义进行解析,解析出当地区域语言所要表述的含义,之后转换成需要输出语言的语言词汇;步骤六、翻译排版输出:当语句经过上述国家语言习惯的对比后通过语音翻译模块进行语音输出,通过文字翻译模块进行文字输出,同时当语句中出现不同国家语言混合的情况时,对上述经过语义对比后的语句进行词汇排版。2.根据权利要求1所述的一种基于语料大数据的智能翻译方法,其特征在于:所述步骤一中的汉语识别模块、英语识别模块、法语识别模块、日语识别模块和俄语识别模块中各个模块都是对各个国家的语言和习惯数据进行汇总和整合,从而形成的对应的数据库模块。3...

【专利技术属性】
技术研发人员:单士坤钟京伟张潇夏晓莉梁熠程郭红梅
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1