一种基于开发平台的多语言录入和解析系统及方法技术方案

技术编号:37274059 阅读:10 留言:0更新日期:2023-04-20 23:42
本发明专利技术提供了一种基于开发平台的多语言录入和解析系统及方法包括:录入模块,用于录入文本信息,识别模块,用于获取所述文本信息的文本特征,将所述文本特征与每一语种对应的样本特征进行对比,得到所述文本信息对应的文本语种,根据所述文本语种建立译汉模型,解析模块,用于将所述文本信息输入到所述译汉模型中得到汉语信息,解析所述汉语信息,得到若干条文本数据,执行模块,用于将所述文本数据填充到开发平台中对应的文本框内进行显示,可以在开发平台中输入任何语种的文本信息,然后将其解析为统一的语言再输入到开发平台的显示页面上,打破了传统录入的弊端,实现了灵活录入。入。入。

【技术实现步骤摘要】
一种基于开发平台的多语言录入和解析系统及方法


[0001]本专利技术涉及平台语言
,特别涉及一种基于开发平台的多语言录入和解析方式及方法。

技术介绍

[0002]开发平台是指以某种语言或者某几种语言为基础,用户可以在这个产品上进行各种各样的软件产品的开发,并且在这个产品上进行开发的时候,只需要进行一些简单的配置,或者是写极少量的代码便可以完成一个业务系统的开发工作,但是目前不同的开发平台所使用的语言不相同,导致了在进行录入前需要先确定该开发平台的语言,加大了使用者的工作量,而且会使得开发平台的界面十分臃肿,增加了开发成本。
[0003]因此,本专利技术提供了一种基于开发平台的多语言录入和解析系统及方法。

技术实现思路

[0004]本专利技术一种基于开发平台的多语言录入和解析系统及方法,可以在开发平台中输入任何语种的文本信息,然后将其解析为统一的语言再输入到开发平台的显示页面上,打破了传统录入的弊端,实现了灵活录入。
[0005]本专利技术提供了一种基于开发平台的多语言录入和解析系统及方法,包括:
[0006]录入模块,用于录入文本信息;
[0007]识别模块,用于获取所述文本信息的文本特征,将所述文本特征与每一语种对应的样本特征进行对比,得到所述文本信息对应的文本语种,根据所述文本语种建立译汉模型;
[0008]解析模块,用于将所述文本信息输入到所述译汉模型中得到汉语信息,解析所述汉语信息,得到若干条文本数据;
[0009]执行模块,用于将所述文本数据填充到开发平台中对应的文本框内进行显示。
[0010]在一种可实施的方式中,
[0011]还包括:
[0012]备录模块,用于根据所述文本数据在开发平台中文本框中的填充结果,得到汉语显示版图,根据所述文本语种将所述汉语显示版图翻译为目标显示版图;
[0013]显示模块,用于显示所述汉语显示版图和目标显示版图。
[0014]在一种可实施的方式中,
[0015]所述录入模块,包括:
[0016]输入单元,用于供用户输入原始文本;
[0017]筛选单元,用于将所述原始文本进行文本筛选,得到目标文本;
[0018]修正单元,用于根据时间顺序调整所述目标文本,得到文本信息。
[0019]在一种可实施的方式中,
[0020]所述识别模块,包括:
[0021]训练单元,用于将所述文本信息进行语法训练,得到若干条文本语句;
[0022]分析单元,用于分别提取每一文本语句对应的语句关键词,分析所述语句关键词对应的词语组成结构;
[0023]识别单元,用于根据所述词语组成结构得到对应语句关键词的词特征,根据所述词特征的属性,确定所述文本信息对应的文本语种;
[0024]建模单元,用于获取所述文本语种与汉语之间的翻译对照信息,建立译汉模型。
[0025]在一种可实施的方式中,
[0026]所述解析模块,包括:
[0027]文本解析单元,用于获取所述文本语种的语句结构列表,根据所述语句结构列表分析所述文本信息中包含的若干中文本语句,建立所述文本信息的语句结构框架;
[0028]模型解析单元,用于将所述文本信息输入到所述译汉模型中,在所述译汉模型中获取所述文本信息包含的若干条文本语句,获取每一文本语句对应的若干个汉语词;
[0029]文本修正单元,用于将所述汉语词输入到所述语句结构框架中进行语句重组,得到若干条第一汉语语句,当所述第一汉语语句中存在病句时,分析每一第一汉语语句对应的语句问题,并进行语句修正,得到第二汉语语句;
[0030]文本转换单元,用于根据所述第二汉语语句建立汉语信息,得到若干条文本数据。
[0031]在一种可实施的方式中,
[0032]所述执行模块,包括:
[0033]第一执行单元,用于解析所述文本数据,得到每一文本数据中包含的数据边界点,为每一文本数据的数据边界点上建立边界索引,得到每一文本数据对应的边界索引集;
[0034]第二执行单元,用于获取所述开发平台中每一文本框可填充的文本数据类型,为每一文本框建立数据索引;
[0035]第三执行单元,用于分别利用每一所述数据索引遍历每一文本数据对应的边界索引集,为每一数据索引匹配相应的边界索引,建立匹配列表;
[0036]第四执行单元,用于根据所述匹配列表将所述文本数据填充到开发平台中对应的文本框内进行显示。
[0037]本专利技术提供了一种基于开发平台的多语言录入和解析方法,包括:
[0038]步骤1:录入文本信息;
[0039]步骤2:获取所述文本信息的文本特征,将所述文本特征与每一语种对应的样本特征进行对比,得到所述文本信息对应的文本语种,根据所述文本语种建立译汉模型;
[0040]步骤3:将所述文本信息输入到所述译汉模型中得到汉语信息,解析所述汉语信息,得到若干条文本数据;
[0041]步骤4:将所述文本数据填充到开发平台中对应的文本框内进行显示。
[0042]在一种可实施的方式中,
[0043]所述步骤2包括:
[0044]步骤21:将所述文本信息进行语法训练,得到若干条文本语句;
[0045]步骤22:分别提取每一文本语句对应的语句关键词,分析所述语句关键词对应的词语组成结构;
[0046]步骤23:根据所述词语组成结构得到对应语句关键词的词特征,根据所述词特征
的属性,确定所述文本信息对应的文本语种;
[0047]步骤24:获取所述文本语种与汉语之间的翻译对照信息,建立译汉模型。
[0048]在一种可实施的方式中,
[0049]所述步骤3包括:
[0050]步骤31:获取所述文本语种的语句结构列表,根据所述语句结构列表分析所述文本信息中包含的若干中文本语句,建立所述文本信息的语句结构框架;
[0051]步骤32:将所述文本信息输入到所述译汉模型中,在所述译汉模型中获取所述文本信息包含的若干条文本语句,获取每一文本语句对应的若干个汉语词;
[0052]步骤33:将所述汉语词输入到所述语句结构框架中进行语句重组,得到若干条第一汉语语句,当所述第一汉语语句中存在病句时,分析每一第一汉语语句对应的语句问题,并进行语句修正,得到第二汉语语句;
[0053]步骤34:根据所述第二汉语语句建立汉语信息,得到若干条文本数据。
[0054]在一种可实施的方式中,
[0055]所述步骤4包括:
[0056]步骤41:解析所述文本数据,得到每一文本数据中包含的数据边界点,为每一文本数据的数据边界点上建立边界索引,得到每一文本数据对应的边界索引集;
[0057]步骤42:获取所述开发平台中每一文本框可填充的文本数据类型,为每一文本框建立数据索引;
[0058]步骤43:分别利用每一所述数据索引遍历每一文本数据对应的边界索引集,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于开发平台的多语言录入和解析系统,其特征在于,包括:录入模块,用于录入文本信息;识别模块,用于获取所述文本信息的文本特征,将所述文本特征与每一语种对应的样本特征进行对比,得到所述文本信息对应的文本语种,根据所述文本语种建立译汉模型;解析模块,用于将所述文本信息输入到所述译汉模型中得到汉语信息,解析所述汉语信息,得到若干条文本数据;执行模块,用于将所述文本数据填充到开发平台中对应的文本框内进行显示。2.如权利要求1所述的一种基于开发平台的多语言录入和解析系统,其特征在于,还包括:备录模块,用于根据所述文本数据在开发平台中文本框中的填充结果,得到汉语显示版图,根据所述文本语种将所述汉语显示版图翻译为目标显示版图;显示模块,用于显示所述汉语显示版图和目标显示版图。3.如权利要求1所述的一种基于开发平台的多语言录入和解析系统,其特征在于,所述录入模块,包括:输入单元,用于供用户输入原始文本;筛选单元,用于将所述原始文本进行文本筛选,得到目标文本;修正单元,用于根据时间顺序调整所述目标文本,得到文本信息。4.如权利要求1所述的一种基于开发平台的多语言录入和解析系统,其特征在于,所述识别模块,包括:训练单元,用于将所述文本信息进行语法训练,得到若干条文本语句;分析单元,用于分别提取每一文本语句对应的语句关键词,分析所述语句关键词对应的词语组成结构;识别单元,用于根据所述词语组成结构得到对应语句关键词的词特征,根据所述词特征的属性,确定所述文本信息对应的文本语种;建模单元,用于获取所述文本语种与汉语之间的翻译对照信息,建立译汉模型。5.如权利要求1所述的一种基于开发平台的多语言录入和解析系统,其特征在于,所述解析模块,包括:文本解析单元,用于获取所述文本语种的语句结构列表,根据所述语句结构列表分析所述文本信息中包含的若干中文本语句,建立所述文本信息的语句结构框架;模型解析单元,用于将所述文本信息输入到所述译汉模型中,在所述译汉模型中获取所述文本信息包含的若干条文本语句,获取每一文本语句对应的若干个汉语词;文本修正单元,用于将所述汉语词输入到所述语句结构框架中进行语句重组,得到若干条第一汉语语句,当所述第一汉语语句中存在病句时,分析每一第一汉语语句对应的语句问题,并进行语句修正,得到第二汉语语句;文本转换单元,用于根据所述第二汉语语句建立汉语信息,得到若干条文本数据。6.如权利要求1所述的一种基于开发平台的多语言录入和解析系统,其特征在于,所述执行模块,包括:第一执行单元,用于解析所述文本数据,得到每一文本数据中包含的数据边界点,为每一文本数据的数据边界点上建立边界索引,得到每一文本数据对应的边界索引集;
第...

【专利技术属性】
技术研发人员:金震张京日耿金帅
申请(专利权)人:北京三维天地科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1