一种翻译方法及系统技术方案

技术编号:11012658 阅读:119 留言:0更新日期:2015-02-05 18:20
本发明专利技术实施例提供一种翻译方法及系统,用于数据集市,其中方法包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称,将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称。

【技术实现步骤摘要】
一种翻译方法及系统
本专利技术涉及翻译
,特别是涉及一种翻译方法及系统,应用于数据集市。
技术介绍
数据集市(DataMart),也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据集市的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。目前,在数据集市开发过程中,将逻辑模型中的实体与属性的中文名称翻译为物理模型中表与字段的英文名称的方法有汉语拼音全字母翻译、单词拼音首字母翻译、无含义字段翻译和英文词组翻译四种;汉语拼音全字母翻译,根据逻辑模型的实体和属性中文名称采用汉字的全拼音来手动定义相应的表和字段英文名称;单词拼音首字母翻译,根据逻辑模型的实体和属性中文名称用手动的方式首先把汉字进行分词处理,然后针对每个词,翻译成全拼音,采用每个词的拼音的首字母作为字段和表名的英文名称;无含义字段翻译,手动采用无任何特殊含义的英文字母、数字以及特殊字符组合的方式,依次翻译逻辑模型中的实体和属性中文名称;英文词组翻译,根据逻辑模型的实体和属性中文名称,首先用人工的方式把汉字进行分词处理,然后针对每个词,翻译成全英文单词,然后使用字符进行连接。由于数据集市项目一般规模比较大,在以上四种翻译方法中,均需要大量的设计人员实现物理模型的生成,如果每个设计人员都是手动生成物理模型的话,那么,相同的属性在不同的实体内时,很可能就翻译为不同的字段英文名,而在数据集市系统逻辑模型设计中,同名的属性,不管它在哪个实体中,代表的都是相同的业务含义,所以原则上由逻辑模型生成物理模型的过程中,同名的属性应该翻译为相同的字段名,所以利用现有技术完成逻辑模型实体与属性中文名称翻译为对应的表与字段英文名称,会导致物理模型命名的规范性及质量无法保证。同时,手动生成物理模型的过程中,要保证物理模型比较明确的反映逻辑模型的含义,需要设计人员认真分析哪个英文名称能够比较准确的翻译出中文名称的含义,且不同的设计人员面临相同的属性时,都会考虑相同的问题,会有很多重复性劳动,物理模型生成效率较低。
技术实现思路
有鉴于此,本专利技术实施例提供一种翻译方法及系统,以解决现有技术中使用人工手动生成物理模型而造成物理模型命名的规范性及质量无法保证且物理模型生成效率较低的问题。为实现上述目的,本专利技术实施例提供如下技术方案:一种翻译方法,用于数据集市,包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称;将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称。其中,将所述实体英文名称视为物理模型中表英文名称包括:判断所得的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,如果是,得到物理模型中的表英文名称;如果不是,将所得的实体英文名称的最后一位字母替换为一个预定的正整数n,0≤n≤9;判断该将最后一位字母替换为n的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,若不是,则将该将最后一位字母替换为n的实体英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有表英文名称均与该替换了最后一位字母的实体英文名称不同,得到物理模型中的表英文名称;所述将所述属性英文名称视为物理模型中字段英文名称包括:判断所得的属性英文名称是否与物理模型中已存在的所有字段英文名称均不同,若不是,将所得的属性英文名称的最后一位字母替换为一个预定的正整数n,0≤n≤9;判断物理模型中已存在的所有字段英文名称是否均与该将最后一位字母替换为n的属性英文名称不同,若不是,则将该将最后一位字母替换为n的属性英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有字段英文名称均与该替换了最后一位字母的属性英文名称不同,得到物理模型中的字段英文名称。其中,所述将获取的实体中文名称自动翻译为实体英文名称包括:将获取的实体中文名称进行拆分,得实体词根;根据词根表将所有实体词根翻译为对应的实体英文简称;将所有实体英文简称按预定顺序通过预定方法进行拼接,并自动加上代表所述实体英文名称所在主题的英文前缀,得到实体中文名称对应的实体英文名称;所述将获取的属性中文名称自动翻译为属性英文名称包括:将获取的属性中文名称进行拆分,得属性词根;根据词根表将所有属性词根翻译为对应的属性英文简称;将所有属性英文简称按预定顺序通过预定方法进行拼接,得到属性中文名称对应的属性英文名称。其中,所述将获取的实体中文名称进行拆分,包括:判断获取的实体中文名称是否在词根表中;若不在,则去掉该实体中文名称中最后一个汉字,获取该去掉最后端一个汉字的实体中文名称;若在,则将该实体中文名称作为一个实体词根,并将该实体词根从该实体中文名称中去除,获取该去除了所述实体词根的实体中文名称;所述将获取的属性中文名称进行拆分,包括:判断获取的属性中文名称是否在词根表中;若不在,则去掉该属性中文名称中最后一个汉字,获取该去掉最后端一个汉字的属性中文名称;若在,则将该属性中文名称作为一个属性词根,并将该属性词根从该实体中文名称中去除,获取该去除了所述属性词根的属性中文名称。其中,所述去掉该实体中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该实体中文名称对应的原始实体中文名称中未被拆分为实体词根的汉字,在词根表中添加所有未被拆分为实体词根的汉字的英文翻译及简称;所述去掉该属性中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该属性中文名称对应的原始属性中文名称中未被拆分为属性词根的汉字,在词根表中添加所有未被拆分为属性词根的汉字的英文翻译及简称。其中,所述获取该去除了所述实体词根的实体中文名称后还包括:判断获取的去除了所述实体词根的实体中文名称中是否包含汉字,若不包含,则说明获取的实体中文名称已拆分完成,根据词根表将所有实体词根翻译为对应的实体英文简称;所述获取该去除了所述属性词根的属性中文名称后还包括:判断获取的去除了所述属性词根的实体中文名称中是否包含汉字,若不包含,则说明获取的属性中文名称已拆分完成,根据词根表将所有实体词根翻译为对应的实体英文简称。其中,所述得到实体中文名称对应的实体英文名称后还包括:判断所得的实体英文名称的字节数是否超过预定的字节数,若超过,则去掉该实体英文名称最后端超出的字节;所述得到属性中文名称对应的属性英文名称后还包括:判断所得的属性英文名称的字节数是否超过预定的字节数,若超过,则去掉该属性英文名称最后端超出的字节。本专利技术实施例还提供一种翻译系统,用于数据集市,包括:第一翻译模块和第二翻译模块;其中,所述第一翻译模块,用于将逻辑模型中实体中文名称翻译为物理模型中表英文名称;所述第二翻译模块,用于将逻辑模型中属性中文名称翻译为物理模型中字段英文名称;其中,所述第一翻译模块包括:第一获取单元和第一翻译单元,其中,所述第一获取单元用于获取逻辑模型中实体中文名称;所述第一翻译单元用于将获取的实体中文名称自动翻译为实体英文名称,将本文档来自技高网
...
一种翻译方法及系统

【技术保护点】
一种翻译方法,用于数据集市,其特征在于,包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称;将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称。

【技术特征摘要】
1.一种翻译方法,用于数据集市,其特征在于,包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称;将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称;其中,所述将所述实体英文名称视为物理模型中表英文名称包括:判断所得的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,如果是,得到物理模型中的表英文名称,如果不是,将所得的实体英文名称的最后一位字母替换为一个预定的整数n,0≤n≤9;判断该将最后一位字母替换为n的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,若不是,则将该将最后一位字母替换为n的实体英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有表英文名称均与该替换了最后一位字母的实体英文名称不同,得到物理模型中的表英文名称;所述将所述属性英文名称视为物理模型中字段英文名称包括:判断所得的属性英文名称是否与物理模型中已存在的所有字段英文名称均不同,若不是,将所得的属性英文名称的最后一位字母替换为一个预定的整数n,0≤n≤9;判断物理模型中已存在的所有字段英文名称是否均与该将最后一位字母替换为n的属性英文名称不同,若不是,则将该将最后一位字母替换为n的属性英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有字段英文名称均与该替换了最后一位字母的属性英文名称不同,得到物理模型中的字段英文名称。2.根据权利要求1所述的方法,其特征在于,所述将获取的实体中文名称自动翻译为实体英文名称包括:将获取的实体中文名称进行拆分,得实体词根;根据词根表将所有实体词根翻译为对应的实体英文简称;将所有实体英文简称按预定顺序通过预定方法进行拼接,并自动加上代表所述实体英文名称所在主题的英文前缀,得到实体中文名称对应的实体英文名称;所述将获取的属性中文名称自动翻译为属性英文名称包括:将获取的属性中文名称进行拆分,得属性词根;根据词根表将所有属性词根翻译为对应的属性英文简称;将所有属性英文简称按预定顺序通过预定方法进行拼接,得到属性中文名称对应的属性英文名称。3.根据权利要求2所述的方法,其特征在于,所述将获取的实体中文名称进行拆分,包括:判断获取的实体中文名称是否在词根表中;若不在,则去掉该实体中文名称中最后一个汉字,获取该去掉最后端一个汉字的实体中文名称;若在,则将该实体中文名称作为一个实体词根,并将该实体词根从该实体中文名称中去除,获取该去除了所述实体词根的实体中文名称;所述将获取的属性中文名称进行拆分,包括:判断获取的属性中文名称是否在词根表中;若不在,则去掉该属性中文名称中最后一个汉字,获取该去掉最后端一个汉字的属性中文名称;若在,则将该属性中文名称作为一个属性词根,并将该属性词根从该实体中文名称中去除,获取该去除了所述属性词根的属性中文名称。4.根据权利要求3所述的方法,其特征在于,所述去掉该实体中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该实体中文名称对应的原始实体中文名称中未被拆分为实体词根的汉字,在词根表中添加所有未被拆分为实体词根的汉字的英文翻译及简称;所述去掉该属性中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该属性中文名称对应的原始属性中文名称中未被拆分为属性词根的汉字,在词根表中添加所有未被拆分为属性词根的汉字的英文翻译及简称。5.根据权利要求3所述的方法,其特征在于,所述获取该去除了所述实体词根的实体中文名称后还包括:判断获取的去除了所述实体词根的实体中文名称中是否包含汉字,若不包含,则说明获取的实体中文名称已拆分完成,根据词根表将所有实体词根翻译为对应的实体英文简称;所述获取该去除了所述属性词根的属性中文名称后还包...

【专利技术属性】
技术研发人员:周灵艳高尚刘安王宁李莉崔大凯叶馥郁付慧敏
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1