【技术实现步骤摘要】
一种翻译方法及系统
本专利技术涉及翻译
,特别是涉及一种翻译方法及系统,应用于数据集市。
技术介绍
数据集市(DataMart),也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据集市的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。目前,在数据集市开发过程中,将逻辑模型中的实体与属性的中文名称翻译为物理模型中表与字段的英文名称的方法有汉语拼音全字母翻译、单词拼音首字母翻译、无含义字段翻译和英文词组翻译四种;汉语拼音全字母翻译,根据逻辑模型的实体和属性中文名称采用汉字的全拼音来手动定义相应的表和字段英文名称;单词拼音首字母翻译,根据逻辑模型的实体和属性中文名称用手动的方式首先把汉字进行分词处理,然后针对每个词,翻译成全拼音,采用每个词的拼音的首字母作为字段和表名的英文名称;无含义字段翻译,手动采用无任何特殊含义的英文字母、数字以及特殊字符组合的方式,依次翻译逻辑模型中的实体和属性中文名称;英文词组翻译,根据逻辑模型的实体和属性中文名称,首先用人工的方式把汉字进行分词处理,然后针对每个词,翻译成全英文单词,然后使用字符进行连接。由于数据集市项目一般规模比较大,在以上四种翻译方法中,均需要大量的设计人员实现物理模型的生成,如果每个设计人员都是手动生成物理模型的话,那么,相同的属性在不同的实体内时,很可能就翻译为不同的字段英文名,而在数据集市系统逻 ...
【技术保护点】
一种翻译方法,用于数据集市,其特征在于,包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称;将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称。
【技术特征摘要】
1.一种翻译方法,用于数据集市,其特征在于,包括:获取逻辑模型中实体中文名称;将获取的实体中文名称自动翻译为实体英文名称,将所述实体英文名称视为物理模型中表英文名称;获取逻辑模型中属性中文名称;将获取的属性中文名称自动翻译为属性英文名称,将所述属性英文名称视为物理模型中字段英文名称;其中,所述将所述实体英文名称视为物理模型中表英文名称包括:判断所得的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,如果是,得到物理模型中的表英文名称,如果不是,将所得的实体英文名称的最后一位字母替换为一个预定的整数n,0≤n≤9;判断该将最后一位字母替换为n的实体英文名称是否与物理模型中已存在的所有表英文名称均不同,若不是,则将该将最后一位字母替换为n的实体英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有表英文名称均与该替换了最后一位字母的实体英文名称不同,得到物理模型中的表英文名称;所述将所述属性英文名称视为物理模型中字段英文名称包括:判断所得的属性英文名称是否与物理模型中已存在的所有字段英文名称均不同,若不是,将所得的属性英文名称的最后一位字母替换为一个预定的整数n,0≤n≤9;判断物理模型中已存在的所有字段英文名称是否均与该将最后一位字母替换为n的属性英文名称不同,若不是,则将该将最后一位字母替换为n的属性英文名称的最后一位字母替换为n+1,直至物理模型中已存在的所有字段英文名称均与该替换了最后一位字母的属性英文名称不同,得到物理模型中的字段英文名称。2.根据权利要求1所述的方法,其特征在于,所述将获取的实体中文名称自动翻译为实体英文名称包括:将获取的实体中文名称进行拆分,得实体词根;根据词根表将所有实体词根翻译为对应的实体英文简称;将所有实体英文简称按预定顺序通过预定方法进行拼接,并自动加上代表所述实体英文名称所在主题的英文前缀,得到实体中文名称对应的实体英文名称;所述将获取的属性中文名称自动翻译为属性英文名称包括:将获取的属性中文名称进行拆分,得属性词根;根据词根表将所有属性词根翻译为对应的属性英文简称;将所有属性英文简称按预定顺序通过预定方法进行拼接,得到属性中文名称对应的属性英文名称。3.根据权利要求2所述的方法,其特征在于,所述将获取的实体中文名称进行拆分,包括:判断获取的实体中文名称是否在词根表中;若不在,则去掉该实体中文名称中最后一个汉字,获取该去掉最后端一个汉字的实体中文名称;若在,则将该实体中文名称作为一个实体词根,并将该实体词根从该实体中文名称中去除,获取该去除了所述实体词根的实体中文名称;所述将获取的属性中文名称进行拆分,包括:判断获取的属性中文名称是否在词根表中;若不在,则去掉该属性中文名称中最后一个汉字,获取该去掉最后端一个汉字的属性中文名称;若在,则将该属性中文名称作为一个属性词根,并将该属性词根从该实体中文名称中去除,获取该去除了所述属性词根的属性中文名称。4.根据权利要求3所述的方法,其特征在于,所述去掉该实体中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该实体中文名称对应的原始实体中文名称中未被拆分为实体词根的汉字,在词根表中添加所有未被拆分为实体词根的汉字的英文翻译及简称;所述去掉该属性中文名称中最后一个汉字后还包括:判断是否所有汉字都已经去除,若是,则找出该属性中文名称对应的原始属性中文名称中未被拆分为属性词根的汉字,在词根表中添加所有未被拆分为属性词根的汉字的英文翻译及简称。5.根据权利要求3所述的方法,其特征在于,所述获取该去除了所述实体词根的实体中文名称后还包括:判断获取的去除了所述实体词根的实体中文名称中是否包含汉字,若不包含,则说明获取的实体中文名称已拆分完成,根据词根表将所有实体词根翻译为对应的实体英文简称;所述获取该去除了所述属性词根的属性中文名称后还包...
【专利技术属性】
技术研发人员:周灵艳,高尚,刘安,王宁,李莉,崔大凯,叶馥郁,付慧敏,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。