蒙古文字母变体形式编码技术制造技术

技术编号:4122472 阅读:718 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种蒙古文字母变体形式编码技术,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码:读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码;读音相同字母的变体形式按照字词中的不同位置,依次为独立字形、词首字形、词尾字形、词中字形的顺序编码;读音相同、字词中所处位置相同字母的变体形式的编码;优点在于:使所有现有蒙古文编码完全实现读音编码,实现了蒙古文字词自然排序;完全达到蒙古文字词的拉丁文相互转写、ISO/IEC 10646相互转换的一对多和多对一关系;在蒙古文计算机用字体开发上提供了宽松的设计制作条件;为蒙古文语音输入、输出铺平了技术瓶颈。

【技术实现步骤摘要】

本专利技术涉及一种蒙古文字母变体形式编码技术,涉及计算机蒙古文字母变体形式编码技术的方法,属于计算机文字处理

技术介绍
蒙古文由8个元音、27个辅音共35个读音组成。蒙古文字母在字词中所处的位置不同分为独立、词首、词中、词尾等四种字形,又在蒙古文字词中上下黏结不同字母时会有不同变体形式。根据ISO/IEC 10646的有关规则,只对蒙古文字母的变体形式中的一个进行编码。按照规则对于元音,采用它们的独立字形;对于辅音采用出现在元音读音为A前面的词首字形。另外,为了解决形同音不同字母,在规则里对读音U、读音UE两个字母使用了词首字形。规则中规定的字母变体形式、读音和编码次序如下 读A; 读E; 读I; 读O; 读U; 读OE; 读UE; 读EE; 读N; 读ANG; 读B; 读P; 读Q; 读G; 读M; 读L; 读S; 读SH; 读T; 读D; 读CH; 读J; 读Y; 读R; 读W; 读F; 读K; 读KH; 读TS; 读Z; 读HA; 读ZR; 读LH; 读ZHI; 读CHI。其中蒙文的8个元音和27个辅音分别为,元音A、E、I、O、U、OE、UE、EE,辅音N、ANG、B、P、Q、G、M、L、S、SH、T、D、CH、J、Y、R、W、F、K、KH、TS、Z、HA、ZR、LH、ZHI、CHI。上述读音次序既是国家规范《蒙古文字母顺序》的读音排序次序。 上述蒙古文编码技术只对35个字母的一个变体形式进行了编码,未对所有字母变体形式进行次序规定和编码,且未考虑计算机操作系统的新旧版本的兼容性。这样会产生,如果所有变体形式的次序规定和编码不合理,则无法保证蒙古文字词的完全读音分解和自然排序,必然需要二次开发蒙古文字词排序软件;则无法保证在拉丁文相互转写和与ISO/IEC 10646相互转换中的一对多和多对一的关系;则也会因编码设计的局限性造成蒙古文计算机用字体数量有限和字形效果呆板问题。
技术实现思路
本专利技术的目的在于提供一种蒙古文字母变体形式编码技术,是实现蒙古文字词的完全读音分解和自然排序,使蒙古文字词在拉丁文相互转写和与ISO/IEC 10646相互转换中达到一对多和多对一的关系,避免了多对多的二义性和复杂性技术问题,同时解决了蒙古文字母在字词中上下粘结不同字母时产生的黏结结构失真的问题,使蒙古文字词的外观上产生艺术效果,能够设计出更多、更美观的计算机用字体。 便于说明
技术实现思路
,结合蒙古文字母变体形式规范使用规则,就蒙古文字母的部分变体形式归类为常用形式字形、第二形式字形、第三形式字形、词中整形字形、词中分写字形和词中连写字形等等。详细归类如下 常用形式字形有独立字形的 (读E字形), 等;词首字形的 (读A字形), (读E字形), 等;词尾字形的 等;词中字形的 (读A和读E字形), (读I字形), (读O和读U字形), (读EE字形), 等; 第二形式字形有独立字形的 (读A字形), (读I字形), 等;词首字形的 (读A字形), (读E字形)等;词尾字形的 (读O和读U字形), 等;词中字形的 (读OE和读UE字形), 等; 第三形式字形有词尾字形的 (读OE和读UE字形)等; 词中整形字形有 等; 词中分写字形有 (读N字形), (读J字形), (读Y字形), (读音W)等; 词中连写字形有 (读N字形), (读音W)等。 本专利技术的目的由如下技术方案实施一种蒙古文字母变体形式编码技术,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码 一、读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码。即读A;读E;读I;读O;读U;读OE;读UE;读EE;读N;读ANG;读B;读P;读Q;读G;读M;读L;读S;读SH;读T;读D;读CH;读J;读Y;读R;读W;读F;读K;读KH;读TS;读Z;读HA;读ZR;读LH;读ZHI;读CHI的依次编码; 二、读音相同字母的变体形式按照字词中的不同位置,依次为独立字形、词首字形、词尾字形、词中字形的顺序编码; 三、读音相同、字词中所处位置相同字母的变体形式按照如下顺序编码 1.读音相同字母的独立字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE和读音EE等的独立字形的常用形式编在最前,第二形式编在最后; 2.读音相同字母的词首字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音CH、读音W、读音TS、读音Z、读音HA、读音LH、读音ZHI和读音CHI等的词首字形的常用形式编在最前,第二形式在常用形式之后;读音N的词首字形遵循 和 的字形先后顺序,读音Q的词首字形遵循 和 和 的字形先后顺序,读音G的词首字形遵循 和 的字形先后顺序,读音D的词首字形遵循 和 的字形先后顺序下,按照下粘结元音的读音次序和不粘结元音的顺序编码;读音B、读音P、读音F、读音K和读音KH等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音M、读音L、读音S、读音SH、读音T和读音ZR等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音J和读音R的词首字形按照下粘结读音A和读音E的编在最前,下粘结读音I的编在其次,下粘结其它读音的编在最后;读音Y的词首字形按照下粘结读音A、读音E和读音I等的词首形式 编在最前,词首形式 编在其次,下粘结其它读音的词首字形 编在最后; 3.读音相同字母的词尾字形的编码顺序依次为所有读音的常用形式编在最前,第二形式编在其次,第三形式编在第三位,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在最后; 4.读音相同字母的词中字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音D、读音CH、读音TS、读音Z和读音HA等的词中本文档来自技高网
...

【技术保护点】
一种蒙古文字母变体形式编码技术,其特征在于,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码: (1)读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码; (2)读音相同字母的变体形式按照字词中的不同位置,依 次为独立字形、词首字形、词尾字形、词中字形的顺序编码; (3)读音相同、字词中所处位置相同字母的变体形式按照如下顺序编码: (a)读音相同字母的独立字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE和 读音EE等的独立字形的常用形式编在最前,第二形式编在最后; (b)读音相同字母的词首字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音CH、读音W、读音TS、读音Z、读音HA、读音LH、读音 ZHI和读音CHI等的词首字形的常用形式编在最前,第二形式在常用形式之后;读音N的词首字形遵循*和*的字形先后顺序,读音Q的词首字形遵循*和*、*和*的字形先后顺序,读音G的词首字形遵循*和*的字形先后顺序,读音D的词首字形遵循*和*的字形先后顺序下,按照下粘结元音的读音次序和不粘结元音的顺序编码;读音B、读音P、读音F、读音K和读音KH等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音M、读音L、读音S、读音SH、读音T和读音ZR等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音J和读音R的词首字形按照下粘结读音A和读音E的编在最前,下粘结读音I的编在其次,下粘结其它读音的编在最后;读音Y的词首字形按照下粘结读音A、读音E和读音I等的词首形式*编在最前,词首形式*编在其次,下粘结其它读音的词首字形*编在最后; (c)读音相同字母的词尾字形的编码顺序依次为所有 读音的常用形式编在最前,第二形式编在其次,第三形式编在第三位,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在最后; (d)读音相同字母的词中字形的编码顺序依次为读音A、读音E、读音I、读 音O、读音U、读音OE、读音UE、读音EE、读音D、读音CH、读音TS、读音Z和读音HA等的词中字形的常用形式编在最前,第二形...

【技术特征摘要】

【专利技术属性】
技术研发人员:木仁
申请(专利权)人:内蒙古蒙科立软件有限责任公司
类型:发明
国别省市:15[中国|内蒙]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1