本发明专利技术是用于中文信息领域里的一个新颖编码方案。为了解决多字母韵母代换法中的可记性问题和汉字同音字的分解离散问题,以及创建一种易学、易大面积推广、普及,又能利用该汉字编码进行快速中文信息处理的新颖编码。本方案采用了四角笔码定字法和去四字母韵母、韵母顺序代换法。除iong、uo、iang、uang外,其余基本根据排列顺序和相对应排列顺序中的英文字母代换。在根据汉字声韵母得出汉字双拼字母后,再在汉字四角取其笔码,以十分简便易懂的方法最后确定该汉字的字母编码。(*该技术在2011年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术是用于中文信息处理领域里的一个新颖汉字编码方案。汉语拼音韵母表中有35个韵母,要用26个英文字母键来代换35个韵母,势必有好多键要充当二个汉语拼音韵母键的作用。国内外绝大多数双拼编码方案都无法做到将35个韵母,有规律的按顺序安排到英文字母键上去,这样势必要造成中文信息处理操作人员,必须死记硬背英文字母键和所代表韵母的对应关系。汉语拼音经过三十多年的大力推广,在群众中有十分良好的基础,这一点对以汉字读音为基础的音码编码来说,确是得天独厚的优点,然而音码最大的缺点是汉字中存在着大量的同音字。为了分解、离散同音字,音码引进了形码之中十分难学难记的字元和部首,这样一来又大大增加了音形码的学习难度。本专利技术的目的,主要是提出一个新颖的汉字编码。这个汉字编码既能充分发挥音码得天独厚的优势,又不象音形码那样由于增加了形码的成分而使学习难度增加,并且要实现韵母根据排列顺序,有规律地分布到英文字母键上去。使人们见到一个汉字就能十分简便、快速、自然而然地知道对应于这个汉字的一组编码字母符号,以便中文信息操作人员能更快、更好地进行中文信息处理。本专利技术另一个目的是要使我国中文信息界,第一次获得一个有能力、有条件,在全国大面积推广、普及的优秀汉字编码方案。本世纪二、三十年代,在我国专利技术并逐渐流行出来的四角号码检字法,之所以取汉字四角笔形作为查字依据,一个重要的原因就是汉字四角位置,在汉字之中特别醒目,所以四角笔形特别容易被确定。我国汉字编码技术中,现有一些颇有名气、颇有影响的汉字编码方案,不约而同地选择了首笔划和末笔划作为辅助信息,编入编码字母中。除了笔划构成简单外,还有一点是和四角号码检字法不谋而合的,就是首笔划大都集中在汉字的左上角,末笔划大都集中在汉字的右下角。正因为首末笔划大都在汉字特别醒目的部位,所以首末二笔划特别容易被确定。本专利技术注意到上述情况后,下决心将离散、分解同音字的突破点,放在四角笔划信息上。汉字共有三十种左右笔划,将全部笔划归一下类,大致可分为横、竖、撇、捺(点)、折五大类笔划。对于这五大类笔划,本专利技术分别用数字1、2、3、4、0来代表。汉字有第一、第二、第三、第四四角角码,本专利技术为了便于表明,规定分别用①②③④为四个角码的专用表示符号所取笔划用粗黑笔划表示。例如,“会”和“彗”二字,它们的读音都是hui,因为它们的读音相同,所以它们的双拼字母必定相同。根据去四字母韵母,韵母顺序代换法,韵母ui用字母y表示,所以“会”和“彗”二字的双拼字母是hy。接下去就取这二字的四角笔码①会会②③会会④根据取码实例,“会”的四角笔划信息是撇、捺、折、点,进而取得四角笔码为3404,①彗彗②③彗彗④根据取码实例,“彗”的四角笔划信息是竖、竖、横、折,进而取得四角笔码为2210。一个角有可能遇到五种笔划信息,①和②、③和④二个角合起来,共有可能遇到25种笔划信息,汉字中最常见的口也被算作一种信息,共有26种笔划信息,进而有可能取得26种笔码。将26种笔码,根据笔码顺序,以及对应关系同26个英文字母相代换。例如,笔码22由英文字母M代表;笔码10由英文字母F代表;笔码34由英文字母T代表,笔码04由英文字母E代表。于是“会”字,可以用HY3404代表,也可以用HYTE代表;“彗”字可以用HY2210代表,也可以用HYMF代表。这样“会”和“彗”不但二字有了区别,而且和所有读音为hui的汉字都区分开来了。汉字编码分音码、形码、音形码三种类型。音码的缺点,是存在着大量的同音字。形码的缺点是形码通常有一百多个字元部首。使用者还必须记牢这一百多个部首字元和26个英文字母,无规则的对应关系。使用时再要考虑怎样拆分汉字的字元和部首,这些难学难记的部首和规则是广大非专业人员无法掌握的。音形码,增加了形码的成分,同时也增加了难学的程度。正因为三大类型汉字编码存在着不同程度的缺点。目前,我国现有的汉字编码都跳不出这三大类型汉字编码所属的范围。由此产生的结果是,中文信息处理技术长期以来无法大面积推广和普及,汉字编码这项作为我国推广计算机应用急需解决的课题长期攻而不克。本专利技术在汉字编码技术中自创流派,独树一帜,创造了一种音四笔汉字编码。YSB就是音四笔三字的首字母,YSB编码不要求人们记部件,不要求人们拆分汉字,不要求人们增加识别码。只要认准汉字四角五种笔划,四码中前二码一律为双拼字母,后二码一律为四角笔划。经过几小时学习就能掌握,一旦掌握就能以很快的速度,将汉字化成一行字母符号。音四笔码的这些优越特点是任何形码、音码、音形码无法比拟的。要掌握去四字母韵母,韵母顺序代换法,只要记住以下口诀四字韵母靠边站,单字韵母原字配。其余各字依次对,窝雍去首同喔轰。后五韵母后五字,央韵紧跟翁韵后。上浮四字即汪韵。口诀第一句四字韵母靠边站。即在韵母排列顺序之中先将iong、iang、ueng、uang四个韵母去掉,使它们不参加韵母顺序排列;口诀第二句单字韵母原字配。即a、e、i、o、u这五个有单字母构成的韵母仍用单字母A、E、I、O、U来表示;口诀第三句,其余各字依次对。即去掉四字母韵母和单字韵母后,将其余26个韵母根据字母顺序排列出来。26个英文字母去掉需要原字配的A、E、I、O、U,其余21个英文字母根据顺序排列出来,于是就得到下面一张排列表。 口诀第四句窝雍去首同喔轰。即把uo(窝)和iong(雍)去掉一个首字母后和o(喔)、ong(轰)一样用英文字母O、S来表示;口诀第五句后五韵母后五字。就是将余下的七个韵母中的后五个韵母同英文字母最后五个字母相代换,于是我们列出下表。 口诀第六句央韵紧跟翁韵后。即iang排在ueng后面用英文字母V表示;最后一句上浮四字是汪韵。即V字母上面第四个字母R代换uang。去四字母韵母,韵母顺序代换法全表 iong、uo虽然没有根据顺序排列,但把它们去掉首字母后同ong、o放在一起,应该说这是很自然很好记的。原来必须逐一记住的三十五个韵母,当有了顺序代换表后,只要记住iang、uang二个韵母就可以了。四角笔码定字法笔划代号对应表 四角定字法,每角有可能取得5种笔划信息,2角合起来有可能25种信息组合。字元“口”也算是一种信息组合,现将26种信息组合和二十六个英文字母一一对应如下;笔码、英文字母对照表 定字方法(一)取角顺序1)左右结构汉字先取左上,次取左下角,再取右上角,后取右下角。例①②数③④2)左中右结构的汉字,将其左中结构看成是一个左右结构汉字,然后依照左右结构来取。例鹕①②胡③④3)左右、左中右结构以外的任何汉字,先取左上,次取右上,再取左下,后取右下。例①③单②④①③左②④4)一笔划汉字,①②重复取该笔划;二笔划汉字①②取完二笔划后,取码就算完成。例①一一②所以“一”的四角笔码为11。①十十②所以“十”的四角笔码为21。5)只有三笔划的汉字,在取完三笔划后,④对该汉字重新取码。例土字①土土②③土土④所以土的四角笔码是2111。(二)左右结构、左中右结构的汉字。当左结构是女、木、扌、亻、氵时。为了更多的选择汉字的其它笔划信息,所以这五大偏旁,在取①就将整个偏旁当作一个笔划全都取走了,这五大偏旁分别有数字0、1、2、3、4代表,左上角由于把整个偏旁都取走了,左下角就向右下角借笔码。例①杉②杉本文档来自技高网...
【技术保护点】
汉语拼音韵母表中的35个韵母,单字母韵母用原字母代换,四字母韵母暂不参加顺序代换iong、uo去首字母后和ong、o用同样的字母代换,iang和uang分别用字母V、R代换,其余韵母一律依照排列顺序和相对应排列顺序中的英文字母代换。
【技术特征摘要】
【专利技术属性】
技术研发人员:白定泉,
申请(专利权)人:白定泉,
类型:发明
国别省市:32[中国|江苏]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。