当前位置: 首页 > 专利查询>黄桂清专利>正文

一根形码计算机汉字输入法制造技术

技术编号:2883241 阅读:289 留言:0更新日期:2012-04-11 18:40
本发明专利技术为‘一根形码计算机汉字输入法’。国内现有输入法主要分为‘声码、形码和声形码’等几大类,其特点是:‘声码重码多录入慢,形码字根多学习难,声形码体系较繁杂’。本发明专利技术属于形码,针对现有形码的上述特点,从汉字结构中精选出25个字根,通过‘四角剥取,字根展延。交围不拆,拆尾补全’的拆分原则对汉字进行编码,实现了汉字录入‘大词汇量,多简码字,低重码率’的超高性能,较好地解决了汉字输入‘难度与速度’的矛盾。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术为‘一根形码计算机汉字输入法’,系一种形码汉字输入法。国内现有输入法主要分为声码、形码和声形码等几类,其一般特点是声码重码多录入慢,形码字根多学习难,声形码体系较繁杂。正因为如此,在解决汉字录入的‘难度’与‘速度’的矛盾方面,还留下了较大的改进余地。本专利技术针对形码的上述特点,从汉字结构中精选出25个字根,通过‘四角剥取,字根展延。交围不拆,拆尾补全’的拆分原则,实现了汉字录入‘大词汇量,多简码字,低重码率’的超高性能,较好地解决了中文输入法‘难度’与‘速度’的矛盾。目前国内已有大量的各式汉字输入法的存在,呈现出所谓的‘万码奔腾’的局面。方案不少,大体可分为以下四类①、声码。代表为全拼码。全拼拼音是指我国法定的标准汉语拼音方案,采用标准西文键盘上除‘V’以外的25个英文字母。在全拼拼音状态下输入汉字,要求逐个打入汉字拼音,从所显示的同音字中选取所需要的汉字。这种方案建立在汉语拼音的基础上,因此,有一定汉语拼音的学起来很容易掌握。但因其重码太多,选码费时费力,速度很慢,使用颇为不便。②、形码。代表为五笔字型。五笔字型是原河南省中文信息研究会王永民等人研究出来的汉字编码和汉字输入法,是我国目前应用最广、在国内外影响最大的汉字输入技术。虽然在开始学习需要记忆的东西较多,上手较慢,但是由于它具有一定的规律、重码率低等特点,经过一定时间的学习与实践后会逐渐适应,输入速度也会逐步提高,是专业打字员的首选汉字输入法。这种方法把汉字字形作如下划分五种基本笔画横、竖、撇、捺、折;三种基本字型;左右型、上下型、杂合型;130个基本字根部件,将其中的130个字根部件分为5类,分别与25个字母键(Z键除外)对应。③、声形码代表为自然码。自然码是中国软件技术公司软件专家周志农完成的一个以音为主,以形为辅,尝试集各种输入方案的优秀功能为一体的汉字输入软件。一经推出,风靡全国,被国家科委、新华社等国家级单位推为首选汉字输入法。自然码的核心是拼音输入,吸收了双拼输入法的键盘布局,输入词为主,单字的输入引入了形码的部分技巧,在造词方面有独到之处,是较成功的声形码汉字输入法。但双拼键盘布局以及形码部分记忆量较大,体系较繁杂。熟练掌握仍需花费不少时间和精力,故装机不少而选用此法的人不算太多。④、其它码代表为区位码。这种码是我国国家标准信息交换汉字编码GB2312-80中的区位编码,也称为国标区位码,简称国标码,它包括、数字、英文、日文、希腊字母、俄文字母以及各种图形符号,共7445个。国际GB2312-80规定,全部7445个汉字及符号组成一个94*94的矩阵,在这个正方形的矩阵中,每一行称为一个‘区’,每一列称为一个‘位’,因此有94个区,编号为01-94,每一个汉字或符号都对应唯一的区位编号,区号在前位号在后,这就是区位码,如‘啊’的区位码为1601。这类码的特点是没有重码,但编码没有规律,机械记忆的成份较大,不易掌握和使用。此类码一般为专类职员选用。本专利技术的目的随着知识经济的到来,计算机已经全面地走进了社会生活的各个方面。汉字输入法经过多年的发展,已经有了众多的方案。但人类对技术的追求是没有止尽的,汉字输入法的发展远没有到达尽头。从计算机的普及来看,汉字输入法仍是大众学习和使用电脑的一个‘瓶颈’。本专利技术正是力图使中文输入更为简单实用,也更为大众化而提出的一个的解决方案。本专利技术的技术方案如下(1)、基本概述本专利技术为‘一根形码计算机汉字输入法’,属于形码的一种,最大码长4码。国内现有输入法主要分为‘声码、形码和声形码’等几类,其特点是‘声码重码多录入慢,形码字根多学习难,声形码体系较繁杂’。本专利技术属于形码,针对形码的上述特点,从汉字结构中精选出25个字根,通过‘四角剥取,字根展延。交围不拆,拆尾补全’的拆分原则,兼备形码录入快捷和声码易学的优点,实现了汉字录入‘大词汇量,多简码字,低重码率’的超高性能,妥善地解决了中文输入法‘难度’与‘速度’的矛盾。实现了‘大词汇量(54237个词组),多简码字(一级25个,二级548个,三级2812个),低重码率(全部简码实现零重码率,全部字词编码65555条,重码率仅为0.84%)’的超高性能,使编码自然,轻松,快速和流畅,最大限度地缩短学习的时间,减轻学习的负担,具有‘简单易学,快捷酣畅’的‘快速’特点。此法共计收录一级汉字6747个。本专利技术把汉字看成由25个字根构成,根据简明的拆分原则,即可实现汉字的快速编码和录入。(2)、单字字根全部字根只有25个,除Z键外作为查询键外,每个键位对应一个字根及一个作为一级简码的键名汉字。布局为 (3)、拆分原则①、四角剥取单个汉字码长4码,即全码为4码。取码按汉字的‘左上,右上,左下,右下’的顺序,如剥笋一样取出,称为‘剥取’。如‘码’字,顺序拆取字根为编码为‘cnkn’。当字根逐一被剥取时,余下的部分仍按四角方位剥取。如‘位’编码为‘rogu’。②、字根展延字根除键面的字根外,可作具有相同外形特征的适度展延变形,展延变形的字根被看作是原字根进行编码使用。变形参照如下 ③、交围不拆笔划间相交的关系以及包围结构不能拆分,‘包围’指一部分笔划被另一部分笔划三面或四面封闭式包围。只有在符合第四条‘拆尾补全’的原则时才能拆分。前者如‘带’拆分为‘ajfj’。‘我’字拆分编码为‘tyab’。后者如‘锢’编码为‘jlfg’、‘盟’编码为‘ljgj’。④、拆尾补全每个编码都可编出4位的全码。1、2、3位的简码,是在全码的基础上分别抽出1、2、3位码形成的。当拆取时不足4位码,则将最后一码再拆成单笔补足4位码。仍补不足的,重置该字继续补码。如‘调’拆为‘pjkx’;如‘一’拆为‘gggg’。⑤、编码方法单字单个汉字。全码码长4码。依四角顺序按拆分原则取编码。当拆取时不足4位码,则将最后一码拆成单笔补足4位码。仍补不足的,重置该字继续补码。如‘调’拆为‘pjkx’;如‘一’拆为‘gggg’。词组由一个以上单字组成的字串。二字词组各取前两码。三字词组取各字首码及末字第二码。三字以上词组取前三字及最未字首码。如‘形霸’取码‘gtgf′;‘形霸码’取码‘ggcn’;‘形霸码输入法’取码‘ggci’。简码分一级(共25个),二级(共548个),三级简码(共2812个)。先输入相应个数编码,再加空格断码键。如一级简码‘的’,键入‘r’加空格即可;二级简码‘大’,键入‘dy’加空格即可。本专利技术全部简码实现零重码率。本专利技术与
技术介绍
相比较其主要区别在于‘拆分原则’上。(1)、四角剥取现有的形码通常按笔序进行拆分,由于汉字有很多的笔划固定组合,这样就势必需要很多的字根才能满足汉字拆的需要。而如果想减少字根数量,就必然把字根的笔划减少,使其构字能力更强,而因为笔划固定组合的存在,只使用笔划少的字根又会使重码大大增加。本专利技术采取四角取码的方法,单个汉字码长4码,即全码为4码。取码按汉字的‘左上,右上,左下,右下’的顺序,如剥笋一样取出,称为‘剥取’。当字根逐一被剥取时,余下的部分仍按四角方位剥取。这样既可以把字根做得很小,又可以避开由于汉字笔划的固定组合而导致重码增加的问题,达到巧妙地解决字根多与重码多这个难题的目的。(2)、字根展延现有形码的字根强调机械的分割性,变化本文档来自技高网
...

【技术保护点】
本输入法为形码汉字输入法,具有自成体系的编程原理,完整的拆分原则及编码方法,具备了作为一种计算机汉字输入法所需的各种要素。在‘码长、词组编码’等几个方面与现有技术具有共同的技术特征。本专利技术为‘一根形码计算机汉字输入法’,属于形码,最大码 长4码。国内现有输入法主要分为‘声码、形码和声形码’等几类,其特点是:‘声码重码多录入慢,形码字根多学习难,声形码体系较繁杂’。本专利技术属于形码,针对形码的上述特点,从汉字结构中精选出25个字根,通过‘四角剥取,字根展延。交围不拆,拆尾补全’的拆分原则,兼备形码录入快捷和声码易学的优点,实现了汉字录入‘大词汇量,多简码字,低重码率’的超高性能,妥善地解决了中文输入法‘难度’与‘速度’的矛盾。实现了‘大词汇量(54237个词组),多简码字(一级码25个,二级码548个,三级码2812个),低重码率(全部简码实现零重码,全部字词编码65555条,重码率仅为0.84%)’的超高性能,使编码自然,轻松,快速和流畅,最大限度地缩短学习的时间,减轻学习的负担,具有‘简单易学,快捷酣畅’的‘快速’特点。此法共计收录一级汉字6747个。本专利技术把汉字看成由25个字根构成,根据简明的拆分原则,即可实现汉字的快速编码和录入。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄桂清
申请(专利权)人:黄桂清
类型:发明
国别省市:45[中国|广西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1