本发明专利技术公开了一种象形编码汉字数字化输入的方法,它以数字象形设定汉字笔形,并以“首2尾2”和“单字、部首”优先的规则取码,构成最多四位的不等码(词语固定五码),用于计算机、手机的汉字输入。本发明专利技术以象形取码几无背记,且不用口诀不看结构,简单到一二年级小学生都学得会,同时做到了同类技术中的重码率最低。
【技术实现步骤摘要】
本专利技术涉及汉字输入方法,是运用"汉字笔形"与"阿拉伯数字"的象 形进行汉字编码,并在手机、计算机等数字键盘上实现输入的一种汉字数码 输入方法。
技术介绍
如何实现汉字检索现代化,使汉字检索如同西文般地方便,改反切拼音 为汉语拼音(音序检索)的王竹溪先生为中华第一人。上世纪三十年代创立 "四角号码"的王云五先生吹响了汉字(形序检索)数字检索的冲锋号,终 因笔形变异和重码率高而未成正果。同一技术,人工检索叫査字典,计算机、 手机检索叫输入法,而时下汉字数字输入法较好的是"一码二形数字编码汉字输入方法"(专利号03126755.6)。然该方案仍存在美中不足, 一是"码 元(汉字笔形)"的设计与阿拉伯数字不象形,这就给背记带来了麻烦和困难。 二是规则仍较繁难,甚至需运用口诀来背记,如取码时须看字的结构,其中 合体字的第三笔必须转入该字结构的下一个部位获取;以及同时可取多种笔 形拆分时,要在默认多笔画优先的前提下再按笔顺优先的原则。虽为降低重 码不得已而为之,但实际上影响了它的应用和推广,特别小学阶段的学生不 能广泛应用。怎样才能实现汉字元素和阿拉伯数字的完美转换(象形联想、 见形识码),怎样才能做到数字键盘汉字输入的规则最简、方法最易、重码最 低,实现汉字输入(检索)现代化之夙愿呢?
技术实现思路
本专利技术的目的在于提供一种在数字键盘上,以阿拉伯数字为代码,实现 见形识码的汉字数字化输入方法。为实现上述目的,本专利技术的技术方案包括-a、设计象形码筛选出所需基本码元笔形码o、1 、 一、 二、十、h、 j 、 i、八、、; 部首码4 、 t 、卄、牵、门、夕、t 、 i_、 ?; 单字码木、土、虫、人、又、广。以基本码元与数字形状近似的特征,在每个数字键上各自设定相应的基本码元,其中数字键"T'对应基本码元为"和M ,,;数字键"'对应基本码元为"_^数字键''(3"'对应基本码元为'',、"净"和"木";数字键"'4"'对应基本码元为'"十,',、"卄"禾口 "土,,;数字键"(5"'对应基本码元为''、",门"禾B "虫"数字键"(6"'对应基本码元为'",',禾口 "人";数字键"£ 7 "'对应基本码元为'',、"夕i i_,,禾卩"又数字键"(8"'对应基本码元为'"八'',禾口 ",,;数字键"(9"'对应基本码元为'',禾口 "广";数字键"'对应基本码元为'"口久,b、编码规则第一、依据上述设定的象形码,按如下规则对汉字进行编码 (1)"首2尾2"取码依照汉字书写顺序,每字(不管字的结构是什么)先取第一、第二笔形 所对应的数字键为代码,再取该字倒数第二、倒数第一笔形所对应的数字键为代码,组成该字的编码条目;每条目最多四码,不足四码的以实际为准。(2) "单字、部首"优先遇到同时可取两种以上代码时,先取单字码,再取部首码,最后取笔形码。(3) "点"、"捺"之变化 在字右上角出现的点"、"不计码;在字右下角出现的点捺" <"通常取数字键"99"为代码,当点捺 " < "的前笔形为"7 "时,取数字键"8"为代码。第二、词或词组的取码按如下规则(1) 二字和三字词语依次取前两个字各自的第一、第二笔形编码和该词最 后一个笔形编码。(2) 四字及四字以上的词语或常用短语,取前四字各自的第一笔形和最后一个字的最后一个笔形编码。(3) 当某部位已被前码取过时,则该部位的代码重复前一码,使词的码长保持五位。本专利技术与现有技术相比,具有以下鲜明的特点(1) 、背记少使汉字笔画与数字象形,就能"见形识码"而无须死记 硬背,实现了汉字元素与阿拉伯数字的最佳转换。(2) 、规则少"首2尾2"的取码位置;"单字、部首、笔形"的取码次 序;"点捺之变化"的降低重码;三条规则少而简单。(3) 、难度小象形编码容易记、不看结构规则简单,小学一二年级学 生就能学会。(4) 、重码低、实施简便其重码率与"一码二形数字编码汉字输入方法"比较如下:象形码一码二形汉字数76297000左右重码条目72条70多条百分比0. 94%〉1%其实施方式比较如下:象形码一码二形背记象形特征无规则口诀无有取码位置首2尾2首3尾1结构要求不看字形合体字要根据结构取码难易小学一、二年级初中以上成果推广《中华小字典》已使用具体实施例方式a、本专利技术在每个数字键上设定对应的汉字笔形(包括笔画、部首或单字),具体情况如下数字键"1"称作竖,设定笔形"Ij "和"4 "; 数字键"2"称作横,设定笔形"一 提"; 数字键"3"称作双横,设定笔形"二"、"矛"和"木"; 数字键"4"称作横叉,设定笔形"十"f"、"廿升"和"土 士"; 数字键"5"称作竖起折,设定笔形"h 〈 1"、",门^ "、和"虫"; 数字键"6"称作撇\撇点,设定笔形"j'"和"人"; 数字键"7"称作横起折,设定笔形""、乙,,、"夕H"和"又"; 数字键"8"称作双点,设定笔形"八^ "和"?";数字键"9"称作点\捺,设定笔形"、^"和"广"; 数字键"0"称作口\框,设定笔形"口 口"。为直观简化,制表如下:象形码表象形码0123456789笔形码口一_ 十、(笔形的变异)日提〈匕、乙部首码矛卄韦门夕i i_〉(部首的变异)升士M匚u单字码木土虫人又广注(笔形的变异)与笔形码等效;(部首的变异)与相应的部首码、单字码等效。 笔形码靠象形、部首码循谐音"矛*,门,iL ^:能守小金门,免谈走水)、单字码依笔名(木土人又广杜人又广),解决全部记忆问 题。b、依据上述设定,按如下规则对汉字编码 (1)、"首2尾2"取码依书写顺序,字之首尾各取二码组成该字条目,每条目最多四码(注意 划线)如:对于简体字:虫小吉以上①置②非片鬼②为5406]_276i59对于繁体字:蟲小吉以上 置②非片鬼②5129^6丄276i599f888注双横要大致对称,"上"不能选13: 大口框须完整,有出头穿插都不算。 (2)、"单字、部首"优先碰到同时可取两种以上代码时,先取单字代码(共6个),再取部首代码 (共9个),最后取笔形代码(共10个);归纳全部难点如下对于简体字:<table>table see original document page 9</column></row><table>注大口框须一次取清;"人、木、又"等,单字码优先取;括号里的(约千分之四)为备选码。(3)、"点"、"捺"之变化右上角的点"、"不记码,例戈25g辅253丄我6"6戴4Q56 ; 右下角的点捺" < "通常取数字键"99"为代码,但在前笔形为"7 "时, 改取数字键"8"为代码,例囊20^很61^家95巡求4雄。C、作为进一步的应用,词、词组的取码按如下规则(1)、 二字和三字词语依次取前两个字各自的第一、第二笔形编码和该词最后一个笔形编码。如(专利35631)、(说明书78021)。(2) 、四字及四字以上的词语或短语,取前四字各自的第一笔形和该词语最后一个笔形编码。如(知识产权67937)、(中华人民共和国01679)。(3) 、依照上述规则取码时,当某部位已被前码取过时,则该部位的代码 重复前一码,使本文档来自技高网...
【技术保护点】
一种象形编码汉字数字化输入方法,其特征在于: a、设计象形码 筛选出所需基本码元: 笔形码:口、丨、一、二、十、ㄣ、丿、乛、八、丶; 部首码:亻、扌、艹、钅、冂、ク、讠、辶、氵; 单字码:木、土、虫、人、又、广 ; 以基本码元与数字形状近似的特征,在每个数字键上各自设定相应的基本码元,其中: 数字键“1”对应基本码元为“丨”和“亻”; 数字键“2”对应基本码元为“一”; 数字键“3”对应基本码元为“二”、“扌”和“木”; 数字键“4”对应基本码元为“十”、“艹”和“土”; 数字键“5”对应基本码元为“ㄣ”、“钅 冂”和“虫”; 数字键“6”对应基本码元为“丿”和“人”; 数字键“7”对应基本码元为“乛”、“ク 讠 辶”和“又”; 数字键“8”对应基本码元为“八”和“氵”; 数字键“9”对应基本码元为“丶”和“广”; 数字键“0”对应基本码元为“口”; b、编码规则 第一、依据上述设定的象形码,按如下规则对汉字进行编码: (1)“首 2尾2”取码 依照汉字书写顺序,每字(不管字的结构是什么)先取第一、第二笔形所对应的数字键为代码,再取该字倒数第二、倒数第一笔形所对应的数字键为代码,组成该字的编码条目;每条目最多四码,不足四码的以实际为准; (2)“单字、部首 ”优先 遇到同时可取两种以上代码时,先取单字码,再取部首码,最后取笔形码; (3)“点”、“捺”之变化 在字右上角出现的点“丶”不计码; 在字右下角出现的点捺“ㄑ”通常取数字键“99”为代码,当点捺“ㄑ”的前笔形为“ 冫”时,取数字键“8”为代码; 第二、词或词组的取码按如下规则: (1)、二字和三字词语依次取前两个字各自的第一、第二笔形编码和该词最后一个笔形编码; (2)、四字及四字以上的词语或常用短语,取前四字各自的第一笔形和最后一 个字的最后一个笔形编码; (3)、当某部位已被前码取过时,则该部位的代码重复前一码,使词的码长保持五位。...
【技术特征摘要】
【专利技术属性】
技术研发人员:杜长源,
申请(专利权)人:杜长源,
类型:发明
国别省市:31[中国|上海]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。