【技术实现步骤摘要】
本专利技术属于计算机信息处理技术的汉字编码键盘输入方法,特别是以PC通用键盘的26个拉丁字母键通过对汉字编码输入中文信息的方法。一、技术背景自从计算机在汉语言区域应用以来,汉字编码输入技术就是实现计算机中文信息处理的关键之一。由于汉字数量繁多、结构复杂,对其编码有一个相互矛盾的两难问题。首先是汉字特征与编码符号之间对应的唯一性,即重码问题;其次是编码符号与汉字特征之间相互关联的可接受性,即编码符号的有理化问题。新的编码方案只有在这两个相互矛盾的问题同时得到解决时,才能成为一种既好学又好用、理想的汉字编码方案。现有的汉字编码输入技术为解决重码问题而大量地扩充码元和字元,使编码元素达到二、三百个甚至四百个之多,由于不能进行合理归类,且人为地将汉字部件拆分并强行安置到键盘的各个键位上。这种无理编码方式,表面上看似有规律,其实是走入了汉字编码的误区,为记忆这些码元和汉字的拆分规则而大量耗费使用人员脑力的结果,更加大了汉字输入的劳动强度,这是人们普遍认为汉字输入技术难以掌握的主要原因。本专利技术的目的,旨在解决计算机中文信息处理中上述汉字编码技术的两难问题,即降低汉字编码的重码率和编码符号与汉字编码相对应的有理化难题;通过科学地选取声、形码元构建一个适用于国家GB2312-80和GB18030-2000繁体、简体大字符集汉字的编码体系,从而为人们提供一种既规范,又简易便捷、能即学即用、理想的汉字编码输入方法。 二
技术实现思路
现有的汉字音形编码输入方式,其固有的缺限与拼音输入方式一样,对读音不准或不认识的汉字难以输入,更难以对汉字部件和各种标点符号进行编码。此外 ...
【技术保护点】
一种计算机汉字输入方法,该方法的汉字编码元素由声码和形码两部分组成,汉字既可以按声形方式编码,也可以按形声方式编码,其特征在于: (1)所述声码为汉字汉语拼音的首字母,且与PC通用键盘上除I、U、V以外所余的23个拉丁字母一一相对应;形码部分由首形码、尾形码、补形码组成,它们分别定位取汉字三个角的笔形特征进行编码,对汉字形码的约定意义是:先以汉字左上角起笔的笔形特征为首形码,然后以汉字右下角末笔的笔形特征为尾形码,最后以汉字右上角最高的笔形特征为补形码,汉字声码元素和形码元素的集合构成了可对国家GB2312-80和GB18030-2000《信息交换汉字编码字符集》中繁体、简体大字符集汉字及其偏旁、部件、中英文标点符号进行编码的码元体系; (2)所述汉字形码部分的字形编码元素分为26类,每一类仅以一个具有代表性的汉字部件作为汉字形码的基本编码元素,再辅以与基本编码元素形态相似的扩展码元10个,它们分别与键盘上的26个拉丁字母按笔形特征的形似关系相对应: E-一 单笔画横; I-丨亅 单笔画竖、竖左钩; J-丿 单笔画撇; U-丶 单笔画点; ...
【技术特征摘要】
1.一种计算机汉字输入方法,该方法的汉字编码元素由声码和形码两部分组成,汉字既可以按声形方式编码,也可以按形声方式编码,其特征在于(1)所述声码为汉字汉语拼音的首字母,且与PC通用键盘上除I、U、V以外所余的23个拉丁字母一一相对应;形码部分由首形码、尾形码、补形码组成,它们分别定位取汉字三个角的笔形特征进行编码,对汉字形码的约定意义是先以汉字左上角起笔的笔形特征为首形码,然后以汉字右下角末笔的笔形特征为尾形码,最后以汉字右上角最高的笔形特征为补形码,汉字声码元素和形码元素的集合构成了可对国家GB2312-80和GB18030-2000《信息交换汉字编码字符集》中繁体、简体大字符集汉字及其偏旁、部件、中英文标点符号进行编码的码元体系;(2)所述汉字形码部分的字形编码元素分为26类,每一类仅以一个具有代表性的汉字部件作为汉字形码的基本编码元素,再辅以与基本编码元素形态相似的扩展码元10个,它们分别与键盘上的26个拉丁字母按笔形特征的形似关系相对应E-一 单笔画横;I-丨亅 单笔画竖、竖左钩;J-丿 单笔画撇;U-丶 单笔画点;R-_ 单笔画捺;C-乚 单笔画横向上钩、斜右钩;S- 单笔画折弯钩;A-亠 头笔,点与横的组合;X-乂ナ 斜叉,两笔斜交叉;H-十 正叉,两笔垂直正交叉;N-艹卄 草头,草字头和草字头的变形;W-扌 斜插,一笔斜向穿过两笔或两笔以上的笔画;M-丰 正插,一笔垂直穿过两笔或两笔以上的笔画;T-_ 金旁头,撇与横的组合;K-乛_ 斜角笔形,一笔向下斜向转折或两笔笔头斜向相接组成的斜角笔形;L-_ 直角笔形,一笔向下垂直转折或两笔笔头垂直相接组成的直角形;Y-亻 单人旁;G-シ冫 三点水、两点水;O-口 空小方框,小框内无笔画;Q-日 实小方框,小框内有笔画;D-口 独立的大方框,大方框外无附加笔画;P-月 月和月字形的变形;F-木 木和木字形的变形;V-小_忄 小和小字形的变形;B-八丷 八和八字形的变形;Z-王 王和王字形的变形;(3)汉字的声形编码方式为不等长码,其最大码长为四键,根据编码需要可以设置任何汉字的简码,编码时先取汉字读音的声码,然后取汉字的形码,其码元的编码顺序为声码+首形码+尾形码+补形码;(4)汉字的形声编码方式为等长码,码长为四键,在不产生重码时也可以设置简码,对汉字编码时先取汉字的字形码,然后取汉字字末成字偏旁或字首成字偏旁读音的声码,其码元的编码顺序为首形码+尾形码+补形码+成字偏旁声码。2.如权利要求1所述的汉字输入方法,其形码部分的汉字字形编码规则如下(1)对汉字取形码,在既可以取单笔画又可以取多笔画字元部件时,应优先按多笔画字元取码,这是编码时“取大部件优先”的规则;(2)一个笔形或部件,前角已用过,后角仍可以重复取码;(3)一个笔形或部件可以分角取码;(4)一笔的上下两段与其它笔画构成两种不同的笔形或部件的,应分角取码;(5)凡缺角的汉字取形码时,缺角部分无笔画的形码一律取A,这是编码时“缺角取A”的规则;(6)对于字首是头笔画(亠)、草字头(艹)或属草字头变形的汉字,在取其右上角的补形码时,不直接取其右上角,应移除(亠)和(艹)后再取右上角的笔画作补形码;(7)对于外围是“口、门”两类的汉字,在取其右下角的尾形码时,不直接取其右下角,而改取其框内右下角的笔画作尾形码,但在“口、门”的上、下、左、右有附加笔画的两类汉字不在此例,仍同一般汉字取右下角的笔画作尾形码。3.如权利要求1所述的汉字输入方法,汉字在形声编码输入方式下取成字偏旁的声码,其特征在于所取成字偏旁的声码无论是字首成字偏旁或是字末成字偏旁,均为最大成字偏旁汉语拼音的首字母,其具体规定如下(1)本发明所指的“成字偏旁”是指组成该字的偏旁有明确的读音、而且不需要修正笔形即可独立使用的汉字;(2)本发明所指的“字首成字偏旁”是由汉字首笔与其后续笔画组成的最大成字偏旁;(3)本发明所指的“字末成字偏旁”是由汉字末笔与其前续笔画组成的最大成字偏旁;(4)汉字偏旁的取码优先取字末成字偏旁的声码,如没有字末成字偏旁则改取字首成字偏旁的声码,没有字首、字末成字偏旁的汉字,其声码一律取V。4.如权利要求1所述的汉字输入方法,汉字的偏旁、部件和笔画采用声形输入方式编码,其特征在于在形码前加入了分类引导字符,以非声母的I、U、V作为前置字母替代声码...
【专利技术属性】
技术研发人员:刘君度,刘冰彬,陈昌英,
申请(专利权)人:刘君度,刘冰彬,陈昌英,
类型:发明
国别省市:45[中国|广西]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。