当前位置: 首页 > 专利查询>王勤专利>正文

一种汉字信息处理系统技术方案

技术编号:2891931 阅读:230 留言:0更新日期:2012-04-11 18:40
本发明专利技术《一种汉字信息处理系统》涉及汉字编码及其所用的键盘,是一种采用数字编码、适合单手操作、便于学习掌握、能够高速输入及降低硬件造价的能使中国人普遍使用的键盘输入汉字信息处理技术。它由优选的176个字根和对应的码值;严格遵照“书写笔序”、“大根优先”、依次取汉字首1-4码等编码规则;12个数字输入码和键盘有机组合构成。能对GB2312-80的全部汉字、字符及词语进行编码,根据编码敲击本发明专利技术键盘的12个数字键,就能把汉字、字符及词语传输到计算机、电话及类似器件。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术《一种汉字信息处理系统》涉及汉字编码及其所用的键盘,是一种采用数字编码、适合单手操作、便于学习掌握、能够高速输入及降低硬件造价的为电脑、电话及类似器件的开发应用、推动电脑进入家庭,适合汉文化国情的键盘输入的汉字信息处理技术。目前,键盘输入汉字编码方案已达数百种之多,这个现象说明了汉字编码的重要性和复杂性。尤其是国内,键盘输入汉字编码技术的输入速度已超过了西文的键盘输入速度,特别是中国专利CN85104343汉字编码技术的推广应用成绩卓著,这是近十多年来汉字编码技术创造专利技术的可喜成果。但是,绝大多数汉字编码方案都以(英文)字母为键(码),且在标准键盘上字母键的位置是以方便外国人操作而排列的,不适合汉文化的国情。这就给普及使用带来了困难,也是电脑进入家庭的一个障碍,如已在国内外广为流传的汉字编码,仍然只是在那些文化程度较高的年轻人之中使用,对于中老年人或文化程度较低(特别是不懂英文)的人使用就很困难。目前与汉语拼音有关的编码方案也很多,它们的推广使用不仅存在着使用英文字母的阻碍,而且还增加了拼音的困难,因为国人的发音是极不统一的,在普通话未普及之前,不便于在全国范围内普遍使用。由于汉字编码的难度很大,使众多专利技术者不得不用较多的字母键(码)去实现编码,这是造成一般都采用26个左右的英文字母键来编码的根本原因。尽管普遍采用较多的字母键,利用达45万多个可编码空间来进行编码,仍然在性能上不尽完善,如总要取汉字末笔编码;或不依顺序取码;或词汇编码提供量较少;或GB2312-80中的682个字符没有编码,等等。以数字键来编码,码是由数字组成的,中国人接受阿拉伯数字比接受英文字母容易,数字键在键盘上的位置也是按人们的习惯排列的,可用右手单手击键,这种取数字码、击数字键输入中文的编码技术最适合中国人使用。但是,用数字码来实现输入中文,在码长为4码的条件下,只有2万余个可以编码的空间,要对GB2312-80的7445个图形字符(其中汉字6763个)和4万个词语编出一个“单手操作”“便于学习”“普遍使用”“高速输入”的码来,其编码的难度就特别大。例如用字母26键编码,约有空间26×26×26×26=456976用数字12键编码,约有空间12×12×12×12=20736456976÷20736=22从理论上计算,则12键数字编码的难度至少要比26键字母编码的难度要大22倍。这是目前以数字键编码获得成功的方案不多见的主要原因。在可编码空间很少的难度下,使数字键编码方案性能达到完善的程度,就更加困难了。虽然专利GK87104148.0,已采用数字键进行编码,其功能已达到实用的水平,已是不易的了,但在其某些性能上还不完善,如汉字取1至6个码,码较长;6个码中要求取末2码,增加了视力及脑力的消耗;词码取码较长,这些问题的存在一定程度上制约了输入速度。本专利技术的目的是为了适应汉文化的国情,为中国人能普遍使用,提供一种用数字键进行编码,且编码性能完善的,能将任一汉字、字符、词语准确高速的输入计算机、电话及类似器件的汉字信息处理技术。为实现上述目的,本专利技术对汉字根进行了分析研究,初选了300多个根,并用这300多个根对GB2312-80的汉字及字符进行全面拆分,根据每个汉字拆分数据的结果编制了计算机程序,在计算机上进行优选,依据汉字根出现的频率,挑选出了本专利技术的176个字根。又根据176个字根编制了确定每个字根的码值的计算机程序,在对汉字依笔序、字根取首1-4码的条件下,经计算,打印出给定各种不同字根码值的“重码清单”。再根据“重码清单”,以重码较少和重要汉字不能重码为原则,选定其最简的编码规则,最后比较合理的确定了本专利技术的176个字根的码值。本专利技术所指的176个字根,是由笔划根52个、主根36个、次根88个组成,其字根与对应键(码)请参见说明书附附图说明图1。本专利技术的取码规则总的来说是严格依照书写笔序、大根优先的规则对汉字及词语进行取码,其具体取码规则为(1)字码规则①依书写笔序、字根,大根优先,取首1-4码。例龙=一丿乚丿=14-4例产=亠 丿=-.4 而≠亠丷厂=-50( 与丷相比, 为大根,故第2码取 =.)②首3旁3。大于3码的‘字’或‘笔划不可分割的构件’在字首或为旁,只取3码;第4码取紧接着该‘字’或‘构件’的字根的码。例犁=禾刂 牛=0.30 (‘利’字在首,只取3码;牛=01,只取1码。)飘=西示丿×=2124(票为旁,取3码,接着取丿) ③点为5,角点为0。不论多少点连续写码为5,汉字或部件右角上的点码为0。例太=一人、=195 冬=攵 =35 煮=土白灬=58.5犬=一人、=190 厌=厂一人、=0190④在一个汉字中,取完一个构件;紧接着又是一个全同的构件,该构件只取一码。例昌=日 日=616 晶=日 日 日=6166 ⑤汉字字符中的数字,码为数字本码。例语=讠五口=-56 ⑥高频字作字根使用。例提=扌 是=166 匙=是乚丿=66-4(“是”为高频字)高频字与键的对应关系为失53 的55 是66 在12 为65 民76得-3 到18 不11 都56 很-4 长64这-- 还41 更30 应05 地45 和00 或16(2)词码规则两字词每字取首2码,四字词取前三字首码及末字首2码,三,五,六字词每字取首1码,七字以上词取前五字及末字的首码。例计算=-044计算机=-47科学技术=04170第一生产力=410-4中国人民银行=6597.4中华人民共和国=6997.5科学技术是第一生产力=041764(3)分《一、二级取码》一级取码记忆本专利技术的全部字根(共176个)对汉字、字符及词语取码。二级取码只用本专利技术的笔划根52个、主根36个(共88个)对汉字、字符及词语取码。一、二级取码的规则是完全相同的,仅是记忆字根的多少不同。一级取码可供各行各业普遍使用;二级取码以方便非专业录入员学习和使用。学过二级取码的人,可轻松的进入一级取码。本专利技术的键盘为16个键,其键位分布排列,请参见说明书附图2。图中有12个输入键123456789-0.和1个字结束键、1个词结束键、1个删除键、1个控制键,各键的位置、排列为12个数字输入键从上往下横排列为123 456 789 -0.;纵排列为147- 2580 369.,1个字结束键在12个输入键的右上侧,1个词结束键在12个输入键的左下侧,1个删除键在12个输入键的左上侧,1个控制键在12个输入键的右下侧。图中各键的主要功能为①123456789-0.为输入键。②删除键为删除输入时的错误。③控制键为汉字信息处理的转换、控制开关。本专利技术是一个完整的方案,具有明显的技术效果由于本专利技术通过分析、计算,优选了字根和字根对应的码值,提高了字根的质量,使其在编码性能完善的条件下,把码长缩短为1-4码,终于突破了“采用数字键编码制约输入速度”的难关,达到能高速输入的目的,这是本专利技术的创造性贡献。例1(与GK87104148.0比较)输=车人一“月”刂05 9 274=059274(GK87104148.0取为6码,要取末笔)输=车人一“月刂”20 9 1=2091(本专利技术取为4码,不取末笔)(注“”中的根为不本文档来自技高网...

【技术保护点】
一种汉字信息处理系统,它利用汉字编码通过键盘向计算机输入汉字信息,其特征在于:1). 选择笔划根52个、主根36个、次根88,共176个字根;2). 将上述176个字根分别指令到键盘-. 0123456789的数字键上,对应关系如下: 笔划根与键的对应关系:***主根与键的对应关系:***次根与键的对应关系:***3). 利用上述键盘的相应键位依次输入汉字信息的代码;。

【技术特征摘要】

【专利技术属性】
技术研发人员:王勤
申请(专利权)人:王勤
类型:发明
国别省市:85[中国|重庆]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1