当前位置: 首页 > 专利查询>何肇光专利>正文

字典检字编码输入法及其中西文兼容键盘制造技术

技术编号:2891821 阅读:258 留言:0更新日期:2012-04-11 18:40
字典检字编码输入法,以《汉语拼音方案》规定的21个声母、35个韵母和186-201个字典检字部首作为汉字编码特征信息元,各部首以其读音或名称的读音的拼音首字母被指定到国际通用小键盘的26个英文字母键上,以与指定部首相同的原则在上述键盘上指定各声母,在上述键盘上同时还指定各韵母,按“声母”、“韵母”和“部首”或“部首”、“声母”和“韵母”或“部首”、“部首外首笔画”和“声母”的顺序击三键输入一汉字。本发明专利技术的输入方法易学、易记、快速和符合现代汉语使用规范。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字的计算机输入方法及其中西文兼容键盘。键盘输入是当前汉字进入计算机的主流方法。自七十年代末、八十年代初支秉彝、张其、钱伟长、郑易里等教授开创性地从理论和实践形成了汉字键盘输入技术这一学术分支以来,出现了数以百计的编码方案和上机运行的输入软件。八十年代的汉字编码方案以汉字的特征信息编码作为向计算机输入外部码,通过软件的查表检索形成汉字计算机内部码。这种简单的转换方式是与当时的微型计算机硬件环境(8086和8088CPU,512KBRAM,10~20MB硬盘,512KM软盘)和软件技术相适应的“字编码转换”相适应。为了减少重码达到快速输入的目的,往往以牺牲易学、易记、易用为代价,将汉字拆分为字根进行编码是这一类输入法的代表。这一类编码输入解决了专职操作员的快速录入,却很难在一般计算机用户中推广。八十年代末、九十年代初微型机硬件环境(80386以上CPU,1BM以上RAM,100MB以上硬盘)和软件技术的发展,将汉字键盘输入技术推向“字为基础,词为主导,智能处理”的阶段。现代汉语两字以上词的编码规则较字编码简单,智能处理的主要内容是由软件通过上下文关系自动识别重码字、词。在此背景下,为在我国普及计算机应用,迫切需要设计出与当前计算机技术相适应的汉字计算机输入方法及中西文兼容键盘,这种输入方法与键盘应基于易学、易记、快速和符合现代汉语使用规范。本了明的目的就是为了克服已有技术的上述不足而提供一种具有上一段所述优点的汉字计算机输入方法及其中西文兼容键盘,称之为字典检字编码输入法。字典检字编码输入法及其中西文兼容键盘以《汉语拼音方案》规定的21个声母、35个韵母和186~201个字典检字部首为编码特征信息元,部首部分以其读音或名称的读音的拼音首字母分配到26个英文字母键上。其中需要记忆的部首不足部首总数的3%,符合国家标准《通用键盘汉字编码输入方法评测规范》(GB14159-93)7.1.4条易学性款“码元和键位易记”的要求。字典检字编码输入法及其中西文兼容键盘以我国现代汉字字典的拼音检字与部首检字两种检字方法为背景对汉字和词语进行编码,对使用者的知识要求是会查字典,与我国现行小学语文教学大纲的要求一致,符合GB14159-93中7.1.4“需要增加的知识和强记的规定少”的要求。字典检字编码输入法及其中西文兼容键盘的字编码式为码式(1)<汉字>∷=<声母><韵母><部首>码式(2)<汉字>∷=<部首><声母><韵母>码式(3)<汉字>∷=<部首><首笔画><声母>编码的“部首”采用国家语言文字工作委员会推荐使用的201部首,在为GB2312-80字符集编码时只有其子集186部首,符合GB14159-93的7.1.2条规范化程度“引用国家有关语言文字和中文信息处理方面的规范和标准”的要求。字典检字编码输入法及其中西文兼容键盘以26个字母键作汉语文字信息输入,符号键作中文标点符号输入,数字键作中西文数字符号输入,符合GB14159-93中7.1.3条软硬件兼容款“采用的软硬件与国内现行主流计算机软、硬件系统的兼容程度及可移植性”的要求。近年来上海交通大学、北京航空航天大学经多年研究,得出现代汉语中汉字的熵值为9.71bit,汉语词的熵值为11.46bit。由此我们从理论和实践得到如下结论确定一个汉字的编码信息应少于词的编码信息,以减少使用者的字编码负担。在以26个键位作为编码键元的条件下,“字三键、词四键”的码式较“字四键、词四键”更为合理。根据著名工程心理学家海曼提出的已为大量实验所证实的键元选择时间为t=a+blnN N键元的数量由此可见编码键元多的键盘在输入操作时选键时间长,影响输入速度。已往不少汉字输入方法及其键盘采用超过26个键元的编码方法来达到减少重码和缩短码长的效果。这种方法至少存在两个主要缺点(1)削弱了中西文兼容性或带来操作上的不便;(2)选键时间长,也增加使用者的疲劳程度。选用26个字母键使重码率、码长、选键时间和操作方便等相互矛盾的要求达到最佳平衡。将汉字拆分成字根进行编码,规则复杂,拆分的歧义难以克服,使用者在输入过程中脑力负担很重。字典检字编码法及其中西文兼容键盘的“部首”既为查字典的部首,不是构字部件-字根。“部首”是编字典时将汉字按义归部的首字,用部首编码不必对汉字进行拆分,查字典时这个字归哪个部首就输入哪个部首的代码。如“盼”的部首为“目”,输入代码M;“菜”的部首为“艹”,输入代码C;“故”的部首为“文”,输入代码W;“想”的部首为“心”,输入代码X。上述四个字的完整编码为盼 菜 故 想码式1 PJM CLC GUW XDX码式2 MPJ CCL WGU XXD码式3 MPP CPC WHG XHX字典检字编码法及其中西文兼容键盘的汉语拼音的输入采用双拼式压缩输入,适用于任何一种双拼键位的分布方案。综上所述字典检字编码法及其中西文兼容键盘在易学性、易用性(脑力负担)、规范化、重码率、字词平均码长和键盘的中西文兼容性等综合平衡方面取得了有别于已有技术的显著进步并具有突出实质性特点。以下参看附图详细描述本专利技术。附图说明图1为本专利技术所用的部首与在国际通用小键盘上的26个英文字母之间的对应关系。本专利技术对汉字进行编码所用的特征信息元之一的部首在以下的表1中全部列出。如上所述,由于在为GB2312-80字符集编码时,只有国家语言文字工作委员会推荐使用的201部首的子集-186部首,所以在表1中只列出了186个部首。表1中的第一列到第四列分别为部首的编号、部首、名称和在键盘上的对应键。 表1的内容在附图1中得到概括,如图1所示,上述186个部首与国际通用小键盘上的26个英文字母建立了一一对应关系,如上所示,这种对应关系是通过将部首以其读音或名称的读音的拼音首字母分配到26个英文字母键上。本专利技术对汉字进行编码所用的特征信息元之一的汉语拼音声母和韵母与键盘的对应关系分别如以下表2和表3所示,在表2和表3中分别以“声母(或韵母)”和、“对应键”和“同音字”的顺序分若干列给出声母和韵母与26个英文字母的对应关系,汉语拼音的输入采用双拼压缩输入,有关这些内容的详细描述请参看中国专利94115440.8。 在如上所述确定了汉字进行编码的特征信息元-部首和声韵母与键盘的对应关系后,就可对汉字进行计算机输入。单个汉字的输入为三键输入一个汉字,第一键为字的读音声母,第二键为字的读音韵母,第三键为该字归类的部首。根据用户的不同习惯,也可以第一键输入部首,第二键输入声母,第三键输入韵母,或第一键输入部首,第二键输入部首外的首笔画,第三键输入声母。在本专利技术中,输入汉语时以词语输入为主导,两字以上词语输入均为4键双字词输入取组成该词的两个字前两码,即声1韵1声2韵2或部首1声1部首2声2或本文档来自技高网...

【技术保护点】
字典检字编码输入法,其特征在于以《汉语拼音方案》规定的21个声母、35个韵母和186-201个字典检字部首作为汉字编码特征信息元,各部首以其读音或名称的读音的拼音首字母被指定到国际通用小键盘的26个英文字母键上,以与指定部首相同的原则在上述键盘上指定各声母,在上述键盘上同时还指定各韵母,顺序击三键输入一个汉字,第一键为该字的读音声母,第二键为该字的读音韵母,第三键为该字归类的部首,上述击键顺序也可以是第一键击入部首,第二键和第三键分别输入声母和韵母或者第一键输入部首,第二键输入部首外的首笔画,第三键输入声母。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈民何肇光赵辉
申请(专利权)人:何肇光赵辉陈民
类型:发明
国别省市:11[中国|北京]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1