当前位置: 首页 > 专利查询>单岩山专利>正文

一种汉字音形结合码键盘输入系统技术方案

技术编号:2860696 阅读:244 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种汉字音形结合码键盘输入系统,这种系统对不知读音的字也能输入。特别是当输入法采用大型字库时,仍能进行快速输入。本发明专利技术把字的汉语拼音第一个字母做为字音代码,用字音代码和部件代码依次组成音形结合码,这种码对应的字库是GB2312字符集;用字母“I”替代字音代码和部件代码依次组成替代码,这种码对应的字库是GB13000.1或者是GB18030字符集。本发明专利技术只采用了92个部件,易学性好;正常输入时用音形码,在使用频度为98.23%的总字量中没有重码字,重码字总量的使用频度低于0.07%,输入速度快。本发明专利技术还设有一级简码250个字,击两键一字,使用频度在47%以上,有词语5万多条,输入时不用翻页查找。

【技术实现步骤摘要】

本专利技术所提供的一种汉字音形结合码键盘输入系统,属于汉字计算机键盘输入技术。
技术介绍
目前,音形结合码是汉字键盘输入的主要方法之一,但是,这种输入方法必需得字的字音、字形都知道才能输入,只知字形就不能输入;另外,现在所有的汉字键盘输入方法,在专利技术时所采用的字库都是GB2312字符集,这个字符集只有6763个汉字,现在国家制定的GB13000.1和GB18030两个字符集的字数都在两万多个汉字以上,当现有的输入方法采用字量大的字符集做字库时,都严重的存在重码大量增加的问题,重码多就影响输入速度。
技术实现思路
本专利技术要解决的问题提供一种汉字音形结合码键盘输入系统,这种输入法对不知读音的字也能输入,特别是当输入方法采用大型字库时,仍能进行快速输入。本专利技术的技术方案是用计算机通用键盘上的26个英文字母做为汉字编码的代码,用这个键盘上的10个数字键做为输入时选择重码用。本专利技术把字的汉语拼音的第一个字母做为字音的代码,用字音代码和部件代码依次排序组成音形结合码,这种编码所对应的字库是GB2312字符集;用字母“I”替代字音代码与部件代码依次排序组成替代码,这种编码所对应的字库是GB13000.1或者是GB18030字符集。在正常输入时,用音形结合码,重码少,输入速度快,对不知读音的字或者用音形码输入没有的字用替代码输入,满足字的信息量需要。为了提高输入速度,本专利技术还设有一级简码字250个,当输入简码代码时,就有10个高频字随机显示供选择。本专利技术的有益效果是只采用了92个部件,易学性好;正常输入用音形码,在使用频度为98.23%的总字量中没有重码字,重码字总量的使用频底于0.07%,输入速度快;一级简码250个,击两键一字,使用频度在47%以上;有词语5万多条,输入时不用翻页查找;本输入法对不知读音的字也能输入,特别是当采用大型字库时,仍能进行快速输入。附图说明附图1是输入方法的健位分布图,输入方法采用的92个部件和23个汉语拼音第一个字母的代码及一个替代符字母“I”都分布在26个英文字母键上,10个数字键是选重码用。具体实施例方式对本专利技术的技术方案的优选方式,作如下描述。一、关系部件(一)笔画关系部件汉字由部件构成,部件由笔画构成,笔画在构成部件时互相之间有多种形式,有的互相衔接,如部件“厂、几、凹”等;有的互相交叉,如部件“丰、九、井”等;有的在衔接的笔画上有笔画交叉,把这种特征信息称为叉接,如部件“中、事、曲”等;还有的部件部件中的笔画不衔接,也不相交,把这种特征信息称之为可分。如“上、下、工”三字,都是由可分信息构成;有的在一个部件中有交叉(或叉接)、衔接、可分多种信息,如部件“甘、母、禺、内”等。把笔画在构成部件时互相之间所形成的交叉、衔接、叉接、可分等特征信息称之为笔画关系。笔画关系是部件内笔画之间相互形成的特征信息,所以笔画关系不包括部件的笔画数量、图形及笔画的置向。部件的笔画关系在组字中都是一眼就能识别出来的,也是应用汉字的人共有的背景知识,适宜用来作为汉字编码的信息。笔画关系部件是用汉字部件中的笔画衔接、交叉、叉接、可分关系等特征信息对部件进行归类,这种部件归类方法与字源理据及最终形成的平面图形无关,这种部件的特点是“定性、不定量、也不定形”,例如,把“九、丸、丰、井”等部件归为一个类型,在这一归类中,虽然部件与部件之间的交叉点的数量、笔画置向、笔画数量及最终形成的平面图形不一样,但是部件的笔画关系只有交叉这个共性却是汉字自身的属性,不是人工行为,用汉字的自身笔画关系属性对汉字部件进行归类是合理的,笔画关系部件在表1中列出表1 (二)层面并列关系部件汉字的部件有的只有一个笔画构成,有的有两个或两个以上笔画构成,把由两个或两个以上笔画构成的部件也称为笔画结构块,一个笔画结构块可以是本输入方法定义的一个部件或几个部件构成。在字的结构某一个层面上(包括偏旁的某一个层面上),或在框中,如果只有三个笔画结构块构成,它们的关系又是互相并列,笔画结构块之间又有明显的间隙,把这种层面上的三个笔画结构块整体界定为一个部件,称为层面并列关系部件,简称层面部件,层面部件是相对其它部件而言,不能独立存在。层面部件统一用字母“C”做代码。示例1、字的上部结构为层面部件爨、樊、兜、盥、嵴、懋、攀、襻、辔、璺、躞、燮、舆、亟、愆;2、字的中间结构为层面部件瘠、夔、蔸、率、燕;3、字的下部结构为层面部件蘅、赢、羸、酃、嬴、薇; 4、字的外框内是层面部件函。关系部件的主要用途是对汉字中的一些有特定笔画关系或有特定笔画结构块关系的结构部件进行归类,虽然只规定了8种形式,统计表明,这8种部件能涵盖国家标准(GF3001-1997)中规定部件总量的29.46%。在编码时,这8种部件涉及的字量,是国家标准(BG2312)规定字量总数的37%以上。二、部件及代码各种部件及代码在表2中列出表2 表2说明1、音母汉语拼音第一个字母,共23个;2、替代符用字母“I”替代音母称为替代符;3、形母汉字部件代码,共采用26个英文字母;4、部件 等同“一”,部件“亅”等同“丨”,部件“”等同“丶”;在运笔过程中,笔画方向发生折变都归折笔画,如乛、ㄥ、乚、ㄋ、 、 ;5、基础部件采用有关规范中的一些部件、检字部首称为基础部件;6、代码“A”中的基础部件 是“良、水、派、衣、豕、泰”等字字尾;7、叉接是指独体及复合叉接部件;衔接是指独体及复合衔接部件;8、下列部件形母等同贝-貝;车-車;长-長;广-廣扌- 马-馬;鸟-鳥;纟-糹;斗-鬥;龜- 9、表中三个繁体部件“飛(fēi)、龜(guī)、黽(mǐn)”的代码不能替代所对应的三个简化字“飞、龟、黾。”三、部件排序及界定(一)部件排序按笔画排序时,遵照“现代汉语通用字笔顺规范”;按部件排序时,基本遵照“笔顺规范”,先起笔的部件排序在前。示例“国”字,按笔画排序起笔是“丨”末笔笔画是“一”;“国”字按部件排序是“囗、王、丶、”,“国”字末笔笔画虽然是“一”,但是部件“囗”,起笔在其它部件之前,所以“囗”排序在前,“丶”排序在最后。(二)部件界定1、规定的基础部件,不准按关系部件界定。如部件“扌、艹、曰、田”等只能按基础部件界定。2、部件之间按可分界定。示例“白”字,界定为“丿、曰”;“正”字,界定为“一、止”;“上”字,界定为“丨、一、一”。3、两个部件之间如果有一个可分的公用笔画,公用笔画界定给笔画数多的部件;公用笔画以外的两个部件笔画数若相同,公用笔画界定给先起笔的部件。示例“主”字,只能界定为“丶、王”,不准界定为“亠、土”;“羔”字,只能界定为“丷、王、灬”,不准界定为“、土、灬”;“兰”字,只能界定为“、二”,不准界定为“丷、三”。4、字首部件起笔所在的部件称为字首部件。如“国”字,“囗”是字首。5、次首部件紧接字首部件的起笔所在部件。如“国”字,“王”是次首;6、字尾部件按部件排序,最后一个部件称为字尾部件。如“国”字,“丶”是字尾部件。四、编码规则(一)音形字码编码规则用音母和形母组成字的编码称为音形字码。总则在编码时,独体笔画关系部件、基础部件、层面关系部件不准拆分,复合笔画关系部件参与组字时不准拆分,独立成字时按规则拆分。1、复合关系部件编码规则复合关系部件独立本文档来自技高网...

【技术保护点】
一种汉字音形结合码键盘输入系统,其特征在于:用计算机通用键盘上的26个英文做为编码的代码,用这个键盘上的10个数字键做为输入汉字时选择重码用;编码由音母和形母构成,或者由替代符和形母构成;由音母和形母构成的编码所对应的字库是GB2312字符集,用替代码与形母构成的编码所对应的字库是GB13000.1或者是GB18030字符集;音母、形母及替代符在键盘上的分布是:A、音母23个,分布在与音母相应的23个字母键上,即:A、B、C、D、E、F、G、H、J、K、L、M、N、O 、P、Q、R、S、T、W、X、Y、Z;B、形母分布在26个字母键上,即:(1)笔画部件形母5个,即:D-丶(点),H-一(横),P-丿(撇),S-丨(竖),Z-乙(折);(2)关系部件形母5个,即:C-独体叉接部件、 复合叉接部件、层面部件,F-分接部件,J.独体交叉部件,W-完全部件,X-独体衔接部件、复合衔接部件;(3)基础部件形母25个,即: ***C、替代符一个,分布在字母“I”键位上;D、利用上述键盘,字的输入方 法是:(1)复合关系部件独立成字时,用部件的音母、形母、字首部件形母、次首部件形母依次排序编码输入;(2)除复合关系部件以外的其它部件独立成字时,用部件的音母、形母.和连续用两个部件起笔笔画的形母依次排序编码输入;( 3)对部件以外的字输入时,用字的音母,字的字首,次首及字尾部件的形母依次排序编码输入,如果一个字只有两个部件构成,没有第4码;(4)对一些不知读音的字,或没有读音的部件及用音形字码输入没有的字,用替代符替代音母与形母编码输入。...

【技术特征摘要】
1.一种汉字音形结合码键盘输入系统,其特征在于用计算机通用键盘上的26个英文做为编码的代码,用这个键盘上的10个数字键做为输入汉字时选择重码用;编码由音母和形母构成,或者由替代符和形母构成;由音母和形母构成的编码所对应的字库是GB2312字符集,用替代码与形母构成的编码所对应的字库是GB13000.1或者是GB18030字符集;音母、形母及替代符在键盘上的分布是A、音母23个,分布在与音母相应的23个字母键上,即A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z;B、形母分布在26个字母键上,即(1)笔画部件形母5个,即D-丶(点),H-一(横),P-丿(撇),S-丨(竖),Z-乙(折);(2)关系部件形母5个,即C-独体叉接部件、复合叉接部件、层面部件,F-分接部件,J.独体交叉部件,W-完全部件,X-独体衔接部件、复合衔接部件;(3)基础部件形母25个,即 C、替代符一个,分布在字母“I”键...

【专利技术属性】
技术研发人员:单岩山
申请(专利权)人:单岩山
类型:发明
国别省市:89[中国|沈阳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1