汉字四笔画数码查字法是一种把汉字查字法和计算机汉字编码法合二为一的新型汉字查字法,它利用组成一个汉字的横、竖、曲、折四种笔画的数目编制而成的汉字四笔画数码来查字,代码形式为等长4位十进制数,编码方法十分简单,编码时不需记忆和运用任何形-符、音-符转换关系,一般人对笔画数较少的常用汉字不难做到见字得码,对笔画数较多的繁难汉字可采用运算方法来编码,此码还可用来查找其它汉字代码及用来做汉字辅助输入码或输入码使用。(*该技术在2013年保护过期,可自由使用*)
【技术实现步骤摘要】
【国外来华专利技术】汉字四笔画数码查字法是一种把汉字查字法和计算机汉字编码法合二为一的新型汉字的查字法,它利用组成一个汉字的横、竖、曲、折四种笔画的数目编制而成的汉字四笔画数码来查字,代码形式为等长4位十进制数,编码方法十分简单,编码时不需记忆和运用任何形-符、音-符转换关系,一般人对笔画数较少的常用汉字不难做到见字得码,对笔画数较多的繁难汉字可采用运算方法来编码,此码还可用来查找其它汉字代码及用来做汉字辅助输入码或输入码使用。如所周知,除了区位码和电报码这二种与汉字特征无直接联系的汉字序号码之外,目前已经出现的各种汉字检索码和汉字输入码都是利用汉字的某些形、音、义特征来进行编码的,但在对汉字字形特征的利用方面,一般都只利用了汉字的笔画、部件(字元、字根、构件)和整字这三个层次的形状特征,还有一个隐含着的字形特征-构成汉字的各种类型笔画的数量特征至今还未被人们利用来对汉字进行编码。人们都知道,构成一个汉字的笔画数是固定不变的,而且都会利用汉字的部首、部件或整字的笔画数来对汉字进行检索(查字),这点是人们非常熟悉的,但对构成一个汉字的各种类型的笔画的数目也是固定不变的这一点却并未引起人们的注意,更未认识到它的价值,能否利用汉字分类笔画数这个隐含着的汉字字形特征来对汉字进行编码呢?这是一个很有趣的很值得人们深入进行探索的课题。本专利的目的是研究和尝试解决这个问题,探索利用汉字分类笔画数特征对汉字进行分类、编码和检索的可能性和具体方法,提供一个十分简单易学的汉字四笔画数码的编码方案供人们检索汉字和其它汉字代码使用,并指出这种码虽然编码速度比较慢,但由于它肯定能够编得出来,因此可供人们用它作辅助输入码使用,输入一些用其它方法一时无法输入的汉字(如采用拼音输入法时,遇到不知其发音或不知其汉语拼音拼写方法的汉字时便可用此法),对于不懂汉语拼音又不愿学习其它输入方法的人,在没有方法可以输入汉字的情况下,如有兴趣,也可利用它来作输入码使用。下面,为了引起本文读者对此查字方法的兴趣和初步体验一下这种代码的易学性和编码方法,在我们正式介绍这种代码的编码方案之前,我们请读者立即自己来试编几个字的四笔画数码。首先,请读者来编一个“生”字的四笔画数码,请你将它的横、竖、撇、折这四种笔画的数目计算出来,是3、1、1、0吗?如是,则“生”字的四笔画数码即3110;其次,请读者来编一个“盒”字的四笔画数码,请你将它的横、竖、撇和捺、折这四类笔画的数目计算出来,是3、4、2、2吗?如是,则“盒”字的四笔画数码即3422;最后,再请读者来编一个“数”字的四笔画数码,请你将它的横、竖、撇(包括捺和点)、折这四类笔画的数目计算出来,是3、1、8、1吗?如是,则“数”字的四笔画数码即3181。从以上试编中,读者可能已经大致明白了四笔画数码的编码方法,为了检验一下读者理解和掌握的程度,我们现在出个小题目来考考读者,请读者用笔将本专利题目“汉字四笔画数码查字法”这10个字的四笔画数码编出来写在纸上,然后和本段末尾那行代码相对照,看看是否相同,如全部或大部分相同,说明你已经基本上学会了本代码的编码方法,用此法,你已经有可能独立地将任意一个汉字的四笔画数码编制出来了! 0041112211124051330231813113422111222141下面,我们来系统地介绍一下汉字四笔画数码的编码方案。汉字是由若干种基本笔画组成的,按照《印刷通用汉字字形表》的划分方法,汉字的笔画一共有33种,本编码方案为了使编码时更容易对笔画进行分类,将其中的提(挑)笔按下述三种情况再分为3种(1)横提笔与水平线夹角小于45°角的较平提笔,如孑、刁、习、匀、虫、或、禺、卸、邶、戥等字和工、土、扌、王、纟、立、牜、车、耳、豆、、马、鱼等部首中的提笔;(2)尖提笔二点水冫和三点水氵部首中的提笔;(3)点提笔和其它点笔一起出现的较短提笔,如兆、水、求、隶、羽、丬、疒等字和部件中的提笔。本方案为了企求得到4位十进制数字形式的代码,将以上35种笔画分为横、竖、曲、折四大类,如表一所示,分类方法如下1.横画类包括横笔和 横提笔;2.竖画类包括竖笔和 竖钩笔;3.曲画类包括全部撇 笔、捺笔和点笔及尖提 笔和点提笔;4.折画类包括除竖钩 笔之外的全部带折笔画。将第3类笔画称为曲画的原因是该类笔画均具有弯曲的形状。本方案根据构成一个汉字的上述四种类型的笔画的数目来进行编码,故将代码称为四笔画数码(可简称为四笔数码或笔数码),它的一般形式为Y4Y3Y2Y1,其中Yi(i=1~4)的取值范围为0~9,编码法则十分简单,仅以下二条1.当各类笔画数<10时,Y4的值等于横画的数目;Y3的值等于竖画的数目;Y2的值等于曲画的数目;Y1的值等于折画的数目。例如“书”字,横画0、竖画1、曲画1、折画2,故其四笔画数码为0112;“笔”字,横画4、竖画0、曲画5、折画1,故其四笔画数码为4051;“张”字,横画2、竖画0、曲画2、折画3,故其四笔画数码为2023。2.当某类笔画数≥10时,采用进位方式来编码,将进位数加到后一码位数上去,Y4的进位数则予以舍弃。例如“鼷”字,横画4、竖画1、曲画12、折画6,故其四笔数码为4226;“疆”字,横画10、竖画5、曲画0、折画4,故其四笔画数码为0504。四笔画数码的编码方法不仅可用来对全部国标一、二级汉字进行编码,也可以用来对部首和部件(字元、字根、构件)及某些标点、运算、单位等图形符号及繁异体汉字进行编码,方法相同,因而可以混用,只是在对标点和其它图形符号进行编码时,需对笔画的分类附加一些规定,这里我们不作详述。四笔画数码有一个重要和有用的性质,即一个字的四笔画数码等于组成该字的各个部件的四笔画数码之和,利用这一性质,可以由部件的四笔画数码通过加、减、乘、除(主要是加和乘)等简单四则运算来求繁难汉字的四笔画数码。例如“理”字由“王”、“里”二部件组成,“王”、“里”的四笔画数码为3100和4201,则“理”字的四笔画数码=3100+4201=7301;“森”字由3个“木”部件组成,“木”的四笔画数码为1120,则“森”字的四笔画数码=1120×3=3360;“飚”字由3个“火”和一个“风”部件组成,“火”和“风”的四笔画的数码为0040和0031,则“飚”字的四笔画数码=0040×3+0031=0120+0031=0151。利用上述方法对汉字进行编码,必然会出现重码,笔者对全部6763个一、二级汉字进行了编码,所得重码情况如下在总共10000个代码中,有字代码有1671个,代码值最小的有字代码为0001(“乙”字),代码值最大的有字代码为9833(“罐”字),其中无重码字代码有686个,占有字代码总数1671的大约41%,重码字数在10个以下的代码(包括无重码字代码)一共有1511个,占有字代码总数1671个的大约90%,重码字数在11~20个的代码有126个,约占有字代码总数1671的7.5%,重码字数在21~30个的代码有33个,重码字数在31个以上的代码只有1个,此代码为2142,它有34个重码字。四笔画数码的重码字虽然仍然偏多,但作为检索码使用,比部首检索要好得多,和汉语拼音检索相比情形也要好一些。为了进一步的提高检字速度,在本方案中,重码本文档来自技高网...
【技术保护点】
一种新型汉字四笔画数码查字法,其特征是:a.这种汉字四笔画数码查字法利用组成一个汉字的横、竖、曲、折四种笔画的数目编制而成的汉字四笔画数码来查字,代码形式为等长4位十位制数,一般形式为Y↓[4]Y↓[3]Y↓[2]Y↓[1],其中Yi(i=1~4)的取值范围为0~9;b.汉字四笔画数码编码方案将汉字笔画分为横、竖、曲、折四大类的分类方法如下:①横画类包括横笔和横提笔,横提笔指的是与水平线夹角小于45°角的较平提笔,如孑、刁、习、匀、虫、或、禺、卸、邶、戥等字和工、*、扌、*、纟、*、*、车、耳、豆、*、马、鱼等部首中的提笔;②竖画类包括竖笔和竖钩笔;③曲画类包括全部撇笔、捺笔和点笔及尖提笔(二点水冫和三点水氵部首中的提笔)和点提笔(和其它点笔一起出现的较短提笔,如兆、水、求、隶、羽、丬、疒等字和部件中的提笔);④折画类包括除竖钩笔之外的全部带折笔画;c.汉字四笔画数码编码法则为:(1)当各类笔画数<10时,Y↓[4]的值等于横画的数目;Y↓[3]的值等于竖画的数目;Y↓[2]的值等于曲画的数目;Y↓[1]的值等于折画的数目。(2)当某类笔画数≥10时,采用进位方式来编码,将进位数加到后一码位数上去,Y↓[4]的进位数则予以舍弃;d.汉字四笔画数码有一个重要和有用的性质,即一个字的四笔画数码等于组成该字的各个部件的四笔画数码之和,利用这一性质,可以由部件的四笔画数码通过加、减、乘、除(主要是加和乘)等简单四则运算来求繁难汉字的四笔画数码;。...
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:林宇威,
申请(专利权)人:林宇威,
类型:发明
国别省市:81[中国|广州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。