一种汉字信息处理对称码字序方法技术

技术编号:3549840 阅读:370 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种根据汉字结构的对称性和非对称性规律,而建立的一种汉字信息处理对称码字序方法。根据汉字结构对称性和非对称性规律,所有的汉字都可以被包容在这十类中:独体、包围、上对称、下对称、上下非对称、左对称、右对称、左右对称、左右非对称、中心对称。该汉字对称码定序法可以解决户籍管理、人事档案、金融、保险、医疗、民航、交通等进行终端汉字处理的计算机的快速汉字输入、或者是应用数字键进行汉字输入的手机中等,同时也可以应用于各种辞书、字典进行的汉字快速检索。使用该汉字定序法的步骤是:先按汉字结构对称分类法确定该汉字的类别,然后通过定义该汉字的笔画或拼音确定该汉字的具体位置。

【技术实现步骤摘要】

本专利技术是涉及汉字输入终端的计算机、手机的汉字输入问题及各种汉字的工具书的字序问题。
技术介绍
目前在公安部门、户籍管理、金融机构、卫生部门、邮政机构、工商管理机构、保险机构、交通部门、图书馆等单位,工作中即使其中文字库已经升级到GB18030-2000年版的标准,含汉字27484个,仍然会因各种人名、地名所出现的生僻字遭遇尴尬。如果要进一步升级到GB18030-2005年版,含汉字70195个,而新的矛盾又出现了,采用哪种汉字输入法又成了新的问题。对于要在含70195个汉字的计算机字库去查找其中的任何一个汉字,无论是使用拼音输入法,还是笔画输入法,其方法固然简单,但是其汉字的重码率极高,常常要在数百个重码汉字中进行查找;如果要使用形码输入法进行汉字输入,那就需要记忆上百个部件或字根,该输入方法也很难让使用者接受。而恰恰我们独辟蹊径的专利技术的对称码字序法,比单纯地使用汉语拼音或笔画输入法可大大减少重码率,其汉字的输入速度也会有极大的提高。另外,在各类词典、字典、辞典等,以及图书资料的索引,汉字信息的处理等都离不开对于利用汉字的字序去查找所有找的汉字。目前在汉字的字序方面有三种:“义序法”、“音序法”和“形序法”。而其中“形序法”中的“部首法”、“笔画法”在当前各类汉字的工具书中又最常使用。目前,无论是“部首法”。还是“笔画法”的汉字排检法都存在着一些不尽人意的弊端,例如:至今“部首法”仍然是我们当前各种汉字工具书(包括各种辞书、词典、辞典等)的主要查找汉字的方法。即便如此,相当多的辞书、词典、辞典等仍然有一部分汉字在确定部首的问题上不能统一,存在分歧,致使许多工具书在检字表的后面必须加以“难检字的笔画索引”,为使用人员在查阅汉字时增添了极大的困难。
技术实现思路
鉴于上述,本专利技术的目的是提供一种汉字信息处理对称码字序法,使人们在各类汉字信息处理终端的设备中以及各类辞书和词典中更方便、快捷的查找到所需求的汉字,它具有简单、易学、快捷的特点。本专利技术的目的是通过以下技术方案得以实现:无论是在汉字信息终端中、手机中还是在各类辞书和字典中查找汉字,首先依据我们在权利要求书2中所述,先确定所要查找的汉字的具体类别。如果是在计算机或着手机中进行查找,那么就要先通过在数字键所设定的类别键,再通过计算机中的汉语拼音键或者是手机中的数字键中的汉语拼音键或笔画键来进一查找和确定。如果是查找辞书或字典中的汉字,也需要先确定该汉字的具体类别,为了方便,可以将辞书或字典中的十个类别数字与手机中的十个类别数字相同。而后再通过该汉字的前两笔画和最后两笔画,或者是前三笔画和最后一笔画进一步确定该汉字在辞书或字典中的具体页码。所述汉字对称类别分为:中心结构对称类(简称“中心对”)、结构包围类(简称“包围”)、结构杂独类(简称“独体”)、上下型结构上部件自身对称类(简称“上对”)、上下型结构下部件自身对称类(简称“下对”)、上下型结构上下部件自身非对称类(简称“上下非”)、左右型结构左右部件自身对称类(简称“左右对”)、左右型结构左右部件非自身对称类(简称“左右非”)、左右型结构左部件自身对称类(简称“左对”)、左右型结构右部件自身对称类(简称“右对”)共十类。所述汉字的笔画定义为“横、竖、撇、点、折”五种。如将该五种笔画定义在计算机或者是手机的数字键中,依据“1,2,3,4,5,”的顺序排列为“1(横)、2(竖)、3(撇)、4(点)、5(折)”。如在手机键盘上的数字键设定汉语拼音字母,则:数字键2设定abc,数字键3设定def,数字键4设定ghi,数字键5设定jkl,数字键6设定mno,数字键7设定pqrs,数字键8设定tuv,数字键9设定wxyz。-->本专利技术对称码字序法的优点是:1.只要掌握汉字的对称码分类和读音,就可以将该汉字输入;2.该输入方法简单、易学,不需要记忆汉字大量的部首和字根等;3.由于对称码字序法是在输入汉语拼音之前,先将所输汉字进行了分类,所以比直接进行汉语拼音输入汉字的方法速度快,重码率低;尤其是应用在手机中时,省去了人们翻页查找汉字的繁琐过程;4.根据汉字的对称性和非对称特征,将汉字分成十类的方法符合人们认识和理解汉字的习惯,简单,易掌握。尤其是在通过计算机查找超大规模(GB18030-2005)汉字字库的汉字时,本专利技术的优势更是突出;5.由于对称码字序法不需要人们记忆数以百计的偏旁、部首,省去了人们如在辞书或字典中先查部首目录,再查检部首页码。相对比较,本专利技术的对称码字序法尤其是在辞书或字典等汉字工具书的使用上,更是突显简单、快捷。所以,对于拥有全世界四分之一人口的中国人来说。在使用汉字进行学习、生活、工作和交流等时间中,将会节省大量的宝贵的时问,无疑是一件好事、是一件举足轻重的大事。传统的汉字部首检索汉字的方法总是有数百个汉字不容易确定部首,于是在检字表的后面都会增加“难检字笔画索引”等。而本专利技术解决了查找“难检字”的问题。使用本专利技术的词典、辞典和字典等工具书查找任何汉字都不存在“难检字”。下面结合具体实例对本专利技术作出详细说明一.对汉字分类汉字是一种以方框型结构为基础的文字。从具体结构上分析,汉字大致可以分成左右型(左中右型归左右型)、上下型(上中下型归上下型)、杂体型(独体型归杂体型)和包围型(二包围、三包围和四包围一律归包围型)。根据汉字结构形状的对称性和非对称性的特点,本专利技术将汉字分成以下十类:1中心对称类(简称“中心类”),此类汉字是以假设中心线为该汉字的竖轴,左右部分、上下部分对称或相等。如:京、王、口、田、天、人、大、小、非、并、合、关、光、木、呆、平、日、干、土、北、比、羽、常、党、见、丰、川、出、克、壳、高、苗、苦、曼等。本专利技术对于一些个别的对称性的规则加以特殊的规定。即,将“彡’、“心”、“火”、“水”、“女”、“忄”、“尢”、“月”、“门”、“白”、“臼”、“大”、“小”、“人”、“八”、“几”、“九”、“不”、“儿”、“禾”、“舟”、“母”、“竹”、“穴”、“冖”、“于”、“手”、“爪”等规定为对称偏旁。根据本专利技术的规定,下列字也属于中心对称类,如:黑、杰、芯、荧、安、案、悲、悉、恩、志、秃、萎、泉、兜、寒、黍、宄、巢、党、堂、霄等。根据“品”和“吕”字型的中心对称性的特点,下列汉字也属于中心对称类。如:焱、爽、犇、淼、森、众、垒、矗、鑫、鱻、毳、曼、多、哥、昌等。下列较为特殊的汉字也属于中心对称字,如:冀、翌、巽、翠、叠、州、粥、弼、蠢、昆等。...

【技术保护点】
一种可以应用于户籍管理、人事档案、金融、保险、医疗、民航、交通等进行终端汉字处理的计算机中、或者是应用数字键进行汉字输入的手机中等,同时也可以在各种辞书、词典和字典的汉字检索中使用的汉字信息处理对称码字序方法,其特征在于:    该对称码字序法是根据汉字结构的对称性和非对称性规律而建立的汉字字序方法。    根据汉字结构的对称性和非对称性,无论是计算机、手机、税控发票机、字典、辞典等工具书中所包含的汉字,都可以利用汉字结构本身的对称性和非对称性规律被分成十类。在确定了要处理的汉字属于哪一类的汉字之后,再去通过该汉字的汉语拼音、或者是笔画顺序去查找该汉字。

【技术特征摘要】
1. 一种可以应用于户籍管理、人事档案、金融、保险、医疗、民航、交通等进行终端汉
字处理的计算机中、或者是应用数字键进行汉字输入的手机中等,同时也可以在各种辞书、
词典和字典的汉字检索中使用的汉字信息处理对称码字序方法,其特征在于:
该对称码字序法是根据汉字结构的对称性和非对称性规律而建立的汉字字序方法。
根据汉字结构的对称性和非对称性,无论是计算机、手机、税控发票机、字典、辞典等
工具书中所包含的汉字,都可以利用汉字结构本身的对称性和非对称性规律被分成十类。在
确定了要处理的汉字属于哪一类的汉字之后,再去通过该汉字的汉语拼音、或者是笔画顺序
去查找该汉字。
2. 如权利要求1所述的汉字对称码字序方法,其特征在于:
所述汉字对称类别分为:中心结构对称类(简称“中心对”)、结构包围类(简称“包围”)、
结构杂独类(简称“独体”)、上下型结构上部件自身...

【专利技术属性】
技术研发人员:王子善王淑兰王颖
申请(专利权)人:北京善庐汉字对称码应用技术开发有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1