一种七笔声形输入法,是一种二维双笔形码与音码相结合的汉字输入法。它确立横、竖、撇、点、折、钩、方7种笔形,从它们的组合笔形中筛选出26种作为码元。再挑选26个与形码元有联系的代表字,将各形码元和代表字分别配予26个拉丁字母作为代码。按所给编码规则,每字至多取3个形码和1个音码。设立音码在前或在后两种取码方式,针对不同用户可在通用机上操作。限制性因素少,适应范围广、成本低、重码率低、击键次数少,应用广。(*该技术在2011年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及一种七笔声形输入法,特别涉及到一种二维双笔形码与音码相结合的汉字输入法。目前,国内外汉字键盘输入法已有数百种。陈一文先生在《中国大陆、台、港及海外开发汉字键盘输入法的目前水平和发展趋势》(见《中文信息》1990年3期)一文中评介了一些先进的新型二维双笔汉字输入法,特别较详细地介绍了北京联合大学石啸生副教授专利技术的《二维三码》。同其它汉字输入法相比,二维三码具有明显的优势,可惜它的码元超过26个,利用了“,”键和“。”键作为编码用键,且无法兼顾高频汉字以及键的使用频率,以提高输入速度。能不能给出一种见字识码的汉字输入法,码元只有26个,它能充分利用汉字固有的形、音、义信息,限制因素少,适应性广,易于普及,重码率低,使用者易学、易记,只要会查字典,就会在通用计算机上输入汉字。为了实现上述目标,本人另辟蹊径,专利技术了《七笔声型输入法》。简要地说,本专利技术确定横(包括提)、竖、撇、点(包括捺)、折(除竖钩外,包括所有带转折的笔划)、钩(指竖钩)、方(四边整齐的方形)7种基本笔形,用它们在可以组成49种组合笔形,从中筛选出8种有序组合笔形和17种无序组合笔形作形码元。另外规定方笔形“口”为特殊形码元。再挑选26个与形码元有联系的常用字为代表字,将各形码元和各代表字分别配予26个拉丁字母作代码(见表1)。对于独体字,依据一般的笔顺习惯取形码,同时取该字拼音的声母或首字母作音码;对于合体字,则按其为上下结构、左右结构、外内结构或半包围结构切分成偏旁后取形码,且同样取音码。并设立音码在前或在后两种取码方式。七笔声形输入法具有以下优点1)它充分考虑汉字的笔形、笔顺、部首和拼音等信息,近字性较好。2)它只利用26个拉丁字母作码元(编码用键),可在通用计算机上操作,每个汉字、词的最大码长为4,重码率低。3)它考虑到汉字的使用度,尽量兼顾高频汉字,还考虑到键的使用频率,揿键的难易程度,尽量使常用代码与常用键对应,以提高输入速度。4)它注意到普通使用者的实际水平,无需死记字根部首和编码规则;编码规则易学易记且易于普及,只要会查字典,就会在通用计算机上输入汉字。5)它限制性因素少,适应范围广,简体字和繁体字均可输入,无需专门培训,成本低,击键次数少,应用广泛。6)它可以用英、俄、德、法、意、拉丁、国标音标等作代码,同相应的外文键盘配合,使海外学习和使用汉语的人也会输入和检索汉字。七笔声型输入法能广泛应用于通用小键盘计算机和各种汉字工具书,使电脑、辞书、资料、电信四者编码一致。对杜冰蟾于1990年6月13日发表的题为《汉字全息码》的中国专利公开号CN1043016A上所述及的各种应用,本专利技术都能实现。具体地说,它也可以应用于以下10个方面1、中文电脑打字、编辑、排版;2、电报码与电传码统一于拉丁化字母,可由机器自动译为中文;3、全国邮政编码;4、中外文机器助译;5、古汉语与白话文机器助译;6、速记;7、缩写;8、图书编目、辞书索引用七笔声形编码;9、速抄、缩录;10、医药自我咨询,农林牧副渔工商财文军政各行各业管理咨询。下面将详细介绍七笔声形输入法。一、汉字的笔形、笔顺、笔画汉字的笔形通常指汉字的笔划形状。汉字的笔形有30多种,一般把它们归并为横、竖、撇、点、捺、提、折、钩8种,俗称“永”字八种笔形。还可以把它们压缩成横、竖、撇、点、折五种,俗称“丙”字五种笔形;其中,横笔包含横和提,点笔包含点和捺,折笔包含所有带转折或带钩的笔划。为了编码的需要,现在确立横、竖、撇、点、折、钩、方7种“笔形”;其中,横、竖、撇、点的含义与“丙”字五种笔形中的相同,折笔不包含竖钩,将竖钩设定为钩笔;方笔是四边整齐的方形,即通常意义下的复笔“口”。本专利技术设定“口”为一种特殊基本“笔形”,把它看作单笔“0”的拓扑变形,所以“口”作为特殊基本笔形时应视为单笔。这7种笔形正好包含在汉字“咧”中,权且称为“咧”字七种笔形。汉字笔顺通常指写字时下笔的先后顺序。这里,汉字的笔顺仍遵循人们在长期的书写实践中已形成的一套约定俗成的规则先左后右,先上后下,先中间后两旁,交叉的笔划先横、撇(包括折笔的横、撇部分)后其它。但是有些汉字的书写顺序因人而异,为了划一起见,在下述表1中,通过举例明确了一些汉字头两笔所采用的笔形和笔顺。其余汉字或偏旁头两笔的笔划和笔顺可据此类推。在本专利技术中,“口”视为单笔,“口”在某个字中的笔顺取其首笔,即竖笔在该字中的笔顺。汉字笔画通常指构成一个汉字的笔形数量。当某个汉字含方笔“口”时,本专利技术所说的笔画数与通常意义下的笔画数是有区别的。例如,“咧”字在通常意义下是9画,在本专利技术中它是7画。二、汉字的形码和音码本专利技术所确立的汉字编码和检索方案是采用二维双笔形码与音码相结合的汉字输入法和检索法。前面所述及的横、竖、撇、点、折、钩、方7种基本笔形可以构成49种组合笔形。根据这些组合笔形在汉字中出现的频率,舍弃其中那些用不着或很少用到的组合笔形,从中筛选出4对有序组合笔形和17种无序组合笔形作为形码元,另外规定笔形“口”为特殊形码元。考虑到这些码元在汉字中出现的频率以及码元用键的使用频率(以提高键入速度),也兼顾高频汉字头两笔构成的码元(首形码元)与该字的拼音首字母(约定用I、U、V分别取代双声母ch、sh、zh)的对应关系,用25个拉丁字母分别表示25个形码元和25个常用字,且使代码(字母)、码元、代表字首码及其拼音首字母相一致。另外设定字母O表示特殊形码元“口”以及代表字“呕”。为了突出有序形码,在其对应代码上冠以箭头“→”。见表1。把表1换一种表述方式,写成表2,帮助使用者通过联想记住码元、代表字和代码的对应关系。为了简化叙述,分别把组合笔形“一一”、“丨丨”、“丿丿”、“丶丶”、“一一”、叫做单笔“一”“丨”、“丿”、“丶”、“一”的相应双笔形。汉字是音节符号,一个汉字表示一个音节,但汉字的字数多,音节少,许多不同形体的汉字属于同一种读音,这就是同音字,如,“科”、“棵”这两个字都读“kē”,“油票”和“邮票”这两个词都读“yóu piào”。对于有些同音的字或词,只有书写出来才能把它们区别开来。汉语有同音字,也有多音字。同一个汉字依据语言环境的差异表现出不同的字义、因而具有几种读音。如“差”有cha(差别)、chà(差不多)、chai(出差)、ci(参差)四个读音。因此,汉字的字形和读音都是汉字的重要信息。在考虑汉字字形信息的同时,也考虑汉字的语音信息是合适的,它还有离散重码的作用。但是有许多人往往不能完整准确地读出或写出每个汉字的拼音,所以,在取汉字形码的同时,只取每个汉字音节的声母或首字母作音码。同样约定双声母ch、sh、zh分别用I、U、V取代。这样,26个字母不仅表示26个形码和26个代表字,它们还表示汉字拼音首字母。三、独体字和合体字许多文章和书都提到独体字与合体字,但大多未作严格的界说,或者解释不完全相同,有些字究竟是独体字还是合体字,看法不一。例如,孙钧锡先生在《汉字和汉字规范化》一书中,把“天、丕、引、旧、卞、币、丢、氕”等字都视为合本字,但在《汉字信息字典》中则把它们看作独体字。因为七笔声形输入法对于独体字和合体字有不同的取码规则,需要明确区分。独体字是直接由笔划构成的相交组合形式,或者在通常意本文档来自技高网...
【技术保护点】
一种七笔声形输入法是一种二维双笔形码与音码相结合的汉字输入法,其特点在于a)确立横、竖、撇、点、折、钩、方7种笔形;b)从它们的组合笔形中筛选出26个形码元;c)挑选了26个与形码元有联系的代表字(见表1);d)取每个汉字拼音的声母或首字母作音码;e)26个拉丁字母既表示26个形码元和26个代表字,也表示汉字拼音首字母(双声母ch、sh、zh用I、U、V取代);f)将未选入26个形码元中的少见组合笔形归并到该组合的第一笔或第二笔的相应双笔形或笔形“口”中。
【技术特征摘要】
【专利技术属性】
技术研发人员:杨奇,
申请(专利权)人:杨奇,
类型:发明
国别省市:12[中国|天津]