当前位置: 首页 > 专利查询>郑远泾专利>正文

层次解析法汉字基本部件及其码元设置和编码输入法制造技术

技术编号:3576445 阅读:253 留言:0更新日期:2012-04-11 18:40
层次解析法汉字基本部件及其码元设置和编码输入法”的特征:用“层次解析法”解析GB13000.1字符集的汉字,解析出8种基本笔画和431个基本部件;全部基本部件由顺序连续书写的两笔画或两笔画以上的或接或交或连或包、具有构字能力的笔画集合,“囗、匚、”除外;对全部基本部件命名;无名称的非成字基本部件用“描述法”、“借代法”、“归纳法”命名;基本部件名称的首字为其简称;简称的拼音首字母为基本部件的字母码元;根据字母码元--a~z 26个字母排列在手机、座机、机顶盒数字键的位置(数字)和在该键上排列的顺序数字,两个数字的组合为基本部件的数字码元;设置了8种基本笔画和431个基本部件的字母键盘和数字键盘的输入方法。

【技术实现步骤摘要】

本专利技术属中文信息处理

技术介绍
-汉字基本部件在构建汉字中的作用汉字编码能否体现汉字的本质特征、能否符合中国人对汉字的认知理念、能否应用于汉 字识字教学、实现汉字输入与汉字识字教学相统一,与汉字部件、尤其是基本部件的选取、 命名、码元设置是否具有科学性、规范性和实用性密切相关。虽然,汉字编码输入己有30多年的历史了,但是,迄今为止还没有一种汉字编码实现上 述目标。其重要的原因就是,没有一个科学性、规范性和实用性相统一的汉字基本部件集。 一.汉字基本部件在构建汉字中的作用汉字是集形、音、义为一体的形音字,汉字的基本部件在构建的汉字中具有表音或表义 的作用。统计表明,在7000个现代汉语通用字中有5544个汉字是形音字,其字音是通过汉字的部 件、尤其是基本部件表征的。1. 汉字基本部件的表音作用① 成字基本部件具有表音作用,是所构建的汉字的表音部件。如常用字基本部件"乙、刀、刁、及、韦、巴、龙"构建"忆、亿、叨、叼、圾、岌、极、 级、伟、违、讳、围、把、吧、笆、疤、聋、拢、笼、昽……"等字时,起表音作用。非常用字基本部件"5、 4、冊、f"、 1、崔、堇"构建"亏、叫、纠、赵、贯、危、 栽、载、哉、裁、戴、鹤、谨、馑、瑾"等字时,起表声或表韵的表音作用。生僻字基本部件"七(hud)、曰(m60)、东(zi)、胄(yl)、叵(yi)"是"化、冒、姊、秭、 笫、殷、颐"等字的表音部件。② 多音字成字基本部件,在构建不同的汉字时起不同的表音作用。如 "隹"有"cul、 zhul、 w6i"三个字音在"锥、准、椎"字中,表征了 "zhlll"的字音; 在"唯、维,惟"字中,表征了 的字音; 在"崔"字中,表征了 "CUI"的字音。2. 汉字基本部件的表义作用①非成字基本部件在所构建的汉字中绝大多数起表义作用,是表义部件。如"才"构建"打、抖、搞、搓、拆、捣、擦、插、推、担、提……"等字时,表征了这 些字具有与"手"有关的动作属性;"廿"构建"草、菜、萝、葵、蒿、花、苇、茄、莲、茅、莓……"等字时,表征了这16些字具有草本植物属性;"韦"表征了它所构建的汉字的金属属性;"、?"表征了它所构建的汉字与"水"有关的属性。②有许多成字基本部件在所构建的汉字中也起表义作用。如成字基本部件"心、目、鬼、鱼、"构建"想、思、愁、眼、睡、眠、督、魄、魂、傀、 魔、鳌、鳖、渔、鲜、鳔、鳄、鲫……"等字时,起表义作用。非常用字基本部件"口(w6i)"在"团、园、囚、围、国、圈、囤"等字中起"围起来" 的表义作用;"^(b6)"表征了 "登"的一高一低步履形态;"〈(〈(chi^n)"表征了 "巡"的乘船或沿江而行之义;"豸(zhi)"表征了 "豹、豺、貂……"等字的动物类属性。3.有些汉字基本部件在所构建的汉字中既是表音部件、又是表义部件。如如,"4 (jiQ)"的字义是"相互纠结",它在"纠"字中,既是表音部件,又是表义部件; "鱼"在"渔"字中,既是表音部件,又是表义部件。综上所述,汉字基本部件的选取、命名、码元设置是否科学、规范、实用,是汉字基本 部件在所构建的汉字中能否起表音作用或表义作用,是汉字编码能否体现汉字的形音义结构 特征,是否符合中国人对汉字的认知理念的关键所在。二.已有的汉字基本部件集的概况迄今为止,没有检索到应用"层次解析法"对GB18030字符集的汉字解析出的基本部件 集,没有检索到对基本部件命名、设置简称、设置字母码元、数字码元以及基本部件的输入 方法的专利申请。1. 已检索到的汉字基本部件集的概况① 检索到《信息处理用GB13000.1字符集汉字部件规范》,该部件集具有650个基本部件。 但是,其基本部件没有名称,没有设置简称,没有设置基本部件的码元和输入方法;② 检索到《汉字识字教学用汉字部件规范(讨论稿)》,该部件集有560个基本部件。其基 本部件虽然有建议名称,但是,建议名称是采用"借代法"命名的,名称的奇异性大。而且, 基本部件没有设置简称,没有设置基本部件的码元和输入方法;③ 各种字典和词典具有200个部首。因其部首是用于检索汉字的,所以,有很多合体字 部首,如"支、殳、皮、示、玉、肉、羽、卤、谷、角、龟、辛、青、香、首、髟、音、鬲、 高、黄、麻、鹿、鼎、鼓、鼠、鼻……"等。但是,合体字不属于汉字基本部件之列。④ 以"五笔字型"为代表应用汉字部件的汉字编码方案, 一般具有100个 200个或称 字根或称部件或称字元的汉字部件集。2. 已有的汉字基本部件集的特征包括《信息处理用GB13000.1字符集汉字部件规范》、《汉字识字教学用汉字部件规范(讨 论稿)》在内的己有的汉字基本部集有如下共同特征① 采用汉字字源理据和汉字的结构理据解析汉字的基本部件将汉字分为上下结构、上 中下结构、左右结构、左中右结构、全包结构、半包结构、品字形结构、镶嵌结构等;② 采用汉字字源理据和汉字的结构理据解析汉字的基本部件十分复杂,而且对汉字的解 析具有多样性。如"褒、裹、亵"等字,有的专家认为是镶嵌结构的汉字,包体是"衣","褒"是由"衣、保"构成;"裹"是由"衣、果"构成;"亵"是由"衣、执"构成。有的专家则认为这些字 是上、中、下结构的汉字。"褒"是由"i、保、农"三部分构成;"裹"是由"工、果、衣" 三部分构成;"亵"是由"工、执、衣"三部分构成;"噩"字,有的专家认为是"镶嵌结构"的汉字,有的专家则认为是"特殊结构"的汉字,二者都认为"噩"字应解析为"王口口口口";"夹"字,有的专家认为是"独体字",有的专家则认为是"镶嵌结构"的汉字,"夹"字的包体是"夫","夹"字应解析为"夫v"两个基本部件。有的专家将"危"字解析成"々、厂、Q(ji6)"三个基本部件;有的专家则将"危" 字解析成"产(w6i) 、 B (ji6)"两个基本部件;③ 采用汉字字源理据或汉字结构理据解析汉字的基本部件,使基本部件在构建的汉字中 失去表音或表义作用。如认为"成、咸、或"是包体为"戈"的半包结构的汉字,贝U:"成"是"戈j 三个基 本部件的集合;"咸"是"戈〗一口"四个基本部件的集合;"或"是"戈口Z"三个基本部 件的集合。据此"城、诚、盛、晟"分别是"土戈j n"、 "i戈j T"、"戈J n皿"、"日戈j 丁'四个 基本部件的集合;"减、碱、喊、感"分别是'7戈j 一口";"石戈J 一口"、 "口戈j 一口"、"戈J 一口 心"五个基本部件的集合;"域、惑"分别是"土戈/口"、"戈Z口心"四个基本部件的集合。 这种对汉字的强行拆分不仅违反了汉字的书写规范,也使"或、成、咸"在所构建的汉 字中失去了表音或表义作用。不符合用户对"或、成、咸"所构建的汉字的认知理念,不利 于汉字的识字教学。④ 依据汉字字源理据和汉字结构理据对汉字进行构字拆分,严重地违背了《现代汉语通 用字笔顺规范》。是构字拆分方法难以应用于汉字识字教学的重要原因之一。3.已有的汉字基本部件集的命名特征研究表明,已有的汉字基本部件集对汉字基本部件的命名采用的几乎都是"借代法"。即 借用基本部件构建的某个汉字、再根据其在该汉字中的位置,命名为"X字旁"或"X字边"18或"x字头"或"x字底"或"x字角"或"x字里"或"x字框"等等。这本文档来自技高网...

【技术保护点】
层次解析法汉字基本部件及其码元设置和编码输入法的创新性特征在于: 1.建立了汉字部件的解析方法与汉字书写的一致性应用“书写层次解析法”(简称为“层次解析法”)解析GB18030字符集的汉字,解析出汉字的8种基本笔画和431个基本部件:  1)8种基本笔画是: *** 2)431个基本部件是: *** 3)基本笔画部件分为“横、竖、勾、撇、点、捺、折、复折”8种; 4)307个成字基本部件是按顺序连续书写而成的或交或连或接或包、具有构字能 力的成字; 5)124个非成字基本部件是按顺序连续书写的两笔画或两笔画以上的、具有构字能力的非成字的笔画组合; 6)部分具有表义功能的合体字为成字基本部件;。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑远泾
申请(专利权)人:郑远泾王兰芝
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1