“汉语拼音语素定型方案”是一种用于中文信息处理技术方案。该方案解决了同音汉字在“拼音书写文本”中和电脑处理上的区分问题,实现了汉字无需编码输入及“两种文本”在电脑上转换的需要。该方案以《汉语拼音方案》为基础,在每个拼音音节后面加上“声调兼表类义”的大写字母使音节定型成为拼音表义语素。汉字按语素意义归类,分为名素类、形素类、动素类。名素类再分“人域”小类,“生物”小类,“资源”小类,“资料”小类。拼音语素“四小类”的代表字母分别为:B、P、M、F;D、T、N、L;G、K、H、W;J、Q、X、Y。形素、动素类的代表字母分别为:Z、C、S、R;A、O、E、V。上述24个大写字母,再兼作区分同音语素字母,这样,7千个通用汉字里的同音字彻底区分开了。用途:出版汉字注音兼注义的和“汉语拼音语素式书写”文本的一切汉语读物并用于电脑中文信息处理等。
【技术实现步骤摘要】
一种用于中文信息处理技术的"汉语拼音语素定型方案"。
技术介绍
周有光先师的比较文字学研究证实了世界文字发展存在一条由表 形到表意再表音的客观规律。因此说汉字表音化是汉字发展的方向。周先师给汉字性质的结论是"语素-表义文字"。这个结论全面正确的概. 述了汉字的"特征"。我们只有把握住汉字的这个本质才能从根本出发把汉语 拼音与汉字的"特征"相结合研制出具有汉语汉字"特征"的现代化表音汉字。教育部副部长袁贵仁先生在《热烈庆贺周老一百寿辰,继续推进汉语文字 工作》 一文第四自然段的前部分讲到"首先高度重视语言文字在弘扬民族精 神中的重要作用。党的十六大报告指出,民族精神是一个民族赖以生存和发展 的精神支柱,而汉语和汉字就是中华民族的独特标志和宝贵财富,是中华民族 在历史长河中创造、发展、衍进的成果,是我们整个民族智慧的结晶,因此要 好好利用,发挥其精神支柱的作用"。袁先生的这段话告诫我们汉语和汉字的"独特标志"是我们中华民族生存 的精神支柱。因此我们研制拼音文字必须保持汉语和汉字的"独特性"这条体 现民族精神的原则。在彭泽润教授与马庆株教授的访谈录《"英汉双语教学"跟"国家汉语战 略"矛盾》 一文中其中有这样一段对话。彭当前我们国家在对待英语的语言政策上还存在什么问题?马听说今年北京的公务员录用中免试录用会英语的留学人员,这实际上 是迎合外国推行英语文化的需要。可以说在语言政策上,香港回归以后,不是 香港大陆化,而是大陆香港化。这是很危险的,这是一种语言自杀政策。上海 已经成为受到"双语教育"思潮危害最深的城市,在语言上变成了第二个香港 了。新加坡是多民族国家,英语水平高的人也比较多,但是唱国歌必须用新加 坡惟一的国语马来语。可是,在中国的上海,有的学校唱中国国歌都要求翻译 成英语唱。有的小学为了防止汉语拼音对英语字母学习的干扰,先教英语再教 汉语拼音,叫汉语给英语让路。汉语的地位真是太糟糕了!汉语和中国的命运这样下去真是太危险了!这种引狼入室的做法值得我们深思啊!马会长对当前部分地区重视英语的现状及"英汉双语教育"的举例、分析 和发出的感叹,让每个有尊严的中国人不能不深思。他的这种强烈的民族爱国精神,我想会触动所有中国人觉醒。"英语当前",其根本原因在于为了经济利益和信息传递方便的需要。面 对汉字难读、难记、难写、难输入电脑的现实,其实中国人重视"英语当前" 也是一种无奈的选择。我们应该不气馁、有信心,团结一致攻克难关,让古老 的汉字扬长避短,取长补短,赶上时代的需要,煥发青春活力,使之成为世界 最科学、最理想的现代化汉字,才能扭转英语趋于独霸天下的势态,才能让文 明古国的文明文化惠及世界。前任中国语文现代化学会会长、北京大学中文系教授苏培成老先生在《谈汉语的评价和前途》一文中谈到"汉字是当今中国记录汉语的唯一文字,它 的地位十分巩固,在可以预见的将来看不到它的消亡迹象;但同时也要看到汉字 还有缺点,在学习和使用上还比较困难。为了解决这个问题, 一方面要推行汉字的 "四定",即定量、定形、定音、定序, 一方面在汉字不便或不能使用的领域要充 分发挥汉字拼音的作用。从国家制订语文政策说,自然要吸收学术研究成果,但是 也必须从实际出发,面对社会语文的实际需要"。苏老从实际出发评价当今汉字的地位,从实际需要来要求汉字的研究成果, 这种一切从实际出发的思想是指导我们研究汉字的法宝,可预防我们脱离现实, 少走弯路。山东师范大学教授、中国语文现代化学会副会长王开扬先生在《热烈祝贺 中国语文现代化学会第七次学术研讨会胜利召开》的贺文中讲到"对汉语书 写体系加以改良(简化汉字等)和改革(研制汉语拼音文字方案等)使中国人 有一套易学、省力、高效的语言及其文字工具;在工业化、信息化时代,这套 工具还应是方便机器处理的工具"。王先生在贺文中旗帜鲜明的提出了"一语 双文"的研究目标和要求。这种目标和要求会促进我们的研究工作。语言大师吕叔湘老先师曾在《谈形、音、义》 一文中谈到"最理想的文 字应该是一个字只有一个写法(拼法), 一种读音, 一个或相近的一组意义;任何两个字都在形、音、义三个方面互相区别。可惜世界上没有这些文字"。 吕老先师对最理想的文字设想启发了我对"兼类"字的分化。我的"汉语拼音语素定型方案"是在先哲、前辈、先生们语言文字改革研 究成果的基础上和中国语文现代化思想的指导下研究出来的,并得到了现代汉 语大家黄伯荣老先生的支持、帮助和苏培成先生的指点。一切从实际出发是做好任何工作的出发点,这是攻不可破的真理。语文现 代化的研究也不例外。那么拼音文字要想适应汉语、适应世界、方便社会实际需要就必须从汉字体系具体复杂面研究,并结合汉语拼音制定多种需要融于一体的和谐的规则。汉字复杂面主要有1. 同音词字、词素字太多;双音节同音词较多,并且"词法"关系不统一; 语法功能相同,表达方法相同等。如"议"字读音声调相同的就多达71个,"计" 字多达45个,"坚"字多达27个等等(按7000通用字计算得数)。生一声一升嫁 —驾一架异一易一益变异一变易异地一易地归公一归功财务一财物 柴园一财源一才源人事一人世一人士又发一诱发又杀一诱杀邮票一油 票渔民一愚民异议(意一义)议事一佚事传诵一传颂一传送民意一 民议玩石一顽石闲人一贤人一贤仁闲事一贤士等等。如用没有字义信息 的字母文字来表达汉语势必产生盲人摸象的局面,汉字词语在没有字义信息的 字母文字的词语中也失去了应用的灵活性。如"贤妻良母",人对妻不满意时 可巧用谐音"闲妻凉母"表达思想感情,但是在没有字义信息的字母文字的词 中象这样类似的词就无法灵活表达了 。因此说没有字义信息的词会制约汉语词 义的发展或者说会造成汉语词义的萎缩。2. —字多义现象复杂,即词性"兼类"复杂。如"首"字,名词性、动词 性、量词、虚词几种词性兼有;"面"字在"面部"中有表示人体器官的意思, 在"面条"中有表示生活资料的意思,即还有所表事物有自然属性兼类。在"会 面"中是动素,在"这水果太面"中是形素,在" 一面'中是量词。真是兼类 多多!3. 汉字在古汉语中一个字基本上就是一个词,在现代汉语中既是一个词又是 一个语素或者只是一个符号字。这种情况在句段中表达方法变换不定,给纯拼 音的字"定词"及"组字成词"、"组词成句"输入电脑带来了困难。这几个主要的复杂面一直困扰着我们以《汉语拼音方案》作为拼写汉语工 具和汉字方便输入电脑。我们要透过汉字繁杂的现象看到其本质。汉字是一种 语素一表义文字。那么我们必须从汉字的"特征"上去思考。为了使汉语语素 科学有序并能保持汉语汉字的特征,汉字需要按语素意义归类(包括兼类字分 化归类),然后选择表示语素意义的字母标注在汉语拼音音节字母后使其成为 定型的汉语拼音语素,这才能解决复杂的汉字状况,并能保持汉语汉字的特征。 这一步做好后还要从以下几个方面思考1、从标调醒目和便读上思考,定声调 为大写字母。2、从表义和拼式最简短上思考,定声调兼表"类义"。3、从同 音语素的区分上思考,选择有顺序记得牢的声母表里的字母作为区分同音语素 的字母。4、从方便输入电脑上思考,让定型的语素和汉字都无需编码,并两种文本在电脑里能够转换。值得庆祝的是,我们的先哲、前辈们为今夭研究语文现本文档来自技高网...
【技术保护点】
一种用于中文信息处理技术的汉语拼音语素定型方案,其特征是:将汉字按语素意义分化归类。分为名素类,动素类,形素类,名素类再根据每个词字或词素所表示事物的自然属性归类成4小类,即,姓氏、人称、器官名病名,地方、处所、区域名归一小类,简称“人域类”;植物名、动物名归一小类,简称“生物”类;天文、气象、时间、方位、历法,矿物、化合物、化学元素名归一小类,简称“资源”类;人类生活、生产用品用具及相关的事务名,数量词、代词归一小类,简称“资料”类, 每个语素汉字分别对应每个汉语拼音 定型语素。拼音定型语素的声母、韵母拼写规则按《汉语拼音方案》不变,声调改用大写字母,名素中的“人域”类用大写字母B、P、M、F作为声调兼表类义字母,B、P、M、F分别表1、2、3、4声并是“人域”类名称的标志, 例: zhaoF qianP sunB liM zhouB wuP zhengF wangP 赵 钱 孙 李 周 吴 郑 王 maB shuB boP jieP jieM naiM zhenF 妈 叔 伯 杰 姐 奶 朕 xinB ganB biP boP shouM lianM yanM leiF maiF 心 肝 鼻 脖 手 脸 眼 肋 脉 shanB jiaB t ianP chengP shengM haiM xiaoF 山 家 田 城 省 海 校 名素类中的“生物”类用大写字母D、T、V、L作为声调兼表类义字母,D、T、N、L分别表1、2、3、4声并是“生物”类名称 的标志, 例: anD huaD chaT heT baiN moL guiL 桉 花 茶 荷 柏 末 桂 jiD yaD eT langT maN luanN luL queL 鸡 鸭 鹅 狼 马 卵 鹿 雀 名素中的“资源”类用大写字母G、K、H、W作为声调兼表类义字母,G、K、H、W分别表1、2、3、4声并是“资源”类名称的标志, 例: tianG fengG che nK yunK maoH wanH xiaW yueW 天 风 晨 云 卵 晚 夏 月 anG jiaG meiK ruK b...
【技术特征摘要】
【专利技术属性】
技术研发人员:张基文,
申请(专利权)人:张基文,
类型:发明
国别省市:37[中国|山东]