当前位置: 首页 > 专利查询>汤建民专利>正文

智能五笔双拼码字--词链环式定位联想输入方法技术

技术编号:2891830 阅读:354 留言:0更新日期:2012-04-11 18:40
一种“智能五笔双拼码”字-词链环式定位联想键盘汉字输入方法,是根据现代汉语的特点,依据转换-生成语言学、数理语言学的原理,选用汉字的字音(声、韵)和字形(双笔形)符号及其相互间的意义关联作为汉字的编码信息,建立数理编码式和入机介面模型;借助软件的技术支撑,实现“字-词重码识别”和“字-词定位联想”输入,用于汉字输入的智能化处理。 其主要性能指标:动态平均码长2至2. 5键,动态重码率小于千分之一。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】
随着中文信息处理技术的不断进步,键盘汉字输入技术已从过去的拼音法、拼形法、声韵部形法等等,经验的、归纳统计的、静态的、特殊的基础性编码方法;向着理性的、演绎推理的、动态的、普通的和智能-转换生成的趋势发展。汉字系统和键盘汉字输入技术,已进入了一个被中国计算机界称为“百卡混战”和“百码争雄”的战国时代,标志着中文信息处理黄金时代的来临,展示了令人振奋的中文电脑普及应用前景。然而,作为中文信息处理最原始的汉字信息来源-键盘汉字输入,虽有数百个方案可供人们选择使用,但都因难以有效地协调“简单”与“高效”,这一对主要矛盾,从而直接影响着中文信息处理效率和普及计算机教育事业的发展进程。近几年来,人们开始探索键盘汉字输入的智能化处理问题。研究“人工智能”的课题,关联的因素众多,千头万绪,错综复杂。延用至今的“拼音联想法”,已远远不能满足人们的需要了,因为录入一个单字及关联词汇要作二次选择输入,难以进一步提高击键速率和键入速率。刘卫民先生的“双音反联想”输入方法,独树一帜,使人耳目一新;但亦有局限性,此方法对录入非高频字则不适用。周志农先生的“超想自然码”,率先推出“重码词组的动态联想”以词为主的输入方式,改变了人们的对“重码率”的认识,闪烁着键盘汉字输入技术智能化发展的新曙光;但其录入单字词时因同音重码率太高,也不能不回到声韵部形的编码输入方式中去了,可谓是白玉一瑕、美中不足矣。科学的生命力在于不断探索,不断创新。智能五笔双拼码汉字输入系统,它根据现代汉语的语音、词汇、语法特点,依据转换一生成语言学、数理语言学的原理,尝试选用汉字的字音(声、韵)和字形(双笔形)符号及其相互间的意义联系作为汉字的编码信息,建立数理编码式和友好的汉字键盘人机介面模型;使用有限的音、形符号和简洁浅显的编码式,反复使用,组合生成数以十万计的字词编码,借助软件的技术支撑,用于键盘汉字输入的智能化处理。其字一词链环式人工智能库,是以单音节的汉字之形音编码为基础;以汉字的字、词、句,形、音、义多维一体复合编码为主导;以第五键“智能识别码”,为连结点(或者说是以单字编码为母环,字-词形义关联(或音义关联)为子环,字与词环环相扣,形成联想链),从而实现“字-词重码识别”和“字-词定位联想”输入之目的。其词组重码的识别方法,亦是使用词的第五键“重码词组形(音)识别码”的方法实现的。因为采用了第五键辅助编码,有效地协调了大容量的词库编码重码率高和字词难以兼容等突出的矛盾,并充分采用了“高频先见”,“非全码第一高频加空格”和“全码第一高频免选择”等成熟的技术方法;从而使其动态平均码长有效地控制在2至2.5键之间,动态重码率降至千分之一以内。 二附图说明A、智能五笔双拼码的键位分布 附图-A一种利用双笔划码的计算机汉字输入键盘,是利用普通英文键盘及现有技术中字母区位码的布局将5种笔画的25种两两组合赋予相应的键位上,同时利用英文字母键排列拼音声、韵母-字母键 对应双笔码 声母 韵母A 一乙 a(约定) aB 乙丨 b ia uaC 乙丶 c ch uan ü anD 一丿 d aoE 丿丿 e(约定) eF 一丨 f anG 一一 g angH 丨一 h iang uangI 丶丿 iJ 丨丨 j ianK 丨丿 k iaoL 丨丶 l in ingM 丨乙 m ieN 乙一 n iouO 丶丶 o(约定) o uoP 丶乙 p ouQ 丿乙 q erR 丿丨 r enS 一丶 s sh aiT 丿一 t engU 丶丨 u üV 乙丿 uei ü eW 丿丶 w eiX 乙乙 x uaiY 丶一 y ong iongZ z zh uen ü n 声韵笔画规则说明(以拼笔快速为例)1、啊(a)、埃(ai)、安(an)、肮(ang)、凹(ao); 蛾(e)、而(er); 欧(ou)等几种汉字的分别用-(A+韵母代码+汉字首二笔码+汉字尾二笔码),(E+韵母代码+汉字首二笔码+汉字尾二笔码),(O+韵母代码+汉字首二笔码+汉字尾二笔码)等的方法编码。以上是三类“零声母”的声母编码约定。2、不足四笔画的汉字笔画码作如下处理①一笔画的汉字只有“一”和“乙”2个,分别定义为“YI 一一 一一” YIGG和“YI 乙乙 乙乙” YIXX。②二笔画的汉字,既是该字的首二笔码又当作尾二笔码。例如,儿EQ丿乙丿乙 EQQQ刁DK乙一乙一 DKNN③三笔画的汉字,中间的笔画既是首二笔码的第二笔画,又是尾二笔码的第一笔画。例如,工GY一丨丨一 GYFH久JN丿乙乙丶 JNQC笔画笔顺补充说明a、五笔画的划分以《辞海》的“笔画查字表”作为规范一(1)、丨(2)、丿(3)、丶(4)、乙(5)。b、汉字首二笔的笔画笔顺亦以“笔画查字表”为主要划分依据。1、提(/)作横(一),但与点(丶)相连时作点。例如,“刁”字的首二笔码为“乙一”,“冯”字的首二笔码为“丶丶”。2、捺( )作点(丶)处理。例如,“众”的首二笔码为“丿丶”。3、类同“羊”、“姜”等的字,首二笔码按习惯作“丶丶”处理;但“刀”和“力”字的首二笔码统一规范为“丿乙”,“小”字的首二笔码规定为“乙丿”;类同“匡”的首双笔码为“一乙”,“同”的首双笔为“丨乙”。c、汉字尾二笔的笔画笔顺依据一般的书写习惯,同时考虑有利于识别为准则。为此,作如下规定1、尾二笔码的笔画笔顺依据“先左后右、先上后下、先内后外”作为区分的基本原则。例如,“田”字的尾二笔码为“丨一”,“国”的尾二笔码为“一一”等。2、撇(丿)与点(丶)不分长短,只按笔画的走向区分。例如,“玉”字的尾二笔码为“一丶”,“金”字的尾二笔码为“丿一”,“共”字的尾二笔码为“丿丶”,“家”字的尾二笔码为“丿丶”等。3、限定汉字右上角的点不作为尾二笔码的编码信息,以便于识别。例如,“线”字的尾二笔码为“乙丿”,“埔”字的尾二笔码为“一丨”。B、字-词链环式复合编码方法附图B-1,对于“五笔快速”而言,其词组动态智能码是指字-词的复合编码式一A=A首双笔+A尾双笔+A声母+A韵母+_。例如,计=PFJI_AB=A首双笔+A尾双笔+A声母+A韵母+B声母。例如,计算=PFJIS字-词的复合编码式二AB...Z=A首双笔+A尾双笔+A声母+A韵母+Z声母。例如,计算机=PFJIJ计划生育=PFJIY不难看出,词组前四取头单字的编码;第五码取词组的末单字的声母作动态智能码。再看如下例子-拍_=AGPS_板=AGPSB 巴掌=AGPSZ 手称快=AGPSK卖=AGPSM 马屁=AGPSP片=AGPSP摄=AGPSS照=AGPSZ排_=PGPS_版=AGPSB 水沟=AGPSG 忧解难=AGPSN 长=AGPSZ 水量=AGPSN除=AGPSC队=AGPSD放=AGPSF灌=AGPSG列=AGPSL球=AGPSQ水=AGPSS附图B-2,对于“拼笔快速”而言,其词组动态智能码是指字-词的复合编码式一A=A声母+A韵母+A首双笔+A尾双笔+_。例如,计=本文档来自技高网...

【技术保护点】
一种“智能五笔双拼码”字-词链环式定位联想键盘汉字输入方法,是利用汉字的形(双笔形)、音(声、韵)、义(意义关联:词汇的音-义联系或形-义联系)作为汉字的编码信息特征,用汉语的声、韵双拼和汉字的双笔形符号及第五键形音智能识别码输入汉字及词组。其词组的录入特征在于:AB=A首双笔+A尾双笔+A声母+A韵母+B声母。AB…Z=A首双笔+A尾双笔+A声母+A韵母+Z声母。第一步,输入词语的第一个字的首双笔代码;第二步,输入词语的第一个字的尾双笔代码;第三步, 输入词语的第一个字的声母;第四步,输入词语的第一个字的韵母代码;第五步,输入词语的末尾一个字的声母。

【技术特征摘要】

【专利技术属性】
技术研发人员:汤建民
申请(专利权)人:汤建民
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1