当前位置: 首页 > 专利查询>李贾达专利>正文

超级智能联想汉字系统及其输入键盘技术方案

技术编号:2893267 阅读:237 留言:0更新日期:2012-04-11 18:40
本发明专利技术超级智能联想汉字操作系统及键盘,属于中文信息科学领域,侧重为办公室工作人员使用计算机输入汉字而设计的。采用笔画数编码,能直接对国家二级字库中汉字进行超级智能联想,不同专业的人员使用时可自动建立本专业的智能联想词汇,删除其他非常用词汇,输入速度愈来愈快,易看键打字或盲打,它可用在计算机、有图形功能的终端,打印机、绘图仪及电子式打字机中。(*该技术在2008年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术属于中文信息处理技术科学领域,是一种用于快速输入汉字的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能,它涉及一种汉字编码输入新方法及其应用键盘。汉字编码方案是涉及到计算机在我国和其他使用汉字的国家或文字符号较复杂的国家普及推广计算机的关键技术问题,迄今为止,国内外已经提出数百种编码方案,大体上可分为形码、音码、形音码三类。在众多的方案中,音码的重码太多,难以提高输入速度;电报码、区位码记忆困难;形音码复杂难学;形码基本字元太多记忆困难,如国内公认的优秀方案,王永民的“五笔字型码”(“优化五笔字型编码法及其键盘”中国专利85100837)实际上有227个字元;四川的“大众码”(“汉字编码方法及其所用键盘”中国专利85104343)有127个字元;从而成为普及的一大障碍。河南省的王永民研制出来五笔画、五笔字型汉字输入法,已经获得中国、英国和美国的专利权。其特点是具有汉字联想功能,可以联想6000多条成词语。但是它仅仅只能够对成词语进行联想,如“中国”、“汉字”等。不能够对上下文有关的非成词语进行联想,如本专利技术名称中就有的非词语“级智”、“想汉”等。它们虽然不是成词语,但是很明显“级”字之后可能会有“智”字,“想”字之后可能会有“汉”字,即它们之间存在有上下文关系,构成了非成词语,所以应该进行联想。并且欲进行联想的词语必须预先装入到成词语库中,使用时不很方便,目前,国内流行的“五笔字型”、联想编码等(如“汉字拼音联想编码及双拼键盘”中国专利85100094),都是采用成词语联想,它们都不是真正智能的,都有其固有的弊病,即当联想完一个成词语后,如“中国”、“解放军”等,就断了后续词源了,必须重新输入新词头后,才能够继续联想下一个成词语。特别是当许多个成词语被定义成同一个索引词头字时,就要进行翻页操作,在没有翻到最后一页时,就无法确定是否有所想要的联想词组,这样的操作实在是太繁琐了。多文种电脑(中国专利zl85100868),采用了多文种笔画键盘,但并非是智能的;日本电气株式会社的“中文输入法”(中国专利87104543),仅可对同音字用同音字表分类;香港“安子介式汉字笔形电脑编码法及其键盘”(中国专利85101817),采用六位数字编码,位数较多,编码较复杂;北京市中国科学院研制出来的智能联想汉卡,其特点与五笔字型联想类似,也不是真正智能的,使用时也不方便,特别是硬件汉卡的价格很昂贵,一般用户不愿意采用。本专利技术针对以上汉字操作系统及其输入键盘所存在的问题,目的在于实现一种汉字简化编码方案及高速通用汉字输入操作系统,保证其好学、易记、输入快速,并且配备简明通用键盘,以利于计算机汉字化的实现。以下的说明较好地实现了这一目的。本专利技术的汉字输入编码是不同于以上三类汉字输入编码的一种奇特编码,它仅依赖于汉字符号的笔画数,与字形、发音毫无关系,因此它不仅适用于中文输入,而且适用于世界各国文字符号输入用。特别是附加了超级智能联想汉字系统之后,其输入速度得到了大幅度的提高。对于汉字的输入,可以参考查字典的方法,在现代汉语词典中,其单字条目是按照拼音字母顺序排列的,部首检字表则是按照部首笔画数目多少排列的。检字时,若知道读音者,可以直接翻到其单字条目读音所在的页数,查找同音字区域。若不知道读音者,则要先数偏旁部首的笔画数,找到该偏旁部首在检字表中的页数,再数剩余的笔画数,找到同笔画数的检字表栏目,查找该字及其所对应的页数,最后翻到其单字条目所对应的页数。本专利技术即是根据现代汉语词典的部首检字方法设计的,完全符合中国人查找汉字的习惯,其拼音输入法编码,国内早已有人完成了。而笔画数输入法编码,国内至今还没有推出较好的方案。本专利技术中的笔画数编码方案,可以将国家标准GB2312-80《信息交换用汉字编码字符集》中二级字库的8178个汉字符号全部输入到计算机中,其中还留有10~15区共564个空字位供给用户新造其他国家文字、新汉字符号或特殊符号使用。凡单字笔画数小于或等于9画的连体汉字符号,按笔画数分区,在1~9区,用户只按一次与笔画数相同的数字键做为区键,再按翻页键或选字键即可完成该字的输入。凡单字笔画数大于9画的字或可解体字,必须按其成形的偏旁部首拆成两个笔画数尽量相同的部分,将笔画数少的部分做为第一个区码先键入,再将另一部分的笔画数做为第二个区码键入,最后按翻页键(<,>)或选字键(2)即可完成该字输入。当两部分笔画数接近时,依据下列拆分次序左侧、左上角、上侧、右上角、右侧、即顺时针方向。连体型笔画数大于9画的汉字符号,一律规定该字在00区中显示,拆成两区后仍有一区大于9画的汉字符号,规定其编码为xO,(x为小于9画的笔画数)。超级智能联想选字按选字键一个就可以输入一个汉字符号,它不能使用盲打,因为联想字库随时都在进行动态更新。最佳选字按区键一个,选字键一个,共二键录入一个汉字,预计可以录入9区×26字=234个高频字,可以实现盲打。标准选字按区键二个,选字键一个,共三键录入一个汉字,预计可以录入82区×26字=2132个常用字,可以实现盲打。并且还比五笔字型的四键输入码少按一次键。超级智能联想汉字输入方法根据上下文有关文法,将该汉字之后最常用的26个汉字自动装入到联想字库中,并且根据各汉字的使用频度,修改各汉字的加权系数,系数大者与前一字构成常用联想词汇,系数为0者随时可能会被新字取代,联想系统只对第一级字库,16区~55区执行联想,从而压缩了联想字库的容量。共计有40区×94字=3760个汉字可以进入联想。即共有97760个词语联想。对1~15区的符号,56~87区的非常用汉字符号不进行联想处理。联想单词全部显示在提示行中,不必进行翻页查找,汉字输入的联想率可以达到70%以上。最快输入速度可以达到每分钟120个汉字符号。本专利技术中CRT显示器上有一提示行,可根据具体显示器的类型及便于观察来设计一行提示的汉字符号数量,以提示尽可能多的信息量,这些汉字与键盘中的字符选字键相对应,利用标准小键盘来完成汉字大键盘的直观输入功能。在现代汉语中,依据其固有的文法结构,汉字几乎是不能够孤立地出现的,单独的汉字也不能表达出一个完整的意思。在汉语中能够形成固定词汇或短语的组合,仅仅只占汉字常用组合数的十分之一。国家标准一、二级字库中共有汉字6768个,使用它们最多能组成的两字短词仅仅只有6768×6768=45805824个,而这些短词中仅仅只有1%的组合是可能成立的有序集合,所以,两个字的短词约有450858个,以每个字的机内码占用二个字节计算,总共为901716个字节,大约只占用1MB的存储容量,并不算很大。绝大多数汉字的二字有限集合在50个以下,能够超过50个的汉字二字有限集合只有100多个,因此汉字输入完全可以利用大容量的智能联想输入法实现一字一键的快速输入。本专利技术的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能。其特征是利用标准键盘实现汉字大键盘直观输入功能的汉字笔画数编码输入方法,超级智能联想汉字操作系统及键盘,它能够自动地学习新知识、自动建立知识库、并且进行逻辑分析推理,它还能够自动地删除旧知识,完成知识库的更新操作。本文档来自技高网...

【技术保护点】
用于快速输入汉字的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能,其特征是:利用标准键盘实现汉字大键盘直观输入功能的汉字笔画数编码输入方法、超级智能联想汉字操作系统及键盘。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:李贾达
申请(专利权)人:李贾达
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1