具智能联想中文输入方法技术

技术编号:2880587 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种具智能联想中文输入方法,该方法是预先将所有的中文词组储存在一数据库中,再将这些词组每一个在词首的中文字在数据库的起始位置,储存在该数据库的地址表中,当处理器接收到通过输入装置所输入的中文字时,该处理器可通过地址表找到该中文字在数据库的起始位置,而至该数据库中,搜寻以该字为词首所有组成的词组,再通过显示装置将所有搜寻到的词组显示出来,供使用者选择,如此不仅减少输入的时间,且减少处理器辨识文字的过程,具有运用简便,节省时间的优点。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术是关于一种在个人数字助理及掌上型计算机等平台上,实现简便、快速输入中文词组的中文输入方法,该方法是在使用者通过任一种输入法输入一个单字时,处理器可根据该单字在数据库的位置,将在数据库中以该单字为词首的所有词组,通过显示装置显示出来,供使用者选择,而达到快速输入的目的,如此,可减少输入次数及辨识时间50%以上,进而大大提高输入速度。在现今消费者对电子装置的需求,朝小型化、多功能化及简便易用的前提下,使各种掌上型电子装置凭借其轻便、超薄、精巧等特色,可在今日众多科技电子产品中脱颖而出,且在众多的掌上型电子装置中,又以掌上型计算机(Hand-held PersonalComputer,以下简称HPC)最受瞩目。为了方便掌上型计算机与使用者的沟通,在掌上型计算机中搭配各种中文输入法(中文手写输入法、注音输入法、自然输入法、仓颉输入法等输入法),已成为掌上型计算机不可或缺的标准配置,而上述几种中文输入法中,又以中文手写输入法及注音输入法两种输入法的使用最为普遍,因此现在就该两种中文输入法的输入方式说明如下。首先,就手写输入法而言请参阅附图说明图1及图2所示可知,其主要是令处理器接收到通过输入装置10所输入的中文字型后,送至辨识系统核心11中,经采样得到一中文字型资料(200)后,再通过辨识系统核心11中的预处理模块111,将该中文字型资料去除噪声等成为标准化的二进制数值(201),再对该二进制数值进行滤波处理(202),再利用辨识系统核心11中的模式表达模块112,对该二进制数值进行特征抽取或基元分割识别的动作(203)后,通过辨识系统核心11中的判别模块113,将其与先前存储在数据库中已知的标准中文字偏旁表达形式,进行匹配判别(204),再进一步,将其与存储在辨识系统核心11中的字典114(特征模板或句法规则集合)中已知的标准中文字表达形式,进行判别(分类或句法分析)(205)后,就可识别出该输入的字形是那一个中文字(206)。另就注音输入法而言其是以汉语拼音为基础,将注音字母对应于相应键盘英文字母,通过键盘英文字母的点击达到拼音输入的目的,进一步查找中文汉字拼音对照表完成汉字的输入工作。请参照图3及图4所示,进一步而言,该注音输入法是以汉语拼音为基础,按注音与英文的对照表,由键盘读键(300)上将键盘英文字母转换为拼音字母(301),令使用者可通过点击键盘的方式,将所需的注音输入计算机中,进而找出与该输入注音所对应的中文字序列(302),并将该中文字序列显示出来(303)供使用者选择。但无论是利用中文手写输入法,或者是注音等输入法作为输入中文字的方法,在使用上皆具有相当多缺点。首先,就注音输入法而言,即有下列的缺点1.每输入一个中文字时,均需将组成该中文字的每个注音,通过使用者键击与其相对应的按键,因此,每个中文字的输入,平均按键次数要在三次以上。2.第二,每个词组中所有的单字,皆需通过键盘逐一输入计算机中,才能使该词组完整显示出来,所以,输入速度非常缓慢。3.不但词组提供不足,且使用者亦不能将自己常用的词组加入其中。另中文手写输入法则有下列的缺点(1).首先,因每个要输入的字皆要书写,且每个字的书写及辨识过程皆需要一定的时间,进而使其输入的速度受到限制。(2).另外,手写辨识系统安装于于掌上型计算机时,均会占用掌上型计算机中的内存相当空间,例如一般含有15000字左右的中文手写辨识系统,大约需占用内存1M空间,如此,不但会增加成本,且随着字符集的膨胀,辨识系统的辨识速度、辨识率亦会渐趋缓慢。因此,如果能在不增加较大资料空间,及不更动现有的注音、手写辨识等输入法的情形下,提出一种只需输入词组内容的第一个中文字,即可使整个词组显示出来的方法,不但可减少按键及书写的次数,且可以提高输入中文字的速度,进而解决上述输入法大部份的缺点。然而该新方法的发展前提,是该新方法的处理步骤必须非常单纯,才不至于增加系统负担,同时该新方法处理步骤必须充分符合一般数字数据处理的模式,如此才更容易应用于掌上型计算机(HPC)的领域上。有鉴于上述输入方法的缺点,本专利技术特提供一种具有智能联想输入中文方法,其主要目的,在于提供一种在使用者利用任意一输入法输入第一字时,处理器即自动至数据库中,搜索以该字为首所组成的词组,并输出给使用者选择,从而提升使用者输入速度。根据上述的目的,本专利技术首先提供一数据库,该数据库存中储存有以任意一中文字为首的所有中文词组,并将这些词组在数据库中的起始位置储存在一地址表中,令处理器在接收到该输入的中文字时,先根据该中文字的内码,再通过地址表至数据库中,找出以该字为首的所有词组,并使这些词组显示出来,供使用者选择。为使本专利技术的上述目的、特征和优点能更明显易懂,以下将参阅所附的图示,对本专利技术的设计与操作原理,作一详细说明,以对本专利技术的特征作更进一步的了解。图1为手写识别原理的方块示意图;图2为图1所示的手写识别处理流程的示意图;图3为键盘的声母及韵母键配置图;图4为注音输入法的流程示意图;图5为本专利技术数据结构的示意图;图6为本专利技术手写辨识联想输入法流程图。图7A为本专利技术输入方法实现过程的实施例图一。图7B为本专利技术输入方法实现过程的实施例图二。图7C为本专利技术输入方法实现过程的实施例图三。图8为本专利技术硬件装置逻辑结构示意图。主要组件的图号说明处理器 10显示装置40可擦写内存 20输入装置50暂存装置 30本专利技术是一种,其是一种具智能联想且适用于个人数字助理(Personal Design Assistant,简称PDA)、掌上型计算机(Hand-held Personal Computer,简称HPC)等平台上的中文输入法。本专利技术首先包含一预先将以任意一中文字为首的所有中文词组储存在计算机中的数据库,请参照图5所示,该数据库主要是由文件头601,地址表602及实际资料603等三部份组成;其中文件头601主要是提供说明性文字及版本信息,而地址表602主要提供以任意一中文字为首的词组,在数据库中的起始位置,另外,实际资料603是存储所有中文字组成的词组,且这些词组的各个词组的组成如下第一个字节指词组的字数;第二个字节相同字数词组的个数;其后跟着则是实际联想词组;如果为00表示本字联想词组结束。现在将本专利技术的方法,应用于任何一计算机系统时的流程,配合图8说明如下首先,在计算机中设置一处理器10,该处理器10并与可擦写内存20(ROM)、暂存装置30(如RAM等)、显示装置40(如屏幕)及输入装置50(如手写板)等相连接在一起,当作动时,可通过处理器10驱动可擦写内存20、存取装置30、显示装置40及输入装置50动作。再令上述储存有所有中文词组的数据库,存放在该计算机的暂存装置30中,令处理器10在接收到通过输入装置50输入的中文字时,该处理器10可根据该输入中文字的内码(701),计算出该中文字的内码的序列号(即在中文字库中的排列位置)(702),再根据该序列号在地址表的位置,通过该地址表至数据库中去读出该字联想词组在数据库中的起始位置(703),并判断该位置是否存在(704),如果该位置为空,表示该中文字无联想词组,则退出;反之,如果该位置存在,则根据该起始位置去读出与其关的联想词组。承本文档来自技高网...

【技术保护点】
一种具智能联想中文输入方法,其是一种预先将所有的中文词组储存在一数据库中,再将这些词组每一个在词首的中文字在数据库的起始位置,储存在该数据库的地址表中,当处理器接收到通过输入装置所输入的中文字时,该处理器会根据该输入中文字的内码,计算出该中文字的内码的序列号,再根据该序列号在地址表的位置,通过该地址表,直接至数据库中以该字为首的词组的起始位置上,并判断该位置是否为空,如否,则处理器会根据该起始位置,读出与其关的联想词组。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈淮琰刘长春李慨
申请(专利权)人:无敌科技西安有限公司
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1