本发明专利技术公开了一种调整候选词顺序的方法,包括:接收来自汉字输入装置的顺序调整指令,该指令中包括候选词的拼音串、汉字和位置信息的映射关系;根据顺序调整指令,将候选词的汉字排列在候选词列表中的指定位置。本发明专利技术还公开了一种调整候选词顺序的装置,可以根据来自汉字输入装置的顺序调整指令中的拼音串、汉字和位置信息的映射关系,将候选词调整到候选词列表中的指定位置,实现了快捷操作;并且本发明专利技术支持拼音的模糊匹配,无论用户输入为标准全拼、简拼,还是模糊音,都可以实现候选词的顺序调整,从而提高了汉字输入的实用性。
【技术实现步骤摘要】
本专利技术涉及文字输入技术,尤其涉及一种调整候选词顺序的方法和装置。技术背景计算机使用者要将汉字输入到计算机,就要使用中文输入法,目前,中文 输入法可分为键盘输入法和非键盘输入法,而使用比较成熟的就是基于键盘的 中文输入法。所谓中文输入法,即把键盘输入的编码或其他非键盘输入的媒体 数据转换成汉字输入的方法。其中,键盘输入法就是利用键盘,并根据一定的编码规则来输入汉字的一种方法。英文字母只有26个,它们对应着键盘上的26个字母,所以,对于英 文而言是几乎不存在输入法的,直接输入英文字母就可以。汉字的字数有几万 个,它们和键盘是没有任何对应关系的,但为了向计算机中输入汉字,必须对 汉字进行编码,并将这些编码与键盘上的键联系起来,这样在键盘输入某个汉 字的编码时,计算机就会将编码转换成汉字。目前,汉字编码方案已经有数百种,其中在计算机上已经应用的就有几十 种。作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的 编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字 进行组合来完成汉字输入的。非键盘输入法包括手写输入法、语音输入法和光学字符识别(OCR, Optical Character Recognition)输入法等。手写输入法是 一种笔式环境下的手写中文识别输入方法,用户只要在手写 板上按平常的习惯写字,计算机就能将其识别并显示出来。当然也可以用鼠标 在指定区域内也可以写出字来,进而转换成汉字。语音输入法是通过话简输入声音然后转换成文字的一种输入方法,语音输 入法在硬件方面要求计算机必须配备能进行正常录音的声卡,然后调试好麦克 风,用户可以对着麦克风用普通话语音进行文字录入。OCR输入法是将文稿通过扫描仪转化为图形,进而对图形进行识别并转换 为汉字的一种输入方法。目前,在使用输入法的过程中,用户通常会有将某个候选词固定在候选词 列表中指定位置的需求。以候选词的置顶为例,用户希望在每次输入拼音 "shishi"的时候,候选词列表的首位总是显示汉字"事实"。现有技术是通过 类似于自定义短语的方式来实现候选词置顶的,所谓自定义短语的方式是通过 自定义的特殊输入来得到自定义的文本,用户可以设置一个字符串到 一个候选 词的映射关系,并设置这个候选词在候选词列表的位置。如图l所示,用户通过界面设置字符串"simka"和对应的候选词"SIM卡",并设置"SIM卡"在 候选词列表的位置为1,则在保存设置后,用户再次输入"simka"时,候选词 "SIM卡"会排列在候选词列表的首位,如表l所示simkal.SIM卡2.四名卡3.四名4.私募5.寺庙6.司马7.四面8.私密9.四门表 1当然,图1中也可以设置"SIM卡"在候选词列表的位置为其他位置,如 2、或3、或4等等。这样"SIM卡"就可以根据实际需要,出现在候选词列表 中的任何位置上。现有技术中通过配置文件对设置的映射关系和位置信息进行存储,配置文 件格式如下netease=l , 网易 simka-1, SIM卡 tixu=2, T恤 txingtai=3, T型台tXU=2, T恤upan=l, U盘当用户输入的时候,根据用户输入的字符串在上述映射关系中查找与输入 的字符串相对应的候选词和位置信息,如果能够找到,则按照位置信息将候选 词排列在候选词列表中的相应位置上。但是,现有的调整候选词顺序的方法,需要用户通过界面的自定义短语选项进行设定,操作比较麻烦;并且缺乏拼音识别能力,不支持拼音的模糊匹配, 用户输入的字符串必须与预先设定的字符串完全匹配才可以实现置顶,以图l的设置为例,在设定了 "simka"和"SIM卡"的映射关系之后,如果用户输入 "simk,,,则无法与预先设定的"simka"完全匹配,从而无法将"SIM卡"这 个候选词显示在候选词列表中的指定位置上。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种调整候选词顺序的方法和装置, 以解决现有的候选词顺序调整的方法缺乏拼音识别能力,操作麻烦的问题。 为达到上述目的,本专利技术的技术方案是这样实现的 本专利技术提供了一种调整候选词顺序的方法,包括接收来自汉字输入装置的顺序调整指令,所述指令中包括候选词的拼音串、 汉字和位置信息的映射关系;根据所述顺序调整指令,将所述候选词的汉字排列在候选词列表中的指定 位置。所述接收来自汉字输入装置的顺序调整指令之前,该方法还包括 所述汉字输入装置从所述拼音串对应的候选词列表中选取需要调整的候选词,并生成所述拼音串、所选候选词的汉字和位置信息的映射关系; 将所述映射关系携带在顺序调整指令中以快捷键的方式发送。 所述接收来自汉字输入装置的顺序调整指令之后,该方法还包括将所述指令中的映射关系以检索树的形式进行存储,所述检索树为二元查找树、红黑树和哈希表中的任一种。所述将映射关系以检索树的形式存储,进一步包括将所述拼音串与输入法词典中所存储的所述汉字的标准全拼进行匹配,判 断所述拼音串是否为标准全拼;如果判断所述拼音串不是标准全拼,则生成所述汉字、位置信息与标准全 拼的映射关系插入所述检索树中。所述将候选词的汉字排列在候选词列表中的指定位置之后,该方法还包括 根据来自所述汉字输入装置的位置恢复指令,将所述候选词在候选词列表中的位置恢复为初始位置,具体包括接收来自所述汉字输入装置的位置恢复指令,所述指令中包括所述候选词的拼音串和汉字的映射关系;将所述位置恢复指令中的映射关系与所述检索树中已存储的映射关系进行 匹配,在匹配成功时,将所述检索树中匹配到的映射关系删除,并将所述候选 词在候选词列表中的位置恢复为初始位置。所述位置恢复指令由所述汉字输入装置通过快捷键的方式发送。所述汉字输入装置为键盘或手写板。本专利技术还提供了一种调整候选词顺序的装置,包括 顺序调整指令接收模块,用于接收来自汉字输入装置的顺序调整指令,所 述指令中包括候选词的拼音串、汉字和位置信息的映射关系;候选词调整模块,用于根据所述顺序调整指令,将所述候选词的汉字排列 在候选词列表中的指定位置。所述装置还包括映射关系存储模块,用于将所述指令中的映射关系以检索 树的形式进行存储,所述检索树为二元查找树、红黑树和哈希表中的任一种。所述映射关系存储模块进一步包括拼音串匹配子模块,用于将所述拼音串与输入法词典中所存储的所述汉字 的标准全拼进行匹配,判断所述拼音串是否为标准全拼;映射关系插入子模块,用于根据匹配结果,在判断所述拼音串不是标准全拼时,生成所述汉字、位置信息与标准全拼的映射关系插入所述检索树中。所述装置还包括位置恢复模块,用于根据来自所述汉字输入装置的位置恢复指令,将所述候选词在候选词列表中的位置恢复为初始位置。 所述位置恢复模块进一步包括位置恢复指令接收子模块,用于接收来自所述汉字输入装置的位置恢复指 令,所述指令中包括所述候选词的拼音串和汉字的映射关系;映射关系匹配子模块,用于将所述位置恢复指令中的映射关系与所述检索树已存储的映射关系进行匹配;位置恢复子模块,用于在匹配成功时,将所述检索树中匹配到的映射关系 删除,将所述候选词在候选词列表中的位置恢复为初始位置。本专利技术所提供的调整候选词顺序的方法和装置,由计算机的汉字输入装置 通过快捷键的方式发出顺序调整指令,计算机根据顺序本文档来自技高网...
【技术保护点】
一种调整候选词顺序的方法,其特征在于,包括: 接收来自汉字输入装置的顺序调整指令,所述指令中包括候选词的拼音串、汉字和位置信息的映射关系; 根据所述顺序调整指令,将所述候选词的汉字排列在候选词列表中的指定位置。
【技术特征摘要】
【专利技术属性】
技术研发人员:郑全战,张会鹏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。