五笔输入组词方法技术

技术编号:2822939 阅读:908 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种五笔输入组词方法,特别是提供一种按五笔字型输入法规则连续输入每个汉字的汉字编码后自动生成词组的五笔输入组词方法。本发明专利技术的一种五笔输入组词方法是按五笔字型输入法规则输入每个汉字的汉字编码,可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后组成一个词组,并生成词组编码。本发明专利技术解决了五笔字型输入法不能主动组词、输入效率无法提高的问题,弥补了现有技术不能体现输入个性化的不足。

【技术实现步骤摘要】

本专利技术涉及一种,特别是涉及一种按五笔字型输入法规则连续输入 每个汉字的汉字编码后自动生成词组的。
技术介绍
20年前,五笔与拼音相比,由于其几乎没有重码,因此在输入速度上存在着明显的 优势。但近几年来,拼音输入法在不断的完善。用户自定义词组、词频调整、简拼等功能 都成为了第二代拼音输入法的基本功能。这些新加入的功能大大提高了拼音的输入效率, 在不少场合下,拼音的输入速度已经超过了五笔。因此,如果五笔要保留现有的用户群,迫切需要加入一些新功能,来解决现有的一些 缺陷,进一步提高输入效率。当用户输入的编码没有全匹配的词组时,五笔也可以象拼音 一样选择相应的字组成词组。要求能把用户输入的编码前4位对应的所有单字一一列出, 当用户选择字时,编码中相应的编码被替换成汉字,然后重复同一步骤直到所有编码都匹 配完成。词库的精确度,是输入法提高效率的关键。换句话说,词库虽然大,但缺少用户最关 心的词仍然提升不了输入效率。体现在五笔上,虽然它有着低重码的先天优势,但缺少用 户自定义词组这一功能,导致了词库虽然可以做得很大,但精确度仍达不到另人满意的程 度。
技术实现思路
本专利技术的目的是提供一种,特别是提供一种按五笔字型输入法规则 连续输入每个汉字的汉字编码后自动生成词组的。本专利技术解决了五笔字 型输入法不能主动组词、输入效率无法提高的问题,弥补了现有技术不能体现输入个性化 的不足。本专利技术的一种是按五笔字型输入法规则输入每个汉字的汉字编码, 可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后 组成一个词组,并生成词组编码。作为优选的技术方案-如上所述的,其中,所述的方法包括以下步骤1) 用户使用五笔字型输入法连续输入汉字编码,输入法控制模块记录用户输入的汉 字编码到输入缓存,输入缓存由字队列与编码队列组成,编码队列存放末匹配的编码,字 词队列存放匹配后的字词;字词队列的尾部与编码队列的首部连接,组成输入缓存;2) 分析输入缓存,准确的说,分词模块实际上是分析编码队列,找到其中所有能够 匹配字的编码;所说的编码队列与编码队列是存储编码的数据结构,新输入的编码,按照 输入的先后次序,加入到队列的尾部,匹配的编码从队列的头部被移走,并放入字词队列的 尾部;所说的匹配是指编码能够从词库中找到对应的字或词;3) 取得分析结果,分词模块返回编码队列中所有能够匹配字的编码;4) 获得候选字,输入法控制模块根据前一步的分析结果,从词库取到匹配的候选字 词列表;5) 返回候选字词列表,词库将候选字词列表返回给输入法控制模块;6) 显示用户输入与候选字或词,输入法窗口模块显示前一步返回的候选字词列表;7) 用户选择候选字或词,用户从候选字词列表中选择需要的字或词;8) 找到用户选择的候选字或词,输入法控制模块从候选字列表中找出用户选择的字或词;9) 返回候选字或词,词库模块返回找到的字或词给输入法控制模块;10) 输入法控制模块,将匹配的字或词加入字词队列,同时将匹配的编码从编码队列 中移除。显示更新后的输入缓存,输入法窗口显示最新的输入缓存;11) 编码队列空了以后,输入法模块把字栈中的词组加入到词库中去;12) 输入法模块分析加入到词库中的词组,将词组拆分成字,找到字的各种编码,再 按照对应的编码组词规则(Todo),生成新的词组编码;13) 词组编码加入到词库,与词组对应。如上所述的,其中,所述的五笔输入法是汉字五笔输入法,包括王 码、万能、陈桥智能、极点、念青、快乐、幸福和极品五笔五笔输入法。如上所述的,其中,所述的词组编码包括五笔简码、拼音简码、五 笔标准词组编码和拼音完整编码。如上所述的,其中,所述的候选字或词包括五笔输入法的一级简码、 二级简码、三位输入和四位输入所得到的字或词。如上所述的,其中,所述的候选字词列表以阿拉伯数字顺序标记排列,用户选择候选字或词时只需输入候选字或词所对应的阿拉伯数字即为选中。如上所述的,其中,所述的词组在被再次输入时,这个词组将出现 在候选字词列表的第一位,或从候选字词列表的末位开始将这个词组前移若干位,列表中 位于这个字或词之后的字或词都相应按顺序往后移一位,也就是说,假如产生的新词组的 编码与原有编码有重码现象,则新词组作为常用词组前置,如果下次用户再次输入相同编 码,这个词组将出现在候选字词列表的第一位,或从候选字词列表的末位开始将这个词组 前移若干位,列表中位于这个字或词之后的字或词都相应按顺序往后移一位。本专利技术的一种,其中所述对应的编码组词规则(Todo)是一般词组编 码产生所遵循的原则,组词规则可分为完整编码规则与非完整编码规则。非完整编码规则用户无需输入完整的词组编码,只需要按顺序输入词组中全部或部 分汉字编码的一部分,即能打出所需词组的规则。完整编码规则用户需要输入所有汉字对应的完整编码,才能打出所需要词组。由于 该规则比较简单,不多做描述。组词规则1:这个规则最具有代表性的例子就是以五笔、二笔为代表的形码。这些形码的特点都是词组会用一个固定长度的编码去表示。* 组词规则有若干个等式表示。參等号左边为词组的汉字个数。其中e表示"等于",a表示"大于等于"(有且只有这两个设置)。參等号右边为规则,其中p指正序,n指逆序。如pll指第一个字的第一个编码, nil则是指最后一个字的第一个编码。* 组词规则的数目应该比码长小1 e2=pll+pl2+p21+p22 e3=pll+p21+p31+p32 a4=pll+p21+p31+nll组词规则2:这个规则最具有代表性的例子就是本专利中提及的五笔组词方法。* 组词规则有若干个等式表示。參等号左边为词组的汉字个数。其中e表示"等于",a表示"大于等于"(有且只有 这两个设置)。 等号右边为规则,其中p指正序,n指逆序。如pll指第一个字的第一个编码, nil则是指最后一个字的第一个编码。* 组词规则的数目应该比码长小1 e2=pll+p21e3=pll+p21+p31 e4=pll+p21+p31+p41 e5=p11+p21+p31+p41+p51en=pll+p21+p31+p41+p51+......+pnl(注此公式内的n表示下标,而非逆序)组词规则3:这个规则最具有代表性的例子就是拼音。 声母简拼或声母的首字母简拼。例如"王正明"可以通过声母简拼的方式,利用"wzhm"打出;也可以通过首字母 简拼,利用"wzm"打出。本专利技术的有益效果是本专利技术的一种,解决了长久以来五笔输入法无法在使用中,向词库 加入用户词组的难题。这个新的功能,使得五笔用户能把一些经常使用的词组加入到词库 中去,大大提高了输入的准确率与速度。多种组词规则的支持,使得一个词组进入词库后会有多种输入编码与之对应。用户可 以选择最简便或最合适的输入编码进行输入。如,虽然用户通过五笔的方式加入了 "斤斤 计较"这个成语,但由于词库中还存在着相应的拼音简码,使得用户可以只输入"jjjj", 就能找到需要的词。突破4位编码的限制,使得五笔用户也能享受到同拼音一样的整句输入功能。这个功 能能够加快用户输入短语的速度,输入法还可由此通过用户输入的上下文,来智能预测下 一个有可能的输入。具体实施例方式下面结合具体实施方式,进一步阐述本专利技术。应理本文档来自技高网...

【技术保护点】
一种五笔输入组词方法,是按五笔字型输入法规则输入每个汉字的汉字编码,其特征是:可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后组成一个词组,并生成词组编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:林正昱王正明林国栋
申请(专利权)人:上海埃帕信息科技有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1