一种获取新的字词组的方法和装置制造方法及图纸

技术编号:4268614 阅读:228 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种获取新的字词组的方法和装置,属于输入法技术领域。方法包括:获取用户连续N次输入的N个字词单元,N为大于等于2的自然数;计算N个字词单元之间的语义相关度,根据计算出的N个字词单元之间的语义相关度和预设的语义相关度阈值,确定N个字词单元是否可以组合为新的字词组;当确定N个字词单元可以组合为新的字词组时,将新的字词组加入指定词库中。装置包括:获取模块、处理模块和更新模块。本发明专利技术根据实时计算得到的用户连续输入的N个字词单元之间的语义相关度,组合出新的字词组,并将新的字词组加入指定词库中,使得用户需要再次输入该N个字词单元时,指定词库可以以字词组的形式提供该N个字词单元的候选项,减少了用户的击键次数,大大提高了用户输入字词时的输入速度。

【技术实现步骤摘要】

本专利技术涉及输入法
,特别涉及一种获取新的字词组的方法和装置
技术介绍
随着计算机通信技术的快速发展,计算机已逐渐成为人们日常生活和工作中不可 缺少的工具,在使用计算机的过程中,用户通过使用输入法系统,实现将字词输入计算机 中。 输入法系统是运行于计算机操作系统上的一个工具软件,可以将用户通过键盘输入的编码转换成字或词输入计算机。在现有的输入法系统中,为每一个字或词设定有相应的编码,并将每一个字或词及其相应的编码存储在输入法系统中的词库中,用户在使用输入法系统进行输入时,只要输入相应的编码就能获得所需的字或词。 然而,在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下缺点 用户在使用输入法系统输入字或词的过程中,经常需要输入一些复合词、人名之类的词语;而现有输入法系统自带的词库中没有包括这类词语,使得用户在需要输入这类词语时,只能拆开按字或单纯词一个一个进行输入,影响了输入速度。
技术实现思路
为了提高用户的输入速度,本专利技术实施例提供了一种获取新的字词组的方法和装 置。所述技术方案如下 —方面,本专利技术实施例提供了一种获取新的字词组的方法,包括 获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数; 计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组; 当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定 词库中。 进一步地,所述根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组,具体包括 判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义相关度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个 字词单元不可以组合为新的字词组。进一步地,所述语义相关度包括上下文关联度、或人名关联度; 相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值、或预设的人名关联度阈值; 相应地,所述判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义相关度阈值具体为 判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关 联度阈值;或 判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度 阈值。进一步地,所述语义相关度包括上下文关联度和人名关联度; 相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人 名关联度阈值; 相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字 词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合 为新的字词组,具体包括 计算所述N个字词单元之间的上下文关联度; 判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关 联度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新的字词组加入指定词库的步骤;否则,计算所述N个字词单元之间的人名关联度,然后判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词单元不可以组合为新的字词组。进一步地,所述语义相关度包括上下文关联度和人名关联度; 相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人 名关联度阈值; 相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字 词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合 为新的字词组,具体包括 计算所述N个字词单元之间的人名关联度; 判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度 阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新 的字词组加入指定词库的步骤;否则,计算所述N个字词单元之间的上下文关联度,然后判 断计算出的所述N个字词单元之间的上下文关联度,是否大于预设的上下文关联度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个 字词单元不可以组合为新的字词组。 进一步地,所述获取用户连续N次输入的N个字词单元之后,计算所述N个字词单 元之间的语义相关度之前还包括 判断现有词库和所述指定词库中是否存在所述N个字词单元; 如果所述现有词库和所述指定词库中均不存在所述N个字词单元,则执行计算所述N个字词单元之间的语义相关度的步骤。另一方面,本专利技术实施例提供了一种获取新的字词组的装置,包括 获取模块,用于获取用户连续N次输入的N个字词单元,所述N为大于等于2的自 然数; 处理模块,用于在所述获取模块获取到N个字词单元后,计算所述N个字词单元之 间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度 阈值,确定所述N个字词单元是否可以组合为新的字词组; 更新模块,用于当所述处理模块确定所述N个字词单元可以组合为新的字词组 时,将所述新的字词组加入指定词库中。 进一步地,所述处理模块具体包括 第一计算单元,用于在所述获取模块获取到N个字词单元后,计算所述N个字词单 元之间的语义相关度; 第一判断单元,用于在所述第一计算单元计算出所述N个字词单元之间的语义相 关度后,判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义相关度阈 值; 第一确定单元,用于当所述第一判断单元的判断结果是大于时,确定所述N个字 词单元可以组合为新的字词组;当所述第一判断单元的判断结果是小于等于时,确定所述 N个字词单元不可以组合为新的字词组。 进一步地,当所述语义相关度包括上下文关联度、或人名关联度;相应地,所述预 设的语义相关度阈值包括预设的上下文关联度阈值、或预设的人名关联度阈值时,所述第 一判断单元,具体用于在所述第一计算单元计算出所述N个字词单元之间的上下文关联度 后,判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的语义相关度阈 值;或 所述第一判断单元,具体用于在所述第一计算单元计算出所述N个字词单元之间 的人名关联度后,判断计算出的所述N个字词单元之间的人名关联度是否大于预设的语义 相关度阈值。 进一步地,当所述语义相关度包括上下文关联度和人名关联度,相应地,所述预设 的语义相关度阈值包括预设的上下文关联度阈值和预设的人名关联度阈值时,所述处理模 块具体包括 第二计算单元,用于在所述获取模块获取到N个字词单元后,计算所述N个字词单 元之间的上下文关联度; 第二判断单元,用于在所述第二计算单元计算出所述N个字词单元之间的上下文 关联度后,判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关 联度阈值; 第二确定单元,用于当所述第二判断单元的判断结果是大于时,确定所述N个字 词单元可以组合为新的字词组,然后通知所述更新模块执行将所述新的字词组加入指定词 库的步骤; 第三计算单元,用于当所述第二判断单元的判断结果是小于等于时,计算所述N 个字词单元之间的人名关联度; 第三判断单元,用于在所述第三计算单元计算出所述N个字词单元之间的人名关 本文档来自技高网...

【技术保护点】
一种获取新的字词组的方法,其特征在于,包括:获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组;当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定词库中。

【技术特征摘要】
一种获取新的字词组的方法,其特征在于,包括获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组;当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定词库中。2. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述根据计算出的所 述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组,具体包括判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义相关度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词单元不可以组合为新的字词组。3. 根据权利要求2所述的获取新的字词组的方法,其特征在于,所述语义相关度包括上下文关联度、或人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值、或预设的人名关 联度阈值;相应地,所述判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义 相关度阈值具体为判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关联度 阈值;或判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值。4. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述语义相关度包括 上下文关联度和人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人名关 联度阈值;相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单 元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新 的字词组,具体包括计算所述N个字词单元之间的上下文关联度;判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关联度 阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新的字 词组加入指定词库的步骤;否则,计算所述N个字词单元之间的人名关联度,然后判断计算 出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词 单元不可以组合为新的字词组。5. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述语义相关度包括 上下文关联度和人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人名关联度阈值;相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单 元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新 的字词组,具体包括计算所述N个字词单元之间的人名关联度;判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新的字 词组加入指定词库的步骤;否则,计算所述N个字词单元之间的上下文关联度,然后判断计 算出的所述N个字词单元之间的上下文关联度,是否大于预设的上下文关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词 单元不可以组合为新的字词组。6. 根据权利要求1至5中任一权利要求所述的获取新的字词组的方法,其特征在于,所 述获取用户连续N次输入的N个字词单元之后,计算所述N个字词单元之间的语义相关度之前还包括判断现有词库和所述指定词库中是否存在所述N个字词单元;如果所述现有词库和所述指定词库中均不存在所述N个字词单元,则执行计算所述N 个字词单元之间的语义相关度的步骤。7. —种获取新的字词组的装置,其特征在于,包括获取模块,用于获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;处理模块,用于在所述获取模块获取到N个字词单元后,计算所述N个字词单元之间 的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈 值,确定所述N个字词单元是否可以组合为新的字词组;更新模块,用于当所述处理模块确定所述N个字词单元可以组合为新的字词组时,将 所述新的字词组加入指定词库中。8. 根...

【专利技术属性】
技术研发人员:张靖
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1