【技术实现步骤摘要】
本专利技术涉及输入法
,特别涉及一种获取新的字词组的方法和装置。
技术介绍
随着计算机通信技术的快速发展,计算机已逐渐成为人们日常生活和工作中不可 缺少的工具,在使用计算机的过程中,用户通过使用输入法系统,实现将字词输入计算机 中。 输入法系统是运行于计算机操作系统上的一个工具软件,可以将用户通过键盘输入的编码转换成字或词输入计算机。在现有的输入法系统中,为每一个字或词设定有相应的编码,并将每一个字或词及其相应的编码存储在输入法系统中的词库中,用户在使用输入法系统进行输入时,只要输入相应的编码就能获得所需的字或词。 然而,在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下缺点 用户在使用输入法系统输入字或词的过程中,经常需要输入一些复合词、人名之类的词语;而现有输入法系统自带的词库中没有包括这类词语,使得用户在需要输入这类词语时,只能拆开按字或单纯词一个一个进行输入,影响了输入速度。
技术实现思路
为了提高用户的输入速度,本专利技术实施例提供了一种获取新的字词组的方法和装 置。所述技术方案如下 —方面,本专利技术实施例提供了一种获取新的字词组的方法,包括 获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数; 计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组; 当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定 词库中。 进一步地,所述根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所 ...
【技术保护点】
一种获取新的字词组的方法,其特征在于,包括:获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组;当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定词库中。
【技术特征摘要】
一种获取新的字词组的方法,其特征在于,包括获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组;当确定所述N个字词单元可以组合为新的字词组时,将所述新的字词组加入指定词库中。2. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述根据计算出的所 述N个字词单元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新的字词组,具体包括判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义相关度阈值; 如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词单元不可以组合为新的字词组。3. 根据权利要求2所述的获取新的字词组的方法,其特征在于,所述语义相关度包括上下文关联度、或人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值、或预设的人名关 联度阈值;相应地,所述判断计算出的所述N个字词单元之间的语义相关度是否大于预设的语义 相关度阈值具体为判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关联度 阈值;或判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值。4. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述语义相关度包括 上下文关联度和人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人名关 联度阈值;相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单 元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新 的字词组,具体包括计算所述N个字词单元之间的上下文关联度;判断计算出的所述N个字词单元之间的上下文关联度是否大于预设的上下文关联度 阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新的字 词组加入指定词库的步骤;否则,计算所述N个字词单元之间的人名关联度,然后判断计算 出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词 单元不可以组合为新的字词组。5. 根据权利要求1所述的获取新的字词组的方法,其特征在于,所述语义相关度包括 上下文关联度和人名关联度;相应地,所述预设的语义相关度阈值包括预设的上下文关联度阈值和预设的人名关联度阈值;相应地,所述计算所述N个字词单元之间的语义相关度,根据计算出的所述N个字词单 元之间的语义相关度和预设的语义相关度阈值,确定所述N个字词单元是否可以组合为新 的字词组,具体包括计算所述N个字词单元之间的人名关联度;判断计算出的所述N个字词单元之间的人名关联度是否大于预设的人名关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组,然后执行将所述新的字 词组加入指定词库的步骤;否则,计算所述N个字词单元之间的上下文关联度,然后判断计 算出的所述N个字词单元之间的上下文关联度,是否大于预设的上下文关联度阈值;如果大于,则确定所述N个字词单元可以组合为新的字词组;否则,确定所述N个字词 单元不可以组合为新的字词组。6. 根据权利要求1至5中任一权利要求所述的获取新的字词组的方法,其特征在于,所 述获取用户连续N次输入的N个字词单元之后,计算所述N个字词单元之间的语义相关度之前还包括判断现有词库和所述指定词库中是否存在所述N个字词单元;如果所述现有词库和所述指定词库中均不存在所述N个字词单元,则执行计算所述N 个字词单元之间的语义相关度的步骤。7. —种获取新的字词组的装置,其特征在于,包括获取模块,用于获取用户连续N次输入的N个字词单元,所述N为大于等于2的自然数;处理模块,用于在所述获取模块获取到N个字词单元后,计算所述N个字词单元之间 的语义相关度,根据计算出的所述N个字词单元之间的语义相关度和预设的语义相关度阈 值,确定所述N个字词单元是否可以组合为新的字词组;更新模块,用于当所述处理模块确定所述N个字词单元可以组合为新的字词组时,将 所述新的字词组加入指定词库中。8. 根...
【专利技术属性】
技术研发人员:张靖,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。