预测用户待输入字的方法及装置制造方法及图纸

技术编号:14066982 阅读:128 留言:0更新日期:2016-11-28 12:58
本发明专利技术提供了一种预测用户待输入字的方法及装置,其中,所述方法包括:在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量,所述统计单元是用户输入的字中在预定标点符号之间的语义单位;根据所述已输入字的字向量预测用户待输入字的字向量;根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字;展示所述预测的用户待输入字。本发明专利技术实现了结合上下文语境预测用户待输入字,提高了所预测的用户待输入字的被命中率,从而有效提升了输入速度。

【技术实现步骤摘要】

本专利技术涉及输入法领域,尤其涉及一种预测用户待输入字的方法及装置
技术介绍
输入速度是考量输入法使用性能的重要指标之一。传统的输入法都是在通过键盘接收到用户待输入字的相关字符(包括拼音或笔画等)后才可获知用户待输入字。例如,用户使用拼音输入法需要输入“我看到了花的灿烂”八个字,则只有在用户输入该八个字的全部或部分拼音(例如该八个字的拼音首字母)后,才可识别出该八个字。可见,该传统的输入法无法依据已输入的上下文,在不输入待输入字的任何字符情况下预测用户待输入字。为解决该问题,相关输入法提供了依据已输入的最近一个字,获取以该字开头的可组合的词或词组,并将该词或词组推送给用户,从而提升输入速度。上述预测用户待输入字的方法所预测的用户待输入字是以用户已输入的最近一个字开头的可组合的词或词组。虽然具有一定的命中率,但与一个字可组合的词或词组很多,由于其没有考虑上下文的语境,因此所预测的词或词组命中率不高。且对于常出现的“的”、“地”、“得”等在作为助词时其预测的词或词组命中率更低。因此,已有的预测用户待输入字的方法命中率较低,无法有效提高输入法的输入速度。
技术实现思路
本专利技术解决的技术问题之一是提供一种预测用户待输入字的方法及装置,依据上下文语境预测用户待输入字,从而有效提高输入速度。根据本专利技术一方面的一个实施例,提供了一种预测用户待输入字的方法,包括:在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量,所述统计单元是用户输入的字中在预定标点符号之间的语义单位;根据所述已输入字的字向量预测用户待输入字的字向量;根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字;展示所述预测的用户待输入字。可选地,所述在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量的步骤包括:在字与字向量对应表中查找用户最近输入的n个字的字向量,其中n为当前统计单元中用户已输入的字数与预定个数N中的较小者,n和N为正整数。可选地,所述根据所述已输入字的字向量预测用户待输入字的字向量的步骤包括:对所述已输入字的字向量进行预定线性变换或非线性变换,得到的结果作为预测的用户待输入字的字向量。可选地,所述根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字的步骤包括:根据预测的用户待输入字的字向量,确定该字与字向量对应表中每个字的字向量与该预测的用户待输入字的字向量的相似度;根据所述相似度预测用户待输入字。可选地,所述根据所述相似度预测用户待输入字的步骤包括:将相似度高于预定阈值的字向量所对应的字确定为预测的用户待输入字;和/或将相似度最高的指定数量个字向量所对应的字确定为预测的用户待输入字。可选地,所述方法还包括:响应于用户输入的筛选条件,按照所述筛选条件调整展示所述预测的
用户待输入字的排序方式;和/或响应于用户输入的筛选条件,从展示的所述预测的用户待输入字中筛选出与所述筛选条件匹配的字继续展示。可选地,所述字与字向量对应表是通过以下方式训练得到:重复下列过程:选取由多个连续的字组成的样本;在字与字向量对应表中查找所述样本除最后一个字外的所有其它字的字向量,对于字与字向量对应表中未保存的字,则为其随机分配对应的字向量;对所述样本中除最后一个字外的所有其它字的字向量进行预定线性变换或非线性变换,得到所述最后一个字的字向量;将所述最后一个字的字向量输入语音训练模型,判断输出的结果是否与所述最后一个字相符,其中语音训练模型是预定义的用于根据输入的字向量得出该字向量对应的字的机器学习模型;若不相符,则调整所述除最后一个字外的所有其它字的字向量,直到输出结果与所述最后一个字相符为止;利用调整后的除最后一个字外的所有其它字的字向量更新所述字与字向量对应表中所述除最后一个字外的所有其它字的字向量。根据本专利技术另一方面的一个实施例,提供了一种预测用户待输入字的装置,包括:已输入字的字向量查找单元,用于在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量,所述统计单元是用户输入的字中在预定标点符号之间的语义单位;待输入字的字向量预测单元,用于根据所述已输入字的字向量预测用户待输入字的字向量;待输入字预测单元,用于根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字;展示单元,用于展示所述预测的用户待输入字。可选地,所述已输入字的字向量查找单元用于:在字与字向量对应表中查找用户最近输入的n个字的字向量,其中n为当前统计单元中用户已输入的字数与预定个数N中的较小者,n和N为正整数。可选地,所述待输入字的字向量预测单元用于:对所述已输入字的字向量进行预定线性变换或非线性变换,得到的结果作为预测的用户待输入字的字向量。可选地,所述待输入字预测单元包括:相似度确定子单元,用于根据预测的用户待输入字的字向量,确定该字与字向量对应表中每个字的字向量与该预测的用户待输入字的字向量的相似度;待输入字预测子单元,用于根据所述相似度预测用户待输入字。可选地,所述待输入字预测子单元用于:将相似度高于预定阈值的字向量所对应的字确定为预测的用户待输入字;和/或将相似度最高的指定数量个字向量所对应的字确定为预测的用户待输入字。可选地,所述装置还包括:展示调整单元,用于响应于用户输入的筛选条件,按照所述筛选条件调整展示所述预测的用户待输入字的排序方式;和/或响应于用户输入的筛选条件,从展示的所述预测的用户待输入字中筛选出与所述筛选条件匹配的字继续展示。可选地,所述字与字向量对应表是通过以下方式训练得到:重复下列过程:选取由多个连续的字组成的样本;在字与字向量对应表中查找所述样本除最后一个字外的所有其它字的字向量,对于字与字向量对应表中未保存的字,则为其随机分配对应的字向量;对所述样本中除最后一个字外的所有其它字的字向量进行预定线性变换或非线性变换,得到所述最后一个字的字向量;将所述最后一个字的字向量输入语音训练模型,判断输出的结果是否与所述最后一个字相符,其中语音训练模型是预定义的用于根据输入的字向量得出该字向量对应的字的机器学习模型;若不相符,则调整所述除最后一个字外的所有其它字的字向量,直到输出结果与所述最后一个字相符为止;利用调整后的除最后一个字外的所有其它字的字向量更新所述字与字向量对应表中所述除最后一个字外的所有其它字的字向量。本申请实施例根据用户已输入字的字向量预测用户待输入字的字向量,并根据用户待输入字的字向量查找训练得到的字与字向量对应表,得到预测的用户待输入字,并展示预测的用户待输入字,使得用户可从展示的用户待输入字中直接选择实际要输入字。实现了结合上下文语境预测用户待输入字,提高了所预测的用户待输入字的被命中率,从而有效提升了输入速度。本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本专利技术并不仅限于这些实施例。而是,本专利技术的范围是广泛的,且意在仅通过后附的权利要求限定本专利技术的范围。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是根据本专利技术一个实施例的训练得到字与字向量对应表的方法的流程图。图2是根据本专利技术一个实施例的预测用户待输入字的方法的流程图。本文档来自技高网
...
预测用户待输入字的方法及装置

【技术保护点】
一种预测用户待输入字的方法,其特征在于,包括:在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量,所述统计单元是用户输入的字中在预定标点符号之间的语义单位;根据所述已输入字的字向量预测用户待输入字的字向量;根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字;展示所述预测的用户待输入字。

【技术特征摘要】
1.一种预测用户待输入字的方法,其特征在于,包括:在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量,所述统计单元是用户输入的字中在预定标点符号之间的语义单位;根据所述已输入字的字向量预测用户待输入字的字向量;根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字;展示所述预测的用户待输入字。2.如权利要求1所述的方法,其特征在于,所述在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量的步骤包括:在字与字向量对应表中查找用户最近输入的n个字的字向量,其中n为当前统计单元中用户已输入的字数与预定个数N中的较小者,n和N为正整数。3.如权利要求1所述的方法,其特征在于,所述根据所述已输入字的字向量预测用户待输入字的字向量的步骤包括:对所述已输入字的字向量进行预定线性变换或非线性变换,得到的结果作为预测的用户待输入字的字向量。4.如权利要求3所述的方法,其特征在于,所述根据预测的用户待输入字的字向量查找所述字与字向量对应表,得到预测的用户待输入字的步骤包括:根据预测的用户待输入字的字向量,确定该字与字向量对应表中每个字的字向量与该预测的用户待输入字的字向量的相似度;根据所述相似度预测用户待输入字。5.如权利要求4所述的方法,其特征在于,所述根据所述相似度预测用户待输入字的步骤包括:将相似度高于预定阈值的字向量所对应的字确定为预测的用户待输入字;和/或将相似度最高的指定数量个字向量所对应的字确定为预测的用户待输入字。6.如权利要求1或5所述的方法,其特征在于,所述方法还包括:响应于用户输入的筛选条件,按照所述筛选条件调整展示所述预测的用户待输入字的排序方式;和/或响应于用户输入的筛选条件,从展示的所述预测的用户待输入字中筛选出与所述筛选条件匹配的字继续展示。7.如权利要求1或3所述的方法,其特征在于,所述字与字向量对应表是通过以下方式训练得到:重复下列过程:选取由多个连续的字组成的样本;在字与字向量对应表中查找所述样本除最后一个字外的所有其它字的字向量,对于字与字向量对应表中未保存的字,则为其随机分配对应的字向量;对所述样本中除最后一个字外的所有其它字的字向量进行预定线性变换或非线性变换,得到所述最后一个字的字向量;将所述最后一个字的字向量输入语音训练模型,判断输出的结果是否与所述最后一个字相符,其中语音训练模型是预定义的用于根据输入的字向量得出该字向量对应的字的机器学习模型;若不相符,则调整所述除最后一个字外的所有其它字的字向量,直到输出结果与所述最后一个字相符为止;利用调整后的除最后一个字外的所有其它字的字向量更新所述字与字向量对应表中所述除最后一个字外的所有其它字的字向量。8.一种预...

【专利技术属性】
技术研发人员:李齐周操颖平盛子夏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1