预测用户待输入字的方法及装置制造方法及图纸

技术编号：14066982 阅读：137 留言：0更新日期：2016-11-28 12:58

本发明专利技术提供了一种预测用户待输入字的方法及装置，其中，所述方法包括：在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量，所述统计单元是用户输入的字中在预定标点符号之间的语义单位；根据所述已输入字的字向量预测用户待输入字的字向量；根据预测的用户待输入字的字向量查找所述字与字向量对应表，得到预测的用户待输入字；展示所述预测的用户待输入字。本发明专利技术实现了结合上下文语境预测用户待输入字，提高了所预测的用户待输入字的被命中率，从而有效提升了输入速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及输入法领域，尤其涉及一种预测用户待输入字的方法及装置。
技术介绍
输入速度是考量输入法使用性能的重要指标之一。传统的输入法都是在通过键盘接收到用户待输入字的相关字符(包括拼音或笔画等)后才可获知用户待输入字。例如，用户使用拼音输入法需要输入“我看到了花的灿烂”八个字，则只有在用户输入该八个字的全部或部分拼音(例如该八个字的拼音首字母)后，才可识别出该八个字。可见，该传统的输入法无法依据已输入的上下文，在不输入待输入字的任何字符情况下预测用户待输入字。为解决该问题，相关输入法提供了依据已输入的最近一个字，获取以该字开头的可组合的词或词组，并将该词或词组推送给用户，从而提升输入速度。上述预测用户待输入字的方法所预测的用户待输入字是以用户已输入的最近一个字开头的可组合的词或词组。虽然具有一定的命中率，但与一个字可组合的词或词组很多，由于其没有考虑上下文的语境，因此所预测的词或词组命中率不高。且对于常出现的“的”、“地”、“得”等在作为助词时其预测的词或词组命中率更低。因此，已有的预测用户待输入字的方法命中率较低，无法有效提高输入法的输入速度。
技术实现思路
本专利技术解决的技术问题之一是提供一种预测用户待输入字的方法及装置，依据上下文语境预测用户待输入字，从而有效提高输入速度。根据本专利技术一方面的一个实施例，提供了一种预测用户待输入字的方法，包括：在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量，所述统计单元是用户输入的字中在预定标点符号之间的语义单位；根据所述已输入字的字向量预测用户待输入字的字向量；根据预测的用户待输入字的字向量查找...
预测用户待输入字的方法及装置

【技术保护点】
一种预测用户待输入字的方法，其特征在于，包括：在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量，所述统计单元是用户输入的字中在预定标点符号之间的语义单位；根据所述已输入字的字向量预测用户待输入字的字向量；根据预测的用户待输入字的字向量查找所述字与字向量对应表，得到预测的用户待输入字；展示所述预测的用户待输入字。

【技术特征摘要】
1.一种预测用户待输入字的方法，其特征在于，包括：在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量，所述统计单元是用户输入的字中在预定标点符号之间的语义单位；根据所述已输入字的字向量预测用户待输入字的字向量；根据预测的用户待输入字的字向量查找所述字与字向量对应表，得到预测的用户待输入字；展示所述预测的用户待输入字。2.如权利要求1所述的方法，其特征在于，所述在字与字向量对应表中查找用户在当前统计单元中已输入字的字向量的步骤包括：在字与字向量对应表中查找用户最近输入的n个字的字向量，其中n为当前统计单元中用户已输入的字数与预定个数N中的较小者，n和N为正整数。3.如权利要求1所述的方法，其特征在于，所述根据所述已输入字的字向量预测用户待输入字的字向量的步骤包括：对所述已输入字的字向量进行预定线性变换或非线性变换，得到的结果作为预测的用户待输入字的字向量。4.如权利要求3所述的方法，其特征在于，所述根据预测的用户待输入字的字向量查找所述字与字向量对应表，得到预测的用户待输入字的步骤包括：根据预测的用户待输入字的字向量，确定该字与字向量对应表中每个字的字向量与该预测的用户待输入字的字向量的相似度；根据所述相似度预测用户待输入字。5.如权利要求4所述的方法，其特征在于，所述根据所述相似度预测用户待输入字的步骤包括：将相似度高于预定阈值的字向量所对应的字确定为预测的用户待输入字；和/或将相似度最高的指定数量个字向量所对应的字确定为预测的用户待输入字。6.如权利要求1或5所述的方法，其特征在于，所述方法还包括：响应于用户输入的筛选条件，按照所述筛选条件调整展示所述预测的用户待输入字的排序方式；和/或响应于用户输入的筛选条件，从展示的所述预测的用户待输入字中筛选出与所述筛选条件匹配的字继续展示。7.如权利要求1或3所述的方法，其特征在于，所述字与字向量对应表是通过以下方式训练得到：重复下列过程：选取由多个连续的字组成的样本；在字与字向量对应表中查找所述样本除最后一个字外的所有其它字的字向量，对于字与字向量对应表中未保存的字，则为其随机分配对应的字向量；对所述样本中除最后一个字外的所有其它字的字向量进行预定线性变换或非线性变换，得到所述最后一个字的字向量；将所述最后一个字的字向量输入语音训练模型，判断输出的结果是否与所述最后一个字相符，其中语音训练模型是预定义的用于根据输入的字向量得出该字向量对应的字的机器学习模型；若不相符，则调整所述除最后一个字外的所有其它字的字向量，直到输出结果与所述最后一个字相符为止；利用调整后的除最后一个字外的所有其它字的字向量更新所述字与字向量对应表中所述除最后一个字外的所有其它字的字向量。8.一种预...

【专利技术属性】
技术研发人员：李齐周，操颖平，盛子夏，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人