一种基于动态权重进行信息输入的方法及系统技术方案

技术编号:26478080 阅读:21 留言:0更新日期:2020-11-25 19:21
本发明专利技术公开了一种基于动态权重进行信息输入的方法和系统,权重方法包括:将同时存在于第一历和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。

【技术实现步骤摘要】
一种基于动态权重进行信息输入的方法及系统
本专利技术涉及信息
,并且更具体地,涉及一种基于动态权重进行信息输入的方法及系统。
技术介绍
目前,随着互联网技术的不断进步以及移动终端性能的不断提升,移动终端所具备的功能越来越多。通常情况下,信息输入功能是移动终端中非常重要的功能。例如,信息输入功能可以用于移动终端内的即时通讯应用、购物应用和文档处理应用等。因为需要被频繁使用,所以信息输入功能也被寄予了更高的期望,如输入的快捷性、准确率、效率等等。在现有技术中,当用户希望通过移动终端进行信息输入时,通常需要输入一些字符,而移动终端中的信息输入应用会根据这些字符来确定多个词语并将这些词语进行提供或呈现以供用户选择。然而,在现有技术中,通常是基于固定的顺序或用户的输入习惯来确定多个词语的顺序。这种方式无法满足用户需求,这是因为这种方法无法根据动态信息来实时修改多个词语的顺序。
技术实现思路
根据本专利技术的一个方面,提供一种基于动态权重进行信息输入的方法,所述方法包括:获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。在获取第一时间区间内的第一历史输入信息集之前还包括:根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。其中至少一个词语同时属于多个信息集合;所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;根据预先设置的输入规则为每个信息集合确定基础权重包括:根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。所述第一时间区间包括时间上连续的第一预定数量的自然日。确定每个词语所归属的信息集合包括:确定每个词语所归属的至少一个信息集合。确定每个信息集合所涉及的所有词语的第一输入次数的总和包括:确定每个信息集合所涉及的所有词语;统计所有词语中每个词语的第一输入次数;将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括:获取每个信息集合所涉及的所有词语的第一输入次数的总和CAi,其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量;第i个信息集合的第一权重调整因子wmi为:基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括:获取每个信息集合的第一权重调整因子wmi;获取每个信息集合的基础权重wbi;确定每个信息集合的初始权重wti=wbi×(1+wmi)。所述第二时间区间包括时间上连续的第二预定数量的自然日,其中,所述第二预定数量小于所述第一预定数量,或者第二预定数量的自然日是所述第一预定数量的自然日的子集。所述基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括:确定每个目标词语的第一输入次数CFy;确定每个目标词语的第二输入次数CSy;每个目标词语的权重系数其中y为自然数并且1≤y≤Nw,其中Nw为目标词语的数量。所述阈值为1、0.9、0.8、0.6或0.5。所述根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括:获取每个权重词语的第二输入次数CSj,确定每个权重词语的动态系数为:其中j为自然数并且1≤j≤Nm,其中Nm为权重词语的数量。其中根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:确定每个权重词语所归属的信息集合,并将具有至少一个权重词语的信息集合确定为权重信息集合;确定每个权重信息集合所包括的至少一个权重词语;根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。其中根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数Fpq,其中Fpq为第p个权重信息集合中第q个权重词语的动态系数;获取每个权重信息集合的初始权重wtp;确定每个权重信息集合的动态权重Fwp=wtp×(1+Fp1/1+Fp2/2+Fp3/3+…+Fpq/q),其中p和q为自然数并且1≤p≤Nk,1≤q≤kp,Nk为权重信息集合的数量,并且kp为第p个权重信息集合的权重词语的数量。其中利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括:将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重;基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括:确定每个待选词语与所述字符的内容关联度Crv;基于每个待选词语的词语权重Wv和与所述字符的内容关联度Crv确定每个待选词语与所述字符的经过修改的内容关联度CLrv=Crv×(1+Wv);其中,v为自然数并且1≤v≤No,No为待选词语的数量。根据本专利技术的另一方面,提供一种基于动态权重进行信息输入的系统,所述系统包括:获取装置,获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多本文档来自技高网...

【技术保护点】
1.一种基于动态权重进行信息输入的方法,所述方法包括:/n获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;/n确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;/n获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;/n将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;/n根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;/n当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。/n...

【技术特征摘要】
1.一种基于动态权重进行信息输入的方法,所述方法包括:
获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;
确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;
获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;
将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;
根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;
当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。


2.根据权利要求1所述的方法,在获取第一时间区间内的第一历史输入信息集之前还包括:
根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。


3.根据权利要求2所述的方法,其中至少一个词语同时属于多个信息集合;
所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;
根据预先设置的输入规则为每个信息集合确定基础权重包括:
根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。


4.根据权利要求1所述的方法,所述第一时间区间包括时间上连续的第一预定数量的自然日。


5.根据权利要求1所述的方法,确定每个词语所归属的信息集合包括:确定每个词语所归属的至少一个信息集合。


6...

【专利技术属性】
技术研发人员:宝音
申请(专利权)人:北京语言大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1