信息处理方法和装置,存储介质和电子设备制造方法及图纸

技术编号:21477839 阅读:34 留言:0更新日期:2019-06-29 04:52
本公开的目的是提供一种信息处理方法和装置,存储介质和电子设备,以解决相关技术中预测题库中问卷题目的使用次数信息不够精准的问题。包括:获取包括用户历史使用的问卷题目以及使用次数信息的样本数据;使用样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型,得到对目标用户历史使用的问卷题目的次数预测信息;根据次数预测信息,以及样本数据中目标用户历史使用问卷题目的真实次数信息,计算预测模型的损失函数;并根据损失函数更新预测模型中的学习因子,使得损失函数的计算结果减小;根据更新后的满足预设条件的学习因子确定目标预测模型。

【技术实现步骤摘要】
信息处理方法和装置,存储介质和电子设备
本公开涉及信息处理
,具体地,涉及一种信息处理方法和装置,存储介质和电子设备。
技术介绍
随着信息技术的发展,很多业务都需要问卷来调查统计数据。数据种类更加多样,问卷的复杂程度有所提升。一般情况下,问卷由多道问卷题目组成,复杂的问卷中包括更加多样的问卷题目。相关技术中,用户在创建填写问卷考题时可以通过选择题库中的问卷题目,直接创建问卷。在题库中问卷题目较少时,用户可以遍历这些问卷题目,挑选并组合所需的问卷题目组合生成问卷。随着题库中问卷题目不断补充,在为用户提供更多选择的同时,也给用户带来了“选择困难”的问题。为了便于用户挑选问卷题目,可以根据用户历史对问卷题目的使用次数,向用户推荐问卷题目。对于题库中使用次数未知的问卷题目,可以根据已有的使用次数信息,通过一元线性方法对问卷题目未知的使用次数信息进行预测。
技术实现思路
本公开的目的是提供一种信息处理方法和装置,存储介质和电子设备,以解决相关技术中预测题库中问卷题目的使用次数信息不够精准的问题。为了实现上述目的,第一方面,本公开提供一种信息处理方法,包括:获取样本数据,所述样本数据包括用户历史使用的问卷题目以及使用次数信息;针对每一目标用户,使用所述样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型进行问卷题目兴趣度预测,得到对所述目标用户历史使用的问卷题目的次数预测信息,所述预测模型包括学习因子;根据所述次数预测信息,以及所述样本数据中所述目标用户历史使用问卷题目的真实次数信息,计算所述预测模型的损失函数;根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小;根据更新后的满足预设条件的学习因子确定目标预测模型,所述目标预测模型用于根据所述样本数据计算任一所述用户未使用过的问卷题目的次数预测信息。可选的,所述针对每一目标用户,使用所述样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型进行问卷题目兴趣度预测,得到对所述目标用户历史使用的问卷题目的次数预测信息,所述预测模型包括学习因子,包括:通过以下公式得到对所述目标用户历史使用的问卷题目i的次数预测信息Preui:其中,j表示问卷题目集合P中除所述问卷题目i以外的任一问卷题目;Preui表示对应所述目标用户u对问卷题目i的所述次数预测信息;Ruj表示所述目标用户u对问卷题目j的历史使用次数;Nij表示所述样本数据中,用户集合Q中除所述目标用户u的所述其他用户u′历史使用的问卷题目中问卷题目i和问卷题目j均存在的交集样本数量;TWij表示关联问卷题目i和问卷题目j的权重值;Devij表示所述样本数据中,所述其他用户u′对问卷题目i的使用次数和问卷题目j使用次数之差的均值,即:Ru′i表示任一所述其他用户u′对问卷题目i的历史使用次数;Ru′j表示任一所述其他用户u′对问卷题目j的历史使用次数;βij表示关联问卷题目i和问卷题目j的学习因子。可选的,根据所述次数预测信息,以及所述样本数据中所述目标用户历史使用问卷题目的真实次数信息,计算所述预测模型的损失函数,包括:通过以下公式表达所述损失函数Loss:其中,Ruj表示所述目标用户u对问卷题目j的历史使用次数。可选的,所述方法还包括:通过如下公式计算所述关联问卷题目i和问卷题目j的权重值TWij:TWij=Nij×Simij其中,Simij表示问卷题目i和问卷题目j之间的相似度。可选的,所述根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小,包括:计算所述损失函数对所述学习因子的梯度值;将所述梯度值与所述学习因子之和作为所述预测模型中的新的学习因子,使得在新的学习因子下所述损失函数的计算结果减小。可选的,所述根据更新后的满足预设条件的学习因子确定目标预测模型,包括:在对所述学习因子的更新次数达到预设阈值,和/或,所述损失函数的计算结果收敛时,将包括最近一次更新得到的学习因子的预测模型作为所述目标预测模型。可选的,所述方法还包括:将所述样本数据输入所述目标预测模型,计算任一所述用户未使用过的问卷题目的次数预测信息;根据所述次数预测信息向所述用户推荐所述用户未使用过的问卷题目。第二方面,本公开提供一种信息处理装置,包括:获取模块,用于获取样本数据,所述样本数据包括用户历史使用的问卷题目以及使用次数信息;预测模块,用于针对每一目标用户,使用所述样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型进行问卷题目兴趣度预测,得到对所述目标用户历史使用的问卷题目的次数预测信息,所述预测模型包括学习因子;计算模块,用于根据所述次数预测信息,以及所述样本数据中所述目标用户历史使用问卷题目的真实次数信息,计算所述预测模型的损失函数;更新模块,用于根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小;确定模块,用于根据更新后的满足预设条件的学习因子确定目标预测模型,所述目标预测模型用于根据所述样本数据计算任一所述用户未使用过的问卷题目的次数预测信息。可选的,所述预测模块,用于:通过以下公式得到对所述目标用户历史使用的问卷题目i的次数预测信息Preui:其中,j表示问卷题目集合P中除所述问卷题目i以外的任一问卷题目;Preui表示对应所述目标用户u对问卷题目i的所述次数预测信息;Ruj表示所述目标用户u对问卷题目j的历史使用次数;Nij表示所述样本数据中,用户集合Q中除所述目标用户u的所述其他用户u′历史使用的问卷题目中问卷题目i和问卷题目j均存在的交集样本数量;TWij表示关联问卷题目i和问卷题目j的权重值;Devij表示所述样本数据中,所述其他用户u′对问卷题目i的使用次数和问卷题目j使用次数之差的均值,即:Ru′i表示任一所述其他用户u′对问卷题目i的历史使用次数;Ru′j表示任一所述其他用户u′对问卷题目j的历史使用次数;βij表示关联问卷题目i和问卷题目j的学习因子。可选的,所述计算模块,用于:通过以下公式表达所述损失函数Loss:其中,Ruj表示所述目标用户u对问卷题目j的历史使用次数。可选的,所述计算模块,还用于:通过如下公式计算所述关联问卷题目i和问卷题目j的权重值TWij:TWij=Nij×Simij其中,Simij表示问卷题目i和问卷题目j之间的相似度。可选的,所述更新模块用于:计算所述损失函数对所述学习因子的梯度值;将所述梯度值与所述学习因子之和作为所述预测模型中的新的学习因子,使得在新的学习因子下所述损失函数的计算结果减小。可选的,所述确定模块用于:在对所述学习因子的更新次数达到预设阈值,和/或,所述损失函数的计算结果收敛时,将包括最近一次更新得到的学习因子的预测模型作为所述目标预测模型。可选的,所述装置还包括推荐模块,用于:将所述样本数据输入所述目标预测模型,计算任一所述用户未使用过的问卷题目的次数预测信息;根据所述次数预测信息向所述用户推荐所述用户未使用过的问卷题目。第三方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述信息处理方法的步骤。第四方面,本公开提供一种电子设备,包括:存本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,包括:获取样本数据,所述样本数据包括用户历史使用的问卷题目以及使用次数信息;针对每一目标用户,使用所述样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型进行问卷题目兴趣度预测,得到对所述目标用户历史使用的问卷题目的次数预测信息,所述预测模型包括学习因子;根据所述次数预测信息,以及所述样本数据中所述目标用户历史使用问卷题目的真实次数信息,计算所述预测模型的损失函数;根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小;根据更新后的满足预设条件的学习因子确定目标预测模型,所述目标预测模型用于根据所述样本数据计算任一所述用户未使用过的问卷题目的次数预测信息。

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取样本数据,所述样本数据包括用户历史使用的问卷题目以及使用次数信息;针对每一目标用户,使用所述样本数据中其他用户历史使用的问卷题目以及问卷题目使用次数通过预测模型进行问卷题目兴趣度预测,得到对所述目标用户历史使用的问卷题目的次数预测信息,所述预测模型包括学习因子;根据所述次数预测信息,以及所述样本数据中所述目标用户历史使用问卷题目的真实次数信息,计算所述预测模型的损失函数;根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小;根据更新后的满足预设条件的学习因子确定目标预测模型,所述目标预测模型用于根据所述样本数据计算任一所述用户未使用过的问卷题目的次数预测信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述损失函数更新所述预测模型中的学习因子,使得在新的学习因子下所述损失函数的计算结果减小,包括:计算所述损失函数对所述学习因子的梯度值;将所述梯度值与所述学习因子之和作为所述预测模型中的新的学习因子,使得在新的学习因子下所述损失函数的计算结果减小。3.根据权利要求1所述的方法,其特征在于,所述根据更新后的满足预设条件的学习因子确定目标预测模型,包括:在对所述学习因子的更新次数达到预设阈值,和/或,所述损失函数的计算结果收敛时,将包括最近一次更新得到的学习因子的预测模型作为所述目标预测模型。4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:将所述样本数据输入所述目标预测模型,计算任一所述用户未使用过的问卷题目的次数预测信息;根据所述次数预测信息向所述用户推荐所述用户未使用过的问卷题目。5.一种信息处理装置,其特征在于,包括:获取模块,用于获取样本数据,所述样本数据包括用户历史使用的问卷题目以及使用次数...

【专利技术属性】
技术研发人员:肖健刘作坤
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1