用户生理期预测方法、装置、设备及存储介质制造方法及图纸

技术编号:30320288 阅读:24 留言:0更新日期:2021-10-09 23:34
本发明专利技术涉及大数据领域,公开了一种用户生理期预测方法、装置、设备及存储介质。本方法包括:获取待匹配的目标用户数据,采用预置数据处理算法对生理周期特征数据进行数据清洗,得到目标用户的目标生理周期特征数据;对目标用户的目标生理周期特征数据进行向量化处理,得到目标用户对应的生理周期特征词向量;基于生理周期特征词向量,计算目标用户数据与预置生理周期特征数据库中每一历史用户数据之间的马氏距离;根据马氏距离进行排序,并根据排序结果确定目标用户数据对应匹配的生理周期数据组群;根据生理周期数据组群对应的生理周期特征数据,对目标用户的生理期进行精准预测。解决了经期预测准确率低的技术问题,提升了业务价值。务价值。务价值。

【技术实现步骤摘要】
用户生理期预测方法、装置、设备及存储介质


[0001]本专利技术涉及大数据领域,尤其涉及一种用户生理期预测方法、装置、设备及存储介质。

技术介绍

[0002]经期管理是常见工具类App,可完成经期、体重、体温等信息的记录。其中经期推测是其最主要的功能。经期日历是其主要交互形式。
[0003]常见此类App中经期日历因算法性能、同步策略、代码实现等原因,日历的经期预测都存在各种问题。因此,通过用户行为相似度对用户的生理周期数据进行分析处理,提高用户生理期预测准确率成了本领域技术人员需要解决的技术问题。

技术实现思路

[0004]本专利技术基于用户行为相似度对用户的生理周期数据进行分析处理,解决了目前用户生理期预测准确率低的技术问题。
[0005]本专利技术第一方面提供了一种用户生理期预测方法,包括:获取待匹配的目标用户数据,其中,所述目标用户数据包括目标用户的生理周期特征数据;采用预置数据处理算法对所述生理周期特征数据进行数据清洗,得到所述目标用户的目标生理周期特征数据;对所述目标用户的目标生理周期特征数据进行向量化处理,得到所述目标用户对应的生理周期特征词向量;基于所述生理周期特征词向量,计算所述目标用户数据与预置生理周期特征数据库中每一历史用户数据之间的马氏距离;根据所述马氏距离进行排序,并根据排序结果确定所述目标用户数据对应匹配的生理周期数据组群,其中,所述生理周期数据组群分别包含不同的生理周期特征数据;根据所述生理周期数据组群对应的生理周期特征数据,对所述目标用户的生理期进行精准预测。
[0006]可选地,在本专利技术第一方面的第一种实现方式中,在所述获取待匹配的目标用户数据之前,包括:获取包含历史用户生理周期特征数据的样本数据;基于所述样本数据的类型,对所述样本数据进行预处理,得到离散化词向量;基于所述离散化词向量,采用余弦相似度算法计算所述历史用户之间的生理周期特征相似度;基于所述相似度,对所述历史用户进行聚类,得到生理周期特征相似的生理周期数据组群。
[0007]可选地,在本专利技术第一方面的第二种实现方式中,所述基于所述相似度,对所述历史用户进行聚类,得到生理周期特征相似的生理周期数据组群包括:设定分群个数为k,随机选取k个历史用户对应生理周期数据作为初始聚类中心;基于所述相似度的值,选取各历史用户对应的最大的相似度值,并将各历史用户划入与最大的相似度值对应的聚类中心所在组群中,直至将所述历史用户划分完毕,得到分群结果。
[0008]可选地,在本专利技术第一方面的第三种实现方式中,所述采用预置数据处理算法对所述生理周期特征数据进行数据清洗,得到所述目标用户的目标生理周期特征数据包括:接收数据清洗请求,其中,所述数据清洗请求包括按照预设特征提取算法的数据格式对所
述用户行为数据进行数据清洗;根据所述数据清洗请求,确定数据清洗规则,其中,所述数据清洗规则包括:清洗特征因子和所述清洗特征因子满足的清洗条件;确定所述清洗特征因子对应的特征因子值;根据所述数据清洗规则和所述特征因子值,采用预置数据处理算法对所述生理周期特征数据进行清洗,得到目标生理周期特征数据。
[0009]可选地,在本专利技术第一方面的第四种实现方式中,所述根据所述马氏距离进行排序,并根据排序结果确定所述目标用户数据对应匹配的生理周期数据组群包括:对所述各马氏距离进行排序,获得排序结果;基于所述排序结果,确定所述目标用户数据对应匹配的用户组群,其中,所述用户组群分别包含不同用户行为数据对应的生理周期预测信息。
[0010]可选地,在本专利技术第一方面的第五种实现方式中,在所述根据所述生理周期数据组群对应的生理周期特征数据,对所述目标用户的生理期进行精准预测之后,还包括:当用户主动修改用户数据时,将修改后的用户数据同步至预置用户数据信息,并对所述用户对应的生理周期时间进行校正。
[0011]可选地,在本专利技术第一方面的第六种实现方式中,所述根据所述生理周期数据组群对应的生理周期特征数据,对所述目标用户的生理期进行精准预测包括:
[0012]获取所述生理周期数据组群中包含的生理周期数据;
[0013]对所述生理周期数据进行特征提取,得到所述生理周期数据对应的生理周期特征数据;
[0014]根据所述生理周期特征数据,对所述目标用户的生理期进行精准预测。
[0015]本专利技术第二方面提供了一种用户生理期预测装置,包括:第一获取模块,用于获取待匹配的目标用户数据,其中,所述目标用户数据包括目标用户的生理周期特征数据;数据清洗模块,用于采用预置数据处理算法对所述生理周期特征数据进行数据清洗,得到所述目标用户的目标生理周期特征数据;向量化处理模块,用于对所述目标用户的目标生理周期特征数据进行向量化处理,得到所述目标用户对应的生理周期特征词向量;第一计算模块,用于基于所述生理周期特征词向量,计算所述目标用户数据与预置生理周期特征数据库中每一历史用户数据之间的马氏距离;确定模块,用于根据所述马氏距离进行排序,并根据排序结果确定所述目标用户数据对应匹配的生理周期数据组群,其中,所述生理周期数据组群分别包含不同的生理周期特征数据;预测模块,用于根据所述生理周期数据组群对应的生理周期特征数据,对所述目标用户的生理期进行精准预测。
[0016]可选地,在本专利技术第二方面的第一种实现方式中,所述用户生理期预测装置还包括:第二获取模块,用于获取包含历史用户生理周期特征数据的样本数据;预处理模块,用于基于所述样本数据的类型,对所述样本数据进行预处理,得到离散化词向量;第二计算模块,用于基于所述离散化词向量,采用余弦相似度算法计算所述历史用户之间的生理周期特征相似度;聚类模块,用于基于所述相似度,对所述历史用户进行聚类,得到生理周期特征相似的生理周期数据组群。
[0017]可选地,在本专利技术第二方面的第二种实现方式中,所述聚类模块具体用于:设定分群个数为k,随机选取k个历史用户对应生理周期数据作为初始聚类中心;基于所述相似度的值,选取各历史用户对应的最大的相似度值,并将各历史用户划入与最大的相似度值对应的聚类中心所在组群中,直至将所述历史用户划分完毕,得到分群结果。
[0018]可选地,在本专利技术第二方面的第三种实现方式中,所述数据清洗模块具体用于:接
收数据清洗请求,其中,所述数据清洗请求包括按照预设特征提取算法的数据格式对所述用户行为数据进行数据清洗;根据所述数据清洗请求,确定数据清洗规则,其中,所述数据清洗规则包括:清洗特征因子和所述清洗特征因子满足的清洗条件;确定所述清洗特征因子对应的特征因子值;根据所述数据清洗规则和所述特征因子值,采用预置数据处理算法对所述生理周期特征数据进行清洗,得到目标生理周期特征数据。
[0019]可选地,在本专利技术第二方面的第四种实现方式中,所述确定模块包括:排序单元,用于对所述各马氏距离进行排序,获得排序结果;确定单元,用于基于所述排序结果,确定所述目标用户数据对应匹配的用户组群,其中,所述用户组群分别包含不同用户行为数据对应的生理周期预测信息。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户生理期预测方法,其特征在于,所述用户生理期预测方法包括:获取待匹配的目标用户数据,其中,所述目标用户数据包括目标用户的生理周期特征数据;采用预置数据处理算法对所述生理周期特征数据进行数据清洗,得到所述目标用户的目标生理周期特征数据;对所述目标用户的目标生理周期特征数据进行向量化处理,得到所述目标用户对应的生理周期特征词向量;基于所述生理周期特征词向量,计算所述目标用户数据与预置生理周期特征数据库中每一历史用户数据之间的马氏距离;根据所述马氏距离进行排序,并根据排序结果确定所述目标用户数据对应匹配的生理周期数据组群,其中,所述生理周期数据组群分别包含不同的生理周期特征数据;根据所述生理周期数据组群对应的生理周期特征数据,对所述目标用户的生理期进行精准预测。2.根据权利要求1所述的用户生理期预测方法,其特征在于,在所述获取待匹配的目标用户数据之前,包括:获取包含历史用户生理周期特征数据的样本数据;基于所述样本数据的类型,对所述样本数据进行预处理,得到离散化词向量;基于所述离散化词向量,采用余弦相似度算法计算所述历史用户之间的生理周期特征相似度;基于所述相似度,对所述历史用户进行聚类,得到生理周期特征相似的生理周期数据组群。3.根据权利要求2所述的用户生理期预测方法,其特征在于,所述基于所述相似度,对所述历史用户进行聚类,得到生理周期特征相似的生理周期数据组群包括:设定分群个数为k,随机选取k个历史用户对应生理周期数据作为初始聚类中心;基于所述相似度的值,选取各历史用户对应的最大的相似度值,并将各历史用户划入与最大的相似度值对应的聚类中心所在组群中,直至将所述历史用户划分完毕,得到分群结果。4.根据权利要求1所述的用户生理期预测方法,其特征在于,所述采用预置数据处理算法对所述生理周期特征数据进行数据清洗,得到所述目标用户的目标生理周期特征数据包括:接收数据清洗请求,其中,所述数据清洗请求包括按照预设特征提取算法的数据格式对所述用户行为数据进行数据清洗;根据所述数据清洗请求,确定数据清洗规则,其中,所述数据清洗规则包括:清洗特征因子和所述清洗特征因子满足的清洗条件;确定所述清洗特征因子对应的特征因子值;根据所述数据清洗规则和所述特征因子值,采用预置数据处理算法对所述生理周期特征数据进行清洗,得到目标生理周期特征数据。5.根据权利要求1所述的用户生理期预测方法,其特征在于,所述根据所述马氏距离进行排序,并根据排序结果确定所述目标用户数据对应匹配的生理周期数据...

【专利技术属性】
技术研发人员:沈鹏
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1