基于用户行为的变化值分析方法、装置、电子设备及介质制造方法及图纸

技术编号:24683277 阅读:41 留言:0更新日期:2020-06-27 07:56
本发明专利技术涉及大数据技术领域,揭露了一种基于用户行为的变化值分析的方法,包括:获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集;将所述目标数据集划分为实验数据集和对照数据集;通过协同过滤算法对所述实验数据集进行建模处理,得到实验行为预测模型,并根据所述实验行为预测模型计算出所述实验数据集的行为值;利用预设的行为响应度模型计算出所述对照数据集的行为值;根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,并根据所述变化值获取用户的行为值变化轨迹。本发明专利技术还提出一种基于用户行为的变化值分析装置、电子设备以及一种计算机可读存储介质。本发明专利技术可以实现用户行为的变化值分析。

Change value analysis method, device, electronic equipment and media based on user behavior

【技术实现步骤摘要】
基于用户行为的变化值分析方法、装置、电子设备及介质
本专利技术涉及大数据
,尤其涉及一种基于用户行为的变化值分析的方法、装置、电子设备及计算机可读存储介质。
技术介绍
在面对用户行为的变化预测场景时,传统的变化预测系统大多使用分割测试和网格搜索的方式来手动调试有限的几种建模组合方式,以实现用户行为变化预测。基于上述的方式,不仅要求工程师有丰富的建模经验,还需要运气,成本和风险都比较高。同时传统机器学习用的大多数模型本质上是线性回归模型,这些模型无法拟合非常复杂的非线性函数,需要人为的通过特征工程把原问题空间转化到一个机器学习模型容易学的表述空间,才能得到好的效果,成本较高且效率低下。因此,需要一种低成本且高效的用户行为变化值的分析方法,以分析用户行为变化。
技术实现思路
本专利技术提供一种基于用户行为的变化值分析的方法、装置、电子设备及计算机可读存储介质,其主要目的在于采用不同行为预测模型计算出用户的行为值,以分析用户行为变化。为实现上述目的,本专利技术提供的一种基于用户行为的变化值分析方法,包括:获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集;将所述目标数据集划分为实验数据集和对照数据集;通过协同过滤算法对所述实验数据集进行建模处理,得到实验行为预测模型,并根据所述实验行为预测模型计算出所述实验数据集的行为值;利用预设的行为响应度模型计算出所述对照数据集的行为值;根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,并根据所述变化值获取用户的行为值变化轨迹。可选地,所述对所述行为数据集进行数据清洗,得到目标数据集,包括:执行所述行为数据集的一致性检查处理,得到标准数据集,将所标准数据集进行去异常处理,得到初始数据集,并对所述初始数据集进行缺失值检测,得到所述目标数据集。可选地,所述去异常包括:双边测试剔除和单边测试剔除;所述单边测试剔除包括最小值测试剔除及最大值测试剔除;其中,所述双边测试剔除的计算方法包括:其中,G表示异常数据,i属于正整数,表示所述标准数据集的平均值,S表示所述标准数据集的标准差,Yi表示所述标准数据集;所述最小值测试剔除的计算方法包括:其中,G表示异常数据,表示所述标准数据集的平均值,Ymin表示所述标准数据集中最小的数据;所述最大值测试剔除的计算方法包括:其中,G表示异常数据,表示所述标准数据集的平均值,Ymax表示所述标准数据集中最大的数据。可选地,所述对所述初始数据集进行缺失值检测,得到所述目标数据集,包括:利用缺失函数检测所述初始数据集中存在的缺失值;对所述缺失值利用下述填充方法进行填充,得到所述目标数据集:其中,L(θ)表示填充的数据缺失值,xi表示第i个填充的数据缺失值,θ表示填充的数据缺失值对应的概率参数,n表示初始数据集的数量,p(xi|θ)表示填充的数据缺失值概率。可选地,所述实验行为预测模型包括下述公式:E(R│T)=P(0=1│R:T)其中,E(R│T)表示实验数据集的行为值,P表示比例符号,T表示实验数据集,R表示实验数据集中的实验数据。可选地,所述预设的行为响应度模型包括决策树和二叉树;及所述利用预设的行为响应度模型计算出所述对照数据集的行为值,包括:根据所述二叉树构建所述对照数据集的构建条件概率公式和条件概率的对数似然函数;利用所述条件概率公式和对数似然函数计算出所述对照数据集的预测行为学习率;根据所述预测行为学习率,利用所述决策树决策出所述对照数据集的行为值。为了解决上述问题,本专利技术还提供一种基于用户行为的变化值分析装置,所述装置包括:清洗模块,用于获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集;划分模块,用于将所述目标数据集划分为实验数据集和对照数据集;计算模块,用于通过协同过滤算法对所述实验数据集进行建模处理,得到实验行为预测模型,并根据所述实验行为预测模型计算出所述实验数据集的行为值,并利用预设的行为响应度模型计算出所述对照数据集的行为值;分析模块,用于根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,并根据所述变化值获取用户的行为值变化轨迹。为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的基于用户行为的变化值分析方法。为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述中任意一项所述的基于用户行为的变化值分析方法。本专利技术实施例获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集,基于数据清洗减少了后续数据计算的复杂性;将所述目标数据集划分为实验数据集和对照数据集,分别利用不同的行为模型计算出所述实验数据集和对照数据集的对应行为值;根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,根据所述变化值可以判断出用户的行为值变化轨迹,从而实现了低成本且高效高精度用户行为变化的分析。附图说明图1为本专利技术一实施例提供的基于用户行为的变化值分析方法的流程示意图;图2为本专利技术一实施例提供的基于用户行为的变化值分析方法的模块示意图;图3为本专利技术一实施例提供的基于用户行为的变化值分析方法的电子设备的内部结构示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种基于用户行为的变化值分析的方法。参照图1所示,为本专利技术一实施例提供的基于用户行为的变化值分析方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。在本实施例中,基于用户行为的变化值分析的方法包括:S1、获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集。在本专利技术的至少一个实施例中,所述用户的行为数据集指的是基于在实际业务场景中,用户参与活动所产生的数据。例如,对于一个产险业务的场景中,用户的购买记录、用户的咨询记录以及用户的后续购买记录等。由于获取到的行为数据集中包含大量无用的数据,因此,本专利技术实施例通过对所述行为数据集进行数据清洗,以实现用户行为的精确定位。详细地,所述对所述行为数据集进行数据清洗,得到目标数据集,包括:执行所述行为数据集的一致性检查处理,得到标准数据集,将所标准数据集进行去异常处理,得到初始数据集,并对所述初始数据集进行缺失值检测,得到所述目标数据集。所述行为数据本文档来自技高网...

【技术保护点】
1.一种基于用户行为的变化值分析方法,其特征在于,所述方法包括:/n获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集;/n将所述目标数据集划分为实验数据集和对照数据集;/n通过协同过滤算法对所述实验数据集进行建模处理,得到实验行为预测模型,并根据所述实验行为预测模型计算出所述实验数据集的行为值,并利用预设的行为响应度模型计算出所述对照数据集的行为值;/n根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,并根据所述变化值获取用户的行为值变化轨迹。/n

【技术特征摘要】
1.一种基于用户行为的变化值分析方法,其特征在于,所述方法包括:
获取用户的行为数据集,对所述行为数据集进行数据清洗,得到目标数据集;
将所述目标数据集划分为实验数据集和对照数据集;
通过协同过滤算法对所述实验数据集进行建模处理,得到实验行为预测模型,并根据所述实验行为预测模型计算出所述实验数据集的行为值,并利用预设的行为响应度模型计算出所述对照数据集的行为值;
根据所述实验数据集的行为值和所述对照数据集的行为值,计算所述行为数据集的变化值,并根据所述变化值获取用户的行为值变化轨迹。


2.如权利要求1所述的基于用户行为的变化值分析方法,其特征在于,所述对所述行为数据集进行数据清洗,得到目标数据集,包括:
执行所述行为数据集的一致性检查处理,得到标准数据集,将所标准数据集进行去异常处理,得到初始数据集,并对所述初始数据集进行缺失值检测,得到所述目标数据集。


3.如权利要求2所述的基于用户行为的变化值分析方法,其特征在于,所述去异常包括:双边测试剔除和单边测试剔除;
所述单边测试剔除包括最小值测试剔除及最大值测试剔除;
其中,所述双边测试剔除的计算方法包括:



其中,G表示异常数据,i属于正整数,表示所述标准数据集的平均值,S表示所述标准数据集的标准差,Yi表示所述标准数据集;
所述最小值测试剔除的计算方法包括:



其中,G表示异常数据,表示所述标准数据集的平均值,Ymin表示所述标准数据集中最小的数据;
所述最大值测试剔除的计算方法包括:



其中,G表示异常数据,表示所述标准数据集的平均值,Ymax表示所述标准数据集中最大的数据。


4.如权利要求2或3所述的基于用户行为的变化值分析方法,其特征在于,所述对所述初始数据集进行缺失值检测,得到所述目标数据集,包括:
利用缺失函数检测所述初始数据集中存在的缺失值;
对所述缺失值利用下述填充方法进行填充,得到所述目标数据集:



其中,L(θ)表示填充的数据缺失值,xi表示第i个填充的数据缺失值,θ表示填充的数据缺失值对应的概率参数,n表示初始数据集的数量,p(xp|θ)表示填充的数据缺失值概率。


5.如权利要求1所述...

【专利技术属性】
技术研发人员:张炯文汪海祥陈真
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1