System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据挖掘,具体为一种用户行为动态数据深度挖掘分析方法。
技术介绍
1、申请公开号为cn115687429a的专利公开了一种社交媒体用户行为模式挖掘方法,包括:集成时空语义的用户行为轨迹相似度量方法,将用户行为轨迹相似度分解到时间、空间和语义等维度上,分布计算用户轨迹的时间相似度、空间相似度、语义相似度,加权集成得到最终的tgs相似度,以平衡用户行为轨迹的多维度特征,本专利技术实现了集成时间、空间和语义要素的用户行为轨迹相似度量方法,基于谱聚类方法进行轨迹聚类,根据用户之间语义话题的相似程度、邻近的空间位置和所处时间阶段的远近等特征进行聚类,找出具有相似行为变化的用户群体。
2、但是在用户行为挖掘中,时空语义相似度量方法涉及对用户行为进行多维度特征的加权集成,在计算过程中,每个维度的相似度需要分别计算,并在此基础上加权合成得到最终的综合相似度,这个过程增加了计算的复杂性,尤其当需要处理大量用户数据时,计算负担非常重,导致算法的效率可能大大降低;此外,异常值的处理不足可能影响到相似度的计算,特别是对于波动较大或存在极端值的行为数据,这些异常数据可能会导致相似度计算结果的失真或不准确;最后,在加权集成时,维度的权重需要设定具体值,尽管可以通过实验或数据分析来选择合适的权重,但在实际应用中,权重设置不合理,可能会导致某些维度对最终结果的影响过大,从而影响整体结果的准确性和可靠性。
3、鉴于此,本专利技术提出一种用户行为动态数据深度挖掘分析方法以解决上述问题。
技术实现思路
1、为了克服现有技术的上述缺陷,为实现上述目的,本专利技术提供如下技术方案,一种用户行为动态数据深度挖掘分析方法,包括:
2、s1、获取行为数据和环境数据;行为数据包括运动数据、生理数据;
3、s2、对行为数据和环境数据进行预处理,得到预处理数据集;
4、s3、基于预处理数据集,利用自动编码器进行融合,输出综合行为向量;
5、s4、基于综合行为向量,判断用户当前的行为状态。
6、进一步的,所述运动数据包括运动强度数据和步频数据;
7、生理数据包括血压数据、呼吸率数据和压力数据;
8、环境数据包括光照强度数据、温度数据、湿度数据和空气质量数据。
9、进一步的,所述运动强度数据获取方式包括:
10、在智能手表中安装加速度传感器,实时采集用户在t时刻的加速度ax、ay和az,并计算总加速度其中,ax为x轴上的加速度,ay为y轴上的加速度,az为z轴上的加速度;
11、计算t时刻总加速度的变化率δa(t)公式为:δa(t)=|atotal(t)-atotal(t-1)|;
12、针对总加速度和总加速度变化率,使用加权平均法来计算t时刻的运动强度qd(t)=w1*atotal(t)+w2*δa(t),其中w1和w2分别为总加速度和总加速度变化率的权重;
13、设定总加速度变化率阈值θ,当总加速度变化率大于阈值θ时,通过动态加权方法调整w1,公式为:其中,α为调节参数,则w2=1-w1;
14、当加速度的阈值小于阈值θ时,则w1=w2=0.5。
15、进一步的,所述步频数据的获取方式包括:
16、通过实时获取的总加速度数据,将总加速度数据可视化,在总加速度可视化图中监测峰值,并通过两个相邻峰值之间的时间差来计算步伐周期tstep,根据步伐周期来计算步频其中60为60秒;
17、步伐周期为一个步伐的起始点到下一个步伐的起始点的时间间隔,计算公式为:tstep=|tpeak(q+1)-tpeak(q)|,其中q表示峰值索引,tpeak(q)表示第q个峰值对应的时间戳,tpeak(q+1)表示第q+1个索引对应的时间戳。
18、进一步的,所述压力数据的获取方式包括:
19、实时采集皮肤电导数据、心率变异性数据、皮肤温度数据;
20、将皮肤电导数据、心率变异性数据、皮肤温度数据进行归一化处理,得到归一化数据集,采用局部异常因子算法,识别出归一化数据集中存在异常值,并剔除异常值,得到初步数据集;基于初步数据集,利用训练好的支持向量回归模型预测压力数据;
21、所述利用训练好的支持向量回归模型预测压力数据的具体方式包括:
22、基于历史的皮肤电导数据、心率变异性数据、皮肤温度数据以及压力数据作为训练集进行训练;
23、初始化超参数:选择径向基函数作为核函数,svr模型中包括惩罚系数、epsi lon参数、gamma参数主要参数,通过网格搜索方法确定参数的最佳值;
24、计算初始损失函数:计算模型的初始损失函数值作为优化的起点,其中,表示正则化,w表示输入特征的权重向量,b表示偏置项,表示误差项,c为惩罚系数,n2表示训练样本总数,o表示样本索引,ξi和表示松弛变量;
25、迭代优化:在每次迭代过程中使用梯度下降法更新模型参数w和b,在更新的过程中计算新的损失函数;
26、检查收敛条件:在每轮迭代后,比较当前损失函数值与上一轮的变化,当相邻两次迭代之间的损失变化小于预设的误差阈值,认为模型已经收敛,停止迭代;
27、使用训练好的支持向量回归模型对初步数据集进行压力数据预测。
28、进一步的,所述预处理数据集的获取方式包括:
29、针对行为数据和环境数据使用merge函数进行得到综合数据集,采用局部异常因子算法识别出综合数据集中的异常值并剔除,再进行min-max归一化处理,并且统一时间戳,得到预处理数据集。
30、进一步的,所述局部异常因子算法的具体方式包括:
31、确定k近邻值;
32、计算每个样本点的k近邻距离:
33、样本点是指预处理数据集中的每个具体的数据值;样本是指预处理数据集中的一行数据;
34、计算预处理数据集中i样本与其他样本之间的欧几里得距离,将得到的欧几里得距离按照升序进行排列,选择前k个样本作为i样本的k个最近邻,并将k个样本中距离i样本最远的欧几里得距离定义为k近邻距离kdist(xi);
35、使用欧几里得距离计算i样本与j样本之间的距离,公式为:
36、
37、其中,i和j表示数据集中的样本索引,i,j=1,2,…,n,n为总样本数量,且i≠j,xi,qd和xj,qd分别表示第i个样本和第j个样本中的运动强度数据,xi,bp和xj,bp分别表示第i个样本和第j个样本中的步频数据,xi,zl和xj,zl分别表示第i个样本和第j个样本中的空气质量数据;
38、预处理数据集包括处理后的运动强度数据、步频数据、血压数据、呼吸率数据、压力数据、光照强度数据、温度数据、湿度数据以及空气质量数据;
39、计算每个样本点的可达距离:针对i样本点和j样本点,设定j样本点属于i样本点的k个最近邻,本文档来自技高网...
【技术保护点】
1.一种用户行为动态数据深度挖掘分析方法,其特征只在于,所述一种用户行为动态数据深度挖掘分析方法,包括:S1、获取行为数据和环境数据;行为数据包括运动数据、生理数据;
2.根据权利要求1所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述运动数据包括运动强度数据和步频数据;
3.根据权利要求2所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述运动强度数据获取方式包括:
4.根据权利要求3所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述步频数据的获取方式包括:
5.根据权利要求4所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述压力数据的获取方式包括:
6.根据权利要求5所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述预处理数据集的获取方式包括:
7.根据权利要求6所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述局部异常因子算法的具体方式包括:
8.根据权利要求7所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述确定k近邻值的
9.根据权利要求8所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述利用自动编码器进行融合,输出综合行为向量的方式包括:
10.根据权利要求9所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述基于综合行为向量,判断用户当前的行为状态的方式包括:
...【技术特征摘要】
1.一种用户行为动态数据深度挖掘分析方法,其特征只在于,所述一种用户行为动态数据深度挖掘分析方法,包括:s1、获取行为数据和环境数据;行为数据包括运动数据、生理数据;
2.根据权利要求1所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述运动数据包括运动强度数据和步频数据;
3.根据权利要求2所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述运动强度数据获取方式包括:
4.根据权利要求3所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述步频数据的获取方式包括:
5.根据权利要求4所述的一种用户行为动态数据深度挖掘分析方法,其特征在于,所述压力数据的获取方式包括:
【专利技术属性】
技术研发人员:田厚新,徐乐平,
申请(专利权)人:南京勤添科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。