一种基于手机日志的用户行为分析方法技术

技术编号:32173945 阅读:25 留言:0更新日期:2022-02-08 15:33
本发明专利技术涉及一种基于手机日志的用户行为分析方法,解决的是分析精度不高,实时性差的技术问题,通过采用挑选实时分析组合,对实时行为分析组合的状态进行评估,选用状态好的实时行为分析组合进行行为分析,并通过对行为分析结果进行加权评价的方式,提高了实时性和分析精确度。此时,行为分析方法可采用现有的多种行为分析算法。具体地,进行数据预处理单元的状态综合计算,对数据分析单元的状态综合计算,对数据预处理单元和数据分析单元的状态一起做综合计算。在此情况下,通过对三种计算出的状态的判断,来控制实时分析组合的后续操作,是继续分析还是选用其他实时态的组合进行后续操作的技术方案,较好的解决了该问题,可用于用户行为中。用于用户行为中。用于用户行为中。

【技术实现步骤摘要】
一种基于手机日志的用户行为分析方法


[0001]本专利技术涉及行为分析领域,具体涉及一种基于手机日志的用户行为分析方法。

技术介绍

[0002]用户行为分析,是指在获得网站或APP等平台访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站或APP等平台的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。这是狭义的只指网络上的用户行为分析。
[0003]现有的基于手机日志的用户行为分析方法存在着分析精度不高,实时性差的问题,本专利技术提供一种基于手机日志的用户行为分析方法用以解决以上技术问题。

技术实现思路

[0004]本专利技术所要解决的技术问题是现有技术中存在的分析精度不高,实时性差技术问题。提供一种新的基于手机日志的用户行为分析方法,该用户行为分析方法具有分析精度高,实时性好的特点。
[0005]为解决上述技术问题,采用的技术方案如下:
[0006]一种基于手机日志的用户行为分析方法,基于手机日志的用户行为分析方法包括:
[0007]步骤1,收集和采集手机日志数据;
[0008]步骤2,设置x个数据预处理子单元组成数据预处理单元,设置y个数据分析子单元组成数据分析单元;x个数据预处理子单元均与y个数据分析子单元连接,连接关系可被控制通断;y个数据分析子单元均连接到一个行为分析融合单元;其中x为大于等于2的正整数,y为大于等于2的正整数;
[0009]步骤3,任意选取至少2个数据预处理子单元和至少2个数据分析子单元被控开通作为实时分析队列,其余的数据预处理子单元和数据分析子单元被控关断;待分析的手机日志数据均输入实时分析队列中的数据预处理子单元;
[0010]步骤4,抽取实时分析队列中的数据预处理子单元和数据分析子单元的状态表征值;运行同类融合权值分配算法分别对数据预处理子单元和数据分析子单元的状态表征值进行状态融合得到第一融合结果和第二融合结果;
[0011]步骤5,运行异类融合权值分配算法计算出混合最优权值,对数据预处理子单元和数据分析子单元的状态表征值进行状态混合得出第三融合结果;
[0012]步骤6,在第一融合结果、第二融合结果、第三融合结果均符合预定义结果情况下,数据预处理子单元进行行为数据预处理,再执行步骤7,否则返回步骤3;
[0013]步骤7,进行行为分析;
[0014]步骤8,行为分析融合单元对行为分析结果进行误差消除计算,输出最终的用户行为分析结果。
[0015]本专利技术通过挑选实时分析组合,并对实时行为分析组合的状态进行评估评价,从而选用状态好的额实时行为分析组合进行行为分析,并通过对行为分析结果进行加权评价的方式,提高了实时性和分析精确度。此时,行为分析方法可采用现有的多种行为分析算法。具体地,进行数据预处理单元的状态综合计算,对数据分析单元的状态综合计算,对数据预处理单元和数据分析单元的状态一起做综合计算。在此情况下,通过对三种计算出的状态的判断,来控制实时分析组合的后续操作,是继续分析还是选用其他实时态的组合进行后续操作。通过以上决策,能够挑选出状态符合预期的无故障,且误差最小的实时行为分析组合进行作业。
[0016]上述方案中,为优化,进一步地,同类融合权值分配算法包括:
[0017]步骤A,定义数据预处理子单元为状态源,或定义数据分析子单元为状态源,计算状态源状态表征值每个周期位置的中心点Xb(k)为第b个状态源的状态表征观测函数:
[0018]其中,k为当前观测周期,i为状态源个数,b为小于i的正整数;
[0019]步骤B,计算各状态源的状态表征值实际测量值与中心点的偏差ΔX
i
(k)其中,X
i
(k)为i个状态源的观测函数;
[0020]步骤C,计算各状态源偏差的和S
i1
与偏差平方的和S
i2

[0021]其中,ΔX
i
(c)为观测周期中c时刻的偏差,c小于k;
[0022][0023]步骤D,计算各状态源偏差的均值Δ
[0024][0025]步骤E,计算各状态源偏差的标准差δ
ik

[0026][0027]步骤F,以各状态源的标准差计算出各状态源的权值w
i

[0028][0029]步骤G,根据权值w
i
,计算融合结果X(k):
[0030][0031]其中,i为状态源个数。
[0032]进一步地,异类融合权值分配算法包括:
[0033]步骤a,统一定义数据预处理子单元和数据分析子单元为权值源,排序编号为1,2,3

n,表征权值源正常的归一真值为X,权值源的实测归一值为X1,X2,X3,

,X
n
,定义方差为δ1,δ2,δ3,

,δ
n
,权值为w1,w2,w3,

,w
n

[0034]步骤b,依照排序选定3个相邻的权值源,实测归一值分别为步骤b,依照排序选定3个相邻的权值源,实测归一值分别为对应误差为对应的误差为
[0035]步骤c,j计算出互协方差和自协方差,消元后计算出方差为:
[0036][0037][0038][0039]步骤d,计算出混合最优权值为:
[0040][0041]进一步地,行为数据预处理包括数据清洗,数据区分,数据区分包括:
[0042]步骤6.1,定义两个日志数据的特征轨迹为和对应的两个特征轨迹点为r
i,x
(l
i,x
,t
i,x
)和r
j,y
(l
j,y
,t
j,y
),时间距离定义为
[0043]计算两个日志数据的相似度UCor(R
i
,R
j
)=TCor(R
i
,R
j
)
×
SCor(R
i
,R
j
);
[0044]其中,为时间相似性,为时间相似性,为空间相似性,W
θ
为轨迹序列的长度,为轨迹序列的长度,为轨迹序列的长度,
[0045]步骤6.2,计算出相似度矩阵
[0046][0047]其中,s
ij
表示数据i和数据j的相似度UCor(R
i
,R
j
),0≤s
ij
≤1,矩阵S的对角线元素为1;
[0048]步骤6.3,将相似度矩阵转换为距离矩阵D:
[0049][0050]d
ij
=1

x
ij

[0051]其中,i=1,2,3<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于手机日志的用户行为分析方法,其特征在于:基于手机日志的用户行为分析方法包括:步骤1,收集和采集手机日志数据;步骤2,设置x个数据预处理子单元组成数据预处理单元,设置y个数据分析子单元组成数据分析单元;x个数据预处理子单元均与y个数据分析子单元连接,连接关系可被控制通断;y个数据分析子单元均连接到一个行为分析融合单元;其中x为大于等于2的正整数,y为大于等于2的正整数;步骤3,任意选取至少2个数据预处理子单元和至少2个数据分析子单元被控开通作为实时分析队列,其余的数据预处理子单元和数据分析子单元被控关断;待分析的手机日志数据均输入实时分析队列中的数据预处理子单元;步骤4,抽取实时分析队列中的数据预处理子单元和数据分析子单元的状态表征值;运行同类融合权值分配算法分别对数据预处理子单元和数据分析子单元的状态表征值进行状态融合得到第一融合结果和第二融合结果;步骤5,运行异类融合权值分配算法计算出混合最优权值,对数据预处理子单元和数据分析子单元的状态表征值进行状态混合得出第三融合结果;步骤6,在第一融合结果、第二融合结果、第三融合结果均符合预定义结果情况下,数据预处理子单元进行行为数据预处理,再执行步骤7,否则返回步骤3;步骤7,进行行为分析;步骤8,行为分析融合单元对行为分析结果进行误差消除计算,输出最终的用户行为分析结果。2.根据权利要求1所述的基于手机日志的用户行为分析方法,其特征在于:同类融合权值分配算法包括:步骤A,定义数据预处理子单元为状态源,或定义数据分析子单元为状态源,计算状态源状态表征值每个周期位置的中心点X
b
(k)为第b个状态源的状态表征观测函数:其中,k为当前观测周期,i为状态源个数,b为小于i的正整数;步骤B,计算各状态源的状态表征值实际测量值与中心点的偏差ΔX
i
(k)其中,X
i
(k)为i个状态源的观测函数;步骤C,计算各状态源偏差的和S
i1
与偏差平方的和S
i2
:其中,ΔX
i
(c)为观测周期中c时刻的偏差,c小于k;步骤D,计算各状态源偏差的均值步骤D,计算各状态源偏差的均值步骤E,计算各状态源偏差的标准差δ
ik

步骤F,以各状态源的标准差计算出各状态源的权值w
i
:步骤G,根据权值w
i
,计算融合结果X(k):其中,i为状态源个数。3.根据权利要求1所述的基于手机日志的用户行为分析方法,其特征在于:异类融合权值分配算法包括:步骤a,统一定义数据预处理子单元和数据分析子单元为权值源,排序编号为1,2,3...n,表征权值源正常的归一真值为X,权值源的实测归一值为X1,X2,X3,...,X
n
,定义方差为δ1,δ2,δ3,...,δ
n
,权值为w1,w2,w3,...,w
n
;步骤b,依照排序选定3个相邻的权值源,实测归一值分别为步骤b,依照排序选定3个相邻的权值源,实测归一值分别为对应误差为对应的误差为步骤c,j计算出互协方差和自协方差,消元后计算出方差为:步骤c,j计算出互协方差和自协方差,消元后计算出方差为:步骤c,j计算出互协方差和自协方差,消元后计算出方差为:步骤d,计算出混合最优权值为:4.根据权利要求1所述的基于手机日志的用户行为分析方法,其特征在于:行为数据预处理包括数据清洗,数据区分,数据区分包括:步骤6.1,定义两个日志数据的特征轨迹为和对应的两个特征轨迹点为r
i,x
(l
i,x
,t
i,x
)和r
j,y
(l
j,y
,t
j,y
),时间距离定义为计算两个日志数据的相似度UCor(R
i
,R
...

【专利技术属性】
技术研发人员:张丽郝身刚
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1