【技术实现步骤摘要】
一种结合情景信息的移动终端业务预测方法
[0001]本专利技术涉及业务挖掘
,特别是一种结合情景信息的移动终端业务预测方法。
技术介绍
[0002]在大数据时代,高质量移动通信应运而生,随之而来的是海量业务的处理难题。从全球来看,到2022年,智能手机将占设备连接的54.7%,总流量的93%将以48%的复合年增长率增长。AR和VR市场的发展也将遵循类似的趋势。到2022年,全球将会有11亿台可穿戴设备,年复合增长率为16%。由此可见,随着云游戏、虚拟现实、增强现实、自动驾驶、远程医疗等新型业务层出不穷,移动网络的业务接入量将急剧上升。不同业务类型在通信、计算、存储上的资源需求呈现出多元化。因而,如何预知移动终端在未来时刻的业务类型及时间,成为当下研究的热点。
[0003]为了最大化用户体验质量,需要探求用户的业务使用习惯,准确预测业务类型,从而提前分配网络资源。传统的业务预测,针对蜂窝网络的业务流量进行预测。这样一是带来了基站侧数据类型缺失的弊端;二是难以准确到个体用户,难以为单用户量身配置网络资源;三是如果用户的数据包在网络上被捕捉和分析,则无法保障用户的隐私安全。在移动终端引入机器学习算法来对用户的多元化业务进行预测,这样既避免了用户信息的泄露,又有效使用用户的本地记录来实现不同用户的个性化预测。
[0004]然而,基于移动终端的业务预测存在其难点,一是与在蜂窝网络中捕获并解析的大规模用户业务通信记录相比,个体用户的历史数据信息有限,这给基于机器学习的业务预测的训练阶段带来了挑战;二是个体用 ...
【技术保护点】
【技术特征摘要】
1.一种结合情景信息的移动终端业务预测方法,其特征在于,包括以下步骤:步骤1、从网络的HTTP报头中识别并提取业务日志,在分钟级别对业务日志中每一条业务活动中的业务类型进行压缩打包;对压缩打包后的业务类型进行编码,得到以分钟为时间单位的业务类型序列;步骤2、对业务日志中的时间间隔进行非均匀量化;首先,将业务日志中每条业务活动中的业务时间替换为业务时间间隔,设t
i
为第i个业务发生的时刻,Δt
i
为第i个业务对应的时间间隔,Δt
i
=t
i
‑
t
i
‑1,那么时间替换为时间间隔的过程表示为将t1替换为0,将i=2,3,
…
,N项的t
i
替换为Δt
i
,其中N为压缩打包后业务日志中的业务活动总数;设业务日志中的时间间隔序列为Δt,则Δt=[Δt1,Δt2,...,Δt
N
];设时间间隔的量化中心数集为t
c
,选取量化时间的类别个数P,则初始量化中心为,选取量化时间的类别个数P,则初始量化中心为为t
c
中的第j个初始量化中心,每一个量化中心使用如下的A压缩律逆公式计算非均匀量化中心:从而计算得到非均匀量化中心数集其中,A是决定了压缩程度的参数,e为自然底数,为第j个非均匀量化中心的时间间隔,为第j个非均匀量化中心的时间间隔,round(
·
)表示四舍五入取整,Δt
max
为业务日志时间间隔序列Δt中的最大值,Q
‑1(
·
)为A压缩律逆公式,j的取值范围为1,2,
…
,P;最后,将Δt
i
替换为非均匀量化中心数集中距Δt
i
最近的非均匀量化中心类型,这样就完成了对业务日志中每个时间间隔的非均匀量化,得到非均匀量化后的时间间隔序列;步骤3、定义在上一次业务活动与当前业务活动发生的时刻之间,移动终端处的所有情景信息为当前业务活动的情景信息,对每种情景信息进行特征提取;步骤4、建立结合步骤3情景信息特征的联合输入维度空间;步骤5、构建业务类型的业务类型精确度评价函数和时间间隔预测误差评价函数;(1)设业务类型精确度评价函数为accuracy(
·
),定义如下:其中,p
e
是正确预测业务类型的业务活动数占总业务活动数的比例,N为压缩打包后业务日志中包含的业务活动的总个数,N
s
为压缩打包前原始秒级别的所有业务活动的总个数;是范围在(0,1]之间的压缩系数ρ,ρ代表着压缩打包...
【专利技术属性】
技术研发人员:朱晓荣,徐曹露,李庆洋,张文锦,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。