一种移动通信网络流量的大数据分析方法技术

技术编号:27451694 阅读:24 留言:0更新日期:2021-02-25 04:37
一种移动通信网络流量的大数据分析方法,涉及移动网络和机器学习的技术领域,包括采集性能指标数值、缺省值填充、数据的抽取与聚合、高斯混合模型聚类、以及测试模型共五个步骤;其中,步骤1

【技术实现步骤摘要】
一种移动通信网络流量的大数据分析方法


[0001]本专利技术涉及移动网络和机器学习的
,具体涉及一种基于聚类的移动网络中面向时间和空间的网络流量分析方法

技术介绍

[0002]目前,使用移动网络的用户不断增加,这既是运营商的发展机遇,同时也给其带来挑战。为了提高用户的满意度,运营商需要对所提供的移动网络服务不断进行改进和优化。具体来说,首先需要对移动网络质量进行监测并生成相应的监测日志或数据,其次对移动网络质量进行全面有效的评估,最后根据移动网络质量的评估结果,有针对性地加强移动网络的优化建设。
[0003]目前,移动网络中,通常使用不同的性能指标来判断当前的网络质量状况,比如语音接通率VOLTE(Voice over Long-TermEvolution),VOLTE语音话务量,数据业务量,连接最大数RRC(RadioResource Control),触发的RRC连接释放次数CSFB(CircuitSwitched Fallback),重定向到2G的RRC连接释放次数,重定向到 3G的RRC连接释放次数,下行弱覆盖比MR(Measurement Report), MR下行良好覆盖比,VOLTE语音下行丢包,VOLTE下行时延,上行PRB 平均利用率,下行PRB平均利用率,有效RRC连接最大数,ERAB拥塞率,VOLTE语音用户QCI等于1切换成功率,ERAB建立成功率,VOLTE 语音上行丢包率等等。
[0004]不同时间段的网络性能指标的值是不一样的,比如白天时间段的数据业务量比晚上高,节假日时段景区的数据业务量会变高。除了时间上的联系,在空间中,基站会部署在不同位置,每个基站从自身的覆盖范围中采集相应的网络性能指标。基站坐落于不同位置,采集到的网络性能指标也有不同的时空多样性。对这些具有时空多样性的网络性能指标,可以利用机器学习算法探索面向时空多样性的移动网络流量模型。
[0005]这些网络性能指标也与人们的生活息息相关,网络性能指标的使用可以在一定程度上反映人们的活动轨迹,移动流量的区域密集程度可以反映出城市的热点地区分布。基于这些信息可以分析出很多特征,对基站选址布局、城市区域规划、用户互联网画像等都有重要意义。
[0006]随着用户对通话质量的要求不断提升,移动互联网不断发展和完善,国内外各类对基站流量和网络性能指标的分析和建模的项目不断被发布。前人使用机器学习算法来研究移动网络流量,研究对象可以是业务兴趣、移动性等,也可从时间维度,空间维度以及两者的结合进行探索。基于空间维度分析流量特性,如改善毫米波蜂窝网络的下行链路传输中的性能,预测空间依赖性和基站流量带来的长期需求, 以用户为中心的分布式群集和UDN中的基站模式选择问题,基于时间和空间二维度分析流量特性,如利用LSTM模型学习基站流量的时间依赖性和空间相关性,并对未来一段时间做流量预测。

技术实现思路

[0007]本专利技术提供一种移动通信网络流量的大数据分析方法,它能够快速、且更准确地
分析移动网络流量,并且能够用来分析面向时间和面向空间的移动网络流量。
[0008]为解决上述问题,本专利技术采用如下技术方案:
[0009]一种移动通信网络流量的大数据分析方法,包括以下步骤:
[0010]步骤1,采集性能指标数值:收集移动网络中的场景中的基站的网络性能指标的数据;对于基站记录的性能指标的数据,分别收集其各个网络性能指标的数据;
[0011]步骤2,数据的抽取与聚合:剔除各个基站中的网络性能指标的无用数据及干扰数据;
[0012]步骤3,对数据进行聚类:采用高斯混合模型进行拟合,并采用期望最大算法进行算法训练;
[0013]步骤4,对模型进行测试:选取网络性能指标样本集验证模型,对模型的超参数进行填筑并且对模型的能力进行评估。
[0014]进一步地,如果步骤1中性能指标数据缺失或者数值异常,还包括以下步骤:
[0015]步骤1.5,缺省值填充:若一个基站的性能指标数据存在缺失值,则计算该性能指标数据在所有基站中的均值,并将该均值作为为缺失值的替补值。
[0016]进一步地,所述步骤2中,无用数据为具有相同数值的网络性能指标的数据,干扰数据为超过正常值范围的数据。
[0017]进一步地,所述步骤3中,使用了高斯混合分布作参数模型,其公式为:
[0018][0019]其中,该公式为所述步骤2后剔除后的性能指标的高斯分布的和;μ为数据均值,为数据标准差。
[0020]进一步地,所述步骤3中,通过模型来计算数据的期望值,通过更新参数μ和使期望最大化。
[0021]进一步地,通过两次迭代生成的参数值使得参数趋于稳定。
[0022]进一步地,在所述步骤4中,采用轮廓系数对模型的能力进行评估,所述轮廓系数为:
[0023]其中,a是与其同类别中其他网络性能指标的平均距离,b是与其距离最近不同类别中网络性能指标的平均距离。
[0024]更进一步地,在所述步骤1中,选择12个网络性能指标,分别为ERAB拥塞率、RRC连接最大数、MR下行良好覆盖比例、重定向到3G的RRC连接释放次数、ERAB建立成功率、无线接通率、VOLTE 语音上行丢包率、CSFB触发的RRC连接释放次数、有效RRC连接最大数、VOLTE语音话务量ERL、重定向到2G的RRC连接释放次数和区县位置。本专利技术分析的网络性能指标以月为跨度,数据的时间跨度较长,网络性能指标有时间多样性,例如季节、周末、节假日、天气变化等。不同时间段的网络性能指标的值是不一样的,比如白天时间段的数据业务量比晚上高,节假日时段景区的数据业务量会变高。根据这些时间特性,分析在不同时间特性下的移动网络流量变化,通过机器学习算法得到面向时间多样性的移动网络流量模型。除了时间上的联系,在空间中,基站会部署在不同位置,每个基站从自身的覆盖范围中采集相应
的网络性能指标。基站坐落于不同位置,采集到的网络性能指标也有不同的多样性。对这些具有时空多样性的网络性能指标,可以利用机器学习算法探索面向空间多样性的移动网络流量模型。
附图说明
[0025]图1是本专利技术的移动网络流量的大数据分析方法的操作步骤流程图。
[0026]图2是某时段移动网络中的面向时空多样性的移动网络流量聚类一的结果在地图中的示意图。
[0027]图3是某时段移动网络中的面向时空多样性的移动网络流量聚类二的结果在地图中的示意图。
[0028]图4是某时段移动网络中的面向时空多样性的移动网络流量聚类三的结果在地图中的示意图。
[0029]图5是某时段移动网络中的面向时空多样性的移动网络流量聚类四的结果在地图中的示意图。
[0030]图6是某时段移动网络中的面向时空多样性的移动网络流量聚类五的结果在地图中的示意图。
具体实施方式
[0031]下面用最佳的实施例对本专利技术做详细的说明。
[0032]如图1-6所示,结合本专利技术实施例,详细介绍基于聚类的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种移动通信网络流量的大数据分析方法,包括以下步骤:步骤1,采集性能指标数值:收集移动网络中的场景中的基站的网络性能指标的数据;对于基站记录的性能指标的数据,分别收集其各个网络性能指标的数据;步骤2,数据的抽取与聚合:剔除各个基站中的网络性能指标的无用数据及干扰数据;步骤3,对数据进行聚类:采用高斯混合模型进行拟合,并采用期望最大算法进行算法训练;步骤4,对模型进行测试:选取网络性能指标样本集验证模型,对模型的超参数进行填筑并且对模型的能力进行评估。2.根据权利要求1所述的移动通信网络流量的大数据分析方法,其特征在于,如果步骤1中性能指标数据缺失或者数值异常,还包括以下步骤:步骤1.5,缺省值填充:若一个基站的性能指标数据存在缺失值,则计算该性能指标数据在所有基站中的均值,并将该均值作为为缺失值的替补值。3.根据权利要求1所述的移动通信网络流量的大数据分析方法,其特征在于,所述步骤2中,无用数据为具有相同数值的网络性能指标的数据,干扰数据为超过正常值范围的数据。4.根据权利要求1所述的移动通信网络流量的大数据分析方法,其特征在于,所述步骤3中,使用了高斯混合分布作参数模型,...

【专利技术属性】
技术研发人员:崔卫军白雪纯
申请(专利权)人:北京弘光浩宇科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1