当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于隐马尔可夫模型的移动通信用户流失预测方法技术

技术编号:12799459 阅读:217 留言:0更新日期:2016-01-30 20:32
本发明专利技术公开一种基于隐马尔可夫模型的移动通信用户流失预测方法,属于数据业务领域。采集移动用户的通信记录数据;数据预处理;建立隐马尔可夫模型;对观测状态节点对应的数据进行处理;利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;各步骤均是在hadoop大数据平台上完成。本发明专利技术在大数据Hadoop分布式平台上对通信数据进行分析并预测,充分利用大数据的优势,对移动通信用户的所有数据进行分析,提升了预测移动通信用户流失的准确性和高效性。

【技术实现步骤摘要】

本专利技术属于数据业务领域,特别涉及一种基于隐马尔可夫模型的移动通信用户流 失预测方法。
技术介绍
移动通信用户流失预测,对移动通信网络制定适当的营销策略非常关键。营销策 略是移动通信网络公司通过对移动通信用户的通信数据进行详细分析,向移动通信用户推 荐合适的套餐,减少用户的损失,有利于挽回将要流失的其他通信网络的用户,由此加强移 动用户的忠诚度,挽回和吸引其他通信网络的用户,从而促进移动通信网络的发展。 有关移动通信用户流失预测方法的现有文献中,硕士学位论文"基于数据挖掘的 移动客户虚假离网研究"比较接近,其中的虚假离网是指某在网用户因各种原因暂时离网 后,又以相同(或不同)的名义入网。该方法主要是通过人工分析影响移动客户流失的因 素有哪些,从而建立模型,研究移动客户虚假离网。但该方法仅仅是通过对小量数据进行分 析建模,难免会对移动用户流失的关键因素产生错误判断。
技术实现思路
针对现有技术存在的不足,本专利技术提供一种基于隐马尔可夫模型的移动通信用户 流失预测方法。 本专利技术的技术方案是这样: -种基于隐马尔可夫模型的移动通信用户流失预测方法,包括以下步骤且各步骤 均是在hadoop大数据平台上完成: 步骤1 :采集移动用户的通信记录数据; 步骤2:数据预处理; 基于移动用户的通信记录数据,以月为单位,并按照下述8种属性类别对移动用 户的通信情况进行统计:(1)计费用户号码;(2)月通话时长;(3)月通话次数;(4)月主被 叫比例;(5)月漫游次数;(6)月掉话次数;(7)月基本费用;(8)月长途费用; 步骤3 :建立隐马尔可夫模型,以下简称HMM模型; 定义隐马尔可夫模型中的观测状态节点集合3_= {S^Si,…,SJ对应{月通话 时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用};隐 状态节点X={〇, 1},其中0代表客户流失状态,1代表客户未流失状态; 步骤4 :对观测状态节点对应的数据进行处理; 步骤4. 1:将观测状态节点对应的静态数据转换成趋势数据; 利用公式(1)将观测状态节点的静态数据转换成趋势数据; 其中i的取值范围0~6 ; 表示观测状态节点Si在第t个月的数据值;If>表 示转换后的观测状态节点Si在第t个月的趋势状态数据;-1表示该用户这个月没有通信数 据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该 用户这个月的通信数据上升; 步骤4. 2 :将多个观测状态节点压缩成一个观测状态节点; 利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2) 所示; 步骤5 :基于建立的HMM模型进行移动用户流失预测; 利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概 率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的 概率转移得到移动用户第T+1月的流失概率;具体包括如下步骤: 步骤5. 1 :利用步骤1至步骤4的方法获得T个月观测状态节点的趋势状态数据; 步骤5. 2 :初始化HMM模型参数λ= (A,B,π),并设置t= 0 ;步骤5. 3 :通过第t个月的隐状态节点X的概率分布Bel(X),利用隐状态节点概 率转移矩阵A计算第t+Ι个月隐状态节点X的概率分布;其 中Bel(X)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+11X)表示隐状态节点X在第t个月转移到第t+Ι个月的概率转移; 步骤5. 4 :使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+Ι个月 隐状态节点X的概率分布得到修正概率分布Be1 (Xt+1)p(Yt+11xt+1)Be丨'(χ?);其中 P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个 月的观测状态节点修正第t+Ι个月的隐状态节点的概率分布; 步骤5. 5 :对第t+Ι个月的隐状态节点X的修正概率分布进行归一化,使隐状态节 点的所有状态的概率和为1 ; 步骤 5. 6 :令t=t+Ι; 步骤5. 7 :若t〈T,跳转执行步骤5. 3,否则执行步骤5. 8 ;步骤5. 8 :利用移动通信用户第T个月隐状态节点X的概率分布Bel(Χτ),通过隐 状态节点概率转移矩阵Α,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分 布 根据所述的基于隐马尔可夫模型的移动通信用户流失预测方法,所述用户流失为 该用户在一个月内没有任何通信记录的状态; 根据所述的基于隐马尔可夫模型的移动通信用户流失预测方法,所述步骤5. 2中 所述初始化HMM模型参数,包括如下具体步骤: 步骤5. 2. 1:初始化隐含状态转移概率矩阵A; 其中NUM(Xt=XuXt+1=Xj)表示在第t个月隐状态节点X取值等于\并且在第 t+Ι个月隐状态节点X取值等于X]的移动通信用户数量总和;根据公式(3),⑷所示,在 完整数据集中,参数A的初始化是统计所有&1],即可得到隐状态节点X的隐含状态转移概 率矩阵; 步骤5. 2. 2 :初始化观测状态转移概率矩阵B ; 在公式(5)中,NUM(Xt=X,Yt=y)表示在第t个月隐状态节点X取值为X,并且 在第t个月观测状态节点Y取值为y的移动通信用户数量总和;根据公式(5),(6)可知, 参数B的初始化操作与参数A的初始化操作相似,但又有点不同,那就是参数A是不同月份 隐状态节点的状态转移概率,而参数B是同一月份隐状态节点与观测状态节点间的转移概 率; 步骤5. 2. 3:初始化初始状态概率矩阵31; 针对参数31,Jr表示初始隐状态节点的状态出现的概率,相当于第0个月隐状 态节点的概率分布,因为该参数η无法从数据集中学习,一般设置每个状态出现的概率相 等,即 、7)。 本专利技术的有益效果:本专利技术在大数据Hadoop分布式平台上对通信数据进行分析 并预测,充分利用大数据的优势,对移动通信用户的所有数据进行分析,提升了预测移动通 信用户流失的准确性和高效性,为移动网络通信营销策略的规划方案提供依据。【附图说明】图1为本专利技术【具体实施方式】的基于隐马尔可夫模型的移动通信用户流失预测方 法流程图;图2为本专利技术【具体实施方式】构建的隐马尔可夫模型的机构示意图;图3为本专利技术【具体实施方式】基于建立的隐马尔可夫模型进行移动用户流失预测 的流程图。【具体实施方式】 下面结合附图对本专利技术的【具体实施方式】做详细说明。 本实施方式的基于隐马尔可夫模型的移动通信用户流失预测方法,如图1所示, 包括如下步骤,其中步骤S2至步骤S6是在hadoop大数据平台上完成的: 步骤S1:定义移动用户的流失状态; 建立用户流失预测模型的一个主要问题是对流失用户给定一个逻辑定义。在前面 大部分的文献研究中,移动通信用户是与移动通信服务商签订合约,使用移动通信服务商 提供的通信服务。因此,"流失"应该被定义成用户单方面终止合约或者合约过期。但是对 于预付费的移动通信服务商来说情况不同,用户与服务商没有合约,任何一个人可以买一 个SIM卡成为用户。因此任何用户在一段时间内停止使用移动通信服务商提供的服务,即 可认定为流失用户,也就是说流失用户发生在没有任何通话记录的情况本文档来自技高网...
一种基于隐马尔可夫模型的移动通信用户流失预测方法

【技术保护点】
一种基于隐马尔可夫模型的移动通信用户流失预测方法,其特征在于:包括以下步骤且各步骤均是在hadoop大数据平台上完成:步骤1:采集移动用户的通信记录数据;步骤2:数据预处理;基于移动用户的通信记录数据,以月为单位,按照下述8种属性类别对移动用户的通信情况进行统计:(1)计费用户号码;(2)月通话时长;(3)月通话次数;(4)月主被叫比例;(5)月漫游次数;(6)月掉话次数;(7)月基本费用;(8)月长途费用;步骤3:建立隐马尔可夫模型,以下简称HMM模型;定义HMM模型中的观测状态节点集合Ssum={S0,S1,...,S6}对应{月通话时长,月通话次数,月主被叫比例,月漫游次数,月掉话次数,月基本费用,月长途费用};隐状态节点X={0,1},其中0代表客户流失状态,1代表客户未流失状态;步骤4:对观测状态节点对应的数据进行处理;步骤4.1:将观测状态节点对应的静态数据转换成趋势数据;利用公式(1)将观测状态节点的静态数据转换成趋势数据;Yi(t)=-1,ΣiSi(t)=00,Si(t)-Si(t-1)<-Si‾1,|Si(t)-Si(t-1)|<;Si‾1,ΣiSi(t-1)=02,Si(t)-Si(t-1)>Si‾---(1)]]>其中i的取值范围0~6;表示观测状态节点Si在第t个月的数据值;表示转换后的观测状态节点Si在第t个月的趋势状态数据;‑1表示该用户这个月没有通信数据;0表示该用户这个月的通信数据下降;1表示该用户这个月的通信数据平稳;2表示该用户这个月的通信数据上升;步骤4.2:将多个观测状态节点压缩成一个观测状态节点;利用状态压缩的方式将多个观测状态节点压缩成一个观测状态节点,如公式(2)所示;步骤5:基于建立的HMM模型进行移动用户流失预测;利用前T个月已知的观测状态节点的趋势状态数据,计算第T月隐状态节点的概率分布,再进行归一化,利用第T月隐状态节点的概率分布计算隐状态节点的状态之间的概率转移得到移动用户第T+1月的流失概率;具体包括如下步骤:步骤5.1:利用步骤1至步骤4的方法获得T个月观测状态节点的趋势状态数据;步骤5.2:初始化HMM模型参数λ=(A,B,π),并设置t=0;步骤5.3:通过第t个月的隐状态节点X的概率分布Bel(Xt),利用隐状态节点概率转移矩阵A计算第t+1个月隐状态节点X的概率分布其中Bel(Xt)表示隐状态节点X在第t个月时的修正概率分布;P(Xt+1|Xt)表示隐状态节点X在第t个月转移到第t+1个月的概率转移;步骤5.4:使用隐状态节点与观测状态节点的概率转移矩阵B,修正第t+1个月隐状态节点X的概率分布得到修正概率分布Bel(Xt+1)∝P(Yt+1|Xt+1)Bel′(Xt+1);其中P(Yt+1|Xt+1)表示在第t+1个月隐状态节点与观测状态节点的概率转移,目的通过第t+1个月的观测状态节点修正第t+1个月的隐状态节点的概率分布;步骤5.5:对第t+1个月的隐状态节点X的修正概率分布进行归一化,使隐状态节点的所有状态的概率和为1;步骤5.6:令t=t+1;步骤5.7:若t<T,跳转执行步骤5.3,否则执行步骤5.8;步骤5.8:利用移动通信用户第T个月隐状态节点X的概率分布Bel(XT),通过隐状态节点概率转移矩阵A,计算下一个月即第T+1月移动通信用户的隐状态节点X的概率分布Bel′(XT+1)=ΣxTP(XT+1|XT)Bel(XT).]]>...

【技术特征摘要】

【专利技术属性】
技术研发人员:于端云顾宁伦才鑫曾令兵夏兴有
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1