基于集成模型的通讯用户升档预测概率识别方法及系统技术方案

技术编号:21363665 阅读:28 留言:0更新日期:2019-06-15 09:48
本发明专利技术提供一种基于集成模型的通讯用户升档预测概率识别方法及系统,所述通讯用户升档预测概率识别方法包括以下步骤:步骤S1,将用户基本信息数据存放至数据库中,得到用户基本信息数据集S;步骤S2,对所述用户基本信息数据集S进行数据检测,并经过标准化处理后得到数据集

Probability Recognition Method and System of Communication User Upgrade Prediction Based on Integrated Model

The invention provides a communication user upgrade prediction probability recognition method and system based on an integrated model. The communication user upgrade prediction probability recognition method includes the following steps: storing user basic information data into a database to obtain user basic information data set S; and (2) detecting and standardizing the user basic information data set S. Data Set after Chemical Processing

【技术实现步骤摘要】
基于集成模型的通讯用户升档预测概率识别方法及系统
本专利技术涉及一种通讯用户升档预测方法,尤其涉及一种基于集成模型的通讯用户升档预测概率识别方法,并涉及采用了该基于集成模型的通讯用户升档预测概率识别方法的通讯用户升档预测概率识别系统。
技术介绍
智能手机等智能终端已经非常普及,而随着数字化的进步,通讯用户的套餐也会随之变化,但是现在的用户升档预测概率识别与用户现有通讯套餐的关联性概率偏低,也就是说,现在并没有针对用户现有通讯套餐进行预测和分析的升档预测概率识别系统,这样的话,用户不便于针对性地及时调整套餐,同时也会增加运营商的管理难度,影响运营商的营销效果和营销精确度。
技术实现思路
本专利技术所要解决的技术问题是需要提供一种便于用户直接观看预测数据集,做到数字化,便于能够针对性地及时调整套餐或采取不同的营销措施,降低运营商的管理难度,并有效提高运营商的营销效果和营销精确度的基于集成模型的通讯用户升档预测概率识别方法;还需要进一步提供采用了该基于集成模型的通讯用户升档预测概率识别方法的通讯用户升档预测概率识别系统。对此,本专利技术提供一种基于集成模型的通讯用户升档预测概率识别方法,包括以下步骤:步骤S1,将用户基本信息数据存放至数据库中,得到用户基本信息数据集S;步骤S2,对所述用户基本信息数据集S进行数据检测,并经过标准化处理后得到数据集St;步骤S3,将数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出进行集成模型训练,得到训练好的集成模型;步骤S4,将更新后的用户基本信息数据集Sx输入至所述步骤S3训练好的集成模型中,输出并展示用户次月是否办理套餐升档的预测数据集Sy。本专利技术的进一步改进在于,所述步骤S2包括以下子步骤:步骤S201,检测所述用户基本信息数据集S中的异常值和缺失值;步骤S202,将异常值设置为缺失值;步骤S203,对缺失值用零填充,得到数据清洗之后的数据源S_;步骤S204,对数据源S_进行标准化处理得到数据集St。本专利技术的进一步改进在于,所述步骤S204中,通过公式对数据源S_进行标准化处理得到数据集St,其中,xn代表数据源S_中数据集的第n条数据,n代表的是数据的样本数量,代表所有样本数据的均值,σ代表所有样本数据的标准差。本专利技术的进一步改进在于,通过公式计算所有样本数据的均值通过公式计算所有样本数据的标准差σ。本专利技术的进一步改进在于,所述步骤S3中,所述集成模型包含了逻辑回归模型、决策树模型和朴素贝叶斯模型;将所述数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出,分别在逻辑回归模型、决策树模型和朴素贝叶斯模型中同时进行训练,并通过验证的方式分别优化所述逻辑回归模型、决策树模型和朴素贝叶斯模型在所述集成模型中的权重。本专利技术的进一步改进在于,所述步骤S3包括以下子步骤:步骤S301,将所述数据集St进行拆分,拆分为训练数据集StA和测试数据集StB;步骤S302,将训练数据集StA作为输入,将所述训练数据集StA对应的用户次月是否办理套餐升档的数据yn1作为输出,分别在逻辑回归模型、决策树模型和朴素贝叶斯模型中同时进行训练;步骤S303,在训练过程中,将所述测试数据集StB以及该测试数据集StB对应的用户次月是否办理套餐升档的数据yn2作为验证数据,分别对逻辑回归模型、决策树模型和朴素贝叶斯模型中的训练数据进行验证,若验证通过,则将其权重除以权重常数dt,否则将其权重乘以权重常数dt。本专利技术的进一步改进在于,所述步骤S301中,所述训练数据集StA和测试数据集StB之间的比例控制为7:3。本专利技术的进一步改进在于,所述步骤S3中,开始训练的时候,所述逻辑回归模型、决策树模型以及朴素贝叶斯模型之间的权重比例为1:1:1;所述权重常数dt为0~1之间的随机数。本专利技术的进一步改进在于,所述步骤S1中,所述用户基本信息数据集S包括用户唯一标识ID、套餐费、流量费、前三个月话费金额、超套次数、超套流量费、积分、用户等级、年龄、性别、通话档次、在网时长、前三个月语音时长均值、漫游用户、前三个月GPRS流量、前三个月话费均值以及前三个月流量均值中的任意一种或几种。本专利技术还提供一种基于集成模型的通讯用户升档预测概率识别系统,采用了如上所述的基于集成模型的通讯用户升档预测概率识别方法。与现有技术相比,本专利技术的有益效果在于:通过对用户基本信息数据集S进行数据检测和分析,结合集成模型的训练,进而实现预测数据集Sy的输出,通过所述集成模型的训练(学习),能够获得更好的预测效果,具备更强的泛化能力,因此,这种预测的针对性、关联性和准确性都非常高,便于通过用户升档预测系统直观地看到预测数据集Sy,实现了预测系统化,结果一目了然,且及时便捷,为提供更具备针对性的套餐升档建议提供了很好的数据基础,便于针对性地及时调整不同客户群体的套餐或针对性采取不同的营销措施,降低运营商的管理难度,有效提高运营商的营销效果和营销精确度。附图说明图1是本专利技术一种实施例的工作流程示意图;图2是本专利技术一种实施例的工作原理示意图;图3是本专利技术一种实施例的数据流原理示意图。具体实施方式下面结合附图,对本专利技术的较优的实施例作进一步的详细说明。如图1至图3所示,本例提供一种基于集成模型的通讯用户升档预测概率识别方法,包括以下步骤:步骤S1,将用户基本信息数据存放至数据库中,得到用户基本信息数据集S;步骤S2,对所述用户基本信息数据集S进行数据检测,并经过标准化处理后得到数据集St;步骤S3,将数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出进行集成模型训练,得到训练好的集成模型;步骤S4,将更新后的用户基本信息数据集Sx输入至所述步骤S3训练好的集成模型中,输出并展示用户次月是否办理套餐升档的预测数据集Sy。本例所述步骤S1和步骤S2是对用户基本信息数据集S进行数据预处理的过程;所述步骤S3是通过已有的历史数据,将用户的数据集St作为输入,将历史数据中用户次月是否办理套餐升档的数据yn作为输出,进而训练出进行预测时所需要使用的集成模型;而所述步骤S4则是利用所述步骤S3所训练好的集成模型,将更新后的用户基本信息数据集Sx输入至训练好的所述集成模型中进行训练,进而通过更新后的用户基本信息数据集Sx和训练好的集成模型输出用户次月是否办理套餐升档的预测数据集Sy,并展示,以实现准确度更高的通讯用户升档预测概率识别,本例所述通讯用户升档预测概率识别指的是对通讯用户的套餐升档需求进行预测,即本例实现了准确度更高的通讯用户套餐升档预测。本例所述步骤S1中,所述用户基本信息数据集S包括用户唯一标识ID、套餐费、流量费、前三个月话费金额、超套次数、超套流量费、积分、用户等级、年龄、性别、通话档次、在网时长、前三个月语音时长均值、漫游用户、前三个月GPRS流量、前三个月话费均值以及前三个月流量均值中的任意一种或几种。本例所述更新后的用户基本信息数据集Sx同样包括用户唯一标识ID、套餐费、流量费、前三个月话费金额、超套次数、超套流量费、积分、用户等级、年龄、性别、通话档次、在网时长、前三个月语音时长均值、漫游用户、前三个月GPRS流量、前三个月话费均值以及前三个月流量均值中的任意一种或几种,该更新后的用户基本信息数本文档来自技高网...

【技术保护点】
1.一种基于集成模型的通讯用户升档预测概率识别方法,其特征在于,包括以下步骤:步骤S1,将用户基本信息数据存放至数据库中,得到用户基本信息数据集S;步骤S2,对所述用户基本信息数据集S进行数据检测,并经过标准化处理后得到数据集St;步骤S3,将数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出进行集成模型训练,得到训练好的集成模型;步骤S4,将更新后的用户基本信息数据集Sx输入至所述步骤S3训练好的集成模型中,输出并展示用户次月是否办理套餐升档的预测数据集Sy。

【技术特征摘要】
1.一种基于集成模型的通讯用户升档预测概率识别方法,其特征在于,包括以下步骤:步骤S1,将用户基本信息数据存放至数据库中,得到用户基本信息数据集S;步骤S2,对所述用户基本信息数据集S进行数据检测,并经过标准化处理后得到数据集St;步骤S3,将数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出进行集成模型训练,得到训练好的集成模型;步骤S4,将更新后的用户基本信息数据集Sx输入至所述步骤S3训练好的集成模型中,输出并展示用户次月是否办理套餐升档的预测数据集Sy。2.根据权利要求1所述的基于集成模型的通讯用户升档预测概率识别方法,其特征在于,所述步骤S2包括以下子步骤:步骤S201,检测所述用户基本信息数据集S中的异常值和缺失值;步骤S202,将异常值设置为缺失值;步骤S203,对缺失值用零填充,得到数据清洗之后的数据源S_;步骤S204,对数据源S_进行标准化处理得到数据集St。3.根据权利要求2所述的基于集成模型的通讯用户升档预测概率识别方法,其特征在于,所述步骤S204中,通过公式对数据源S_进行标准化处理得到数据集St,其中,xn代表数据源S—中数据集的第n条数据,n代表的是数据的样本数量,代表所有样本数据的均值,σ代表所有样本数据的标准差。4.根据权利要求3所述的基于集成模型的通讯用户升档预测概率识别方法,其特征在于,通过公式计算所有样本数据的均值通过公式计算所有样本数据的标准差σ。5.根据权利要求1至4任意一项所述的基于集成模型的通讯用户升档预测概率识别方法,其特征在于,所述步骤S3中,所述集成模型包含了逻辑回归模型、决策树模型和朴素贝叶斯模型;将所述数据集St作为输入,将用户次月是否办理套餐升档的数据yn作为输出,分别在逻辑回归模型、决策树模型和朴素贝叶斯模型中同时进行训练,并通过验证的方式分别优化所述逻辑回归模型、决策树模...

【专利技术属性】
技术研发人员:周洪峰雷奥林邹秋艳
申请(专利权)人:深圳微品致远信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1