面向家宽用户的投诉预测方法及系统技术方案

技术编号:37137295 阅读:11 留言:0更新日期:2023-04-06 21:38
本发明专利技术公开了面向家宽用户的投诉预测方法及系统,属于数据处理技术领域,要解决的技术问题为如何对用户投诉进行预测,实现投诉处理的前移性。包括如下步骤:以历史家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常数据并进行特征选择,得到作为样本数据的历史家宽数据;构建异常值检测模型以及用户投诉预测模型,以样本数据为输入,对所述异常值检测模型以及用户投诉模型进行模型训练;以待测家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常值并进行特征选择,得到作为待测数据的实时家宽数据;通过到训练后异常值检测模型对输入数据进行异常值检测,并通过训练后用户投诉预测模型预测用户投诉概率。过训练后用户投诉预测模型预测用户投诉概率。过训练后用户投诉预测模型预测用户投诉概率。

【技术实现步骤摘要】
面向家宽用户的投诉预测方法及系统


[0001]本专利技术涉及数据处理
,具体地说是面向家宽用户的投诉预测方法及系统。

技术介绍

[0002]现有面向家宽单用户投诉的分析方法为统计每个用户实际投诉数据,并通过人工分析投诉数据及性能KPI指标发现问题,从而根据用户投诉内容进行家宽上网业务质量分析及优化,无法提前预测上网业务中断、性能劣化等问题引起的单用户投诉,预先采取措施,避免用户投诉。
[0003]随着应用业务的增加,用户的投诉类型也越来越多,人工分析变得越来越困难,且人工进行数据分析缺乏对用户的全面了解,人工发现问题的方法只能进行投诉事后处理,缺乏投诉处理前移性,突发问题,无法预警,无法进行主动关怀,对于突发问题,无法预警,无法进行主动关怀,优化人员针对已有的投诉问题进行派单等一系列处理,处理手段分散,无法实现统一调度。
[0004]如何对用户投诉进行预测,实现投诉处理的前移性,是需要解决的技术问题。

技术实现思路

[0005]本专利技术的技术任务是针对以上不足,提供面向家宽用户的投诉预测方法及系统,来解决如何对用户投诉进行预测,实现投诉处理的前移性的技术问题。
[0006]第一方面,本专利技术一种面向家宽用户的投诉预测方法,包括如下步骤;
[0007]获取历史家宽数据,所述历史家宽数据包括基础数据、性能数据、上网数据和TCP链路数据;
[0008]以所述历史家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常数据并进行特征选择,得到作为样本数据的历史家宽数据;
[0009]构建异常值检测模型以及用户投诉预测模型,以样本数据为输入,对所述异常值检测模型以及用户投诉模型进行模型训练,得到训练后异常值检测模型以及训练后用户投诉预测模型;
[0010]获取待测家宽数据,所述待测家宽数据包括基础数据、性能数据、上网数据和TCP链路数据;
[0011]以所述待测家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常值并进行特征选择,得到作为待测数据的实时家宽数据;
[0012]以所述待测数据为输入数据,通过到训练后异常值检测模型对输入数据进行异常值检测,并通过训练后用户投诉预测模型预测用户投诉概率。
[0013]作为优选,对所述目标数据进行数据预处理,包括如下步骤:
[0014]对所述目标数据进行缺失值处理以及离群值处理,去除异常数据;
[0015]对去除异常数据后的目标数据进行特征编码以及数据标准化处理,得到格式统一
的目标数据;
[0016]通过降维方法对格式统一的目标数据进行特征选择,所述降维方法包括PCA降维方法。
[0017]作为优选,所述异常值检测模型用于通过孤立森林算法进行异常值检测;
[0018]以样本数据为输入,对所述异常值检测模型进行模型训练,包括如下步骤:
[0019]将样本数据划分为训练样本和测试样本;
[0020]基于训练数据建立孤立树;
[0021]通过孤立树计算每个测试数据的异常分数,对所述孤立树进行评价;
[0022]对应的,以待测数据为输入,通过所述训练后异常值检测模型对待测数据进行异常值检测。
[0023]作为优选,所述异常值检测模型用于通过单特征高斯分布进行异常值检测;
[0024]以样本数据为输入,对所述异常值检测模型级进行模型训练,包括如下步骤:
[0025]计算历史家宽数据的均值;
[0026]计算历史家宽数据的均值;
[0027]计算历史家宽数据的标准差;
[0028]对应的,训练后异常值检测模型通过如下步骤进行异常值检测:如果待检测家宽数据不在均值正负两个标准差之内,标记为告警数据。
[0029]作为优选,
[0030]所述用户投诉预测模型用于通过逻辑回归算法预测用户投诉概率;
[0031]以样本数据为输入,对所述用户投诉模型进行模型训练,包括如下步骤:
[0032]构建预测分类函数,所述预测分类函数用于通过逻辑回归算法预测用户投诉概率;
[0033]通过预测分类函数预测输入数据的分类结果;
[0034]构造损失函数,所述损失函数表示输出分类结果与实际分类结果之间的偏差,所述输出分类结果为通过预测分类函数计算得到的分类结果,所述实际分类结果为输入数据对应的实际结果,所述分类结果为用户投诉概率值;
[0035]对所有输入数据的偏差计算R方差作为评价标准,将所述评价标准作为损失函数J(θ)函数;
[0036]通过梯度下降方法求解所述损失函数,得到训练后预测分类函数;
[0037]对应的,通过训练后用户投诉预测模型预测用户投诉概率,包括如下步骤:
[0038]通过所述训练后预测分类函数计算每个待测数据的分类结果;
[0039]使用sigmoid函数将多个特征进行线性求和,表达式为能够实现将分类结果转化成一个区分二分类问题的结果,并将分类结果约束到(0,1)。
[0040]第二方面,本专利技术一种面向家宽用户的投诉预测系统,用于通过如第一方面任一项所述的面向家宽用户的投诉预测方法对家宽用户的投诉进行预测,所述系统包括:
[0041]数据采集模块,所述数据采集模块用于获取历史数据和待测家宽数据,所述历史家宽数据和待测家宽数据均包括基础数据、性能数据、上网数据和TCP链路数据;
[0042]数据预处理模块,所述数据预处理模块用于以所述历史家宽数据为目标数据,对
所述目标数据进行数据预处理,去除异常数据并进行特征选择,得到作为样本数据的历史家宽数据;并用于以以所述待测家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常值并进行特征选择,得到作为待测数据的实时家宽数据;
[0043]模型构建模块,所述模型构建模块用于构建异常值检测模型以及用户投诉预测模型,以样本数据为输入,对所述异常值检测模型以及用户投诉模型进行模型训练,得到训练后异常值检测模型以及训练后用户投诉预测模型;
[0044]投诉预测模块,所述投诉预测模块用于以所述待测数据为输入数据,通过到训练后异常值检测模型对输入数据进行异常值检测,并通过训练后用户投诉预测模型预测用户投诉概率。
[0045]作为优选,所述数据预处理模块用于执行如下:
[0046]对所述目标数据进行缺失值处理以及离群值处理,去除异常数据;
[0047]对去除异常数据后的目标数据进行特征编码以及数据标准化处理,得到格式统一的目标数据;
[0048]通过降维方法对格式统一的目标数据进行特征选择,所述降维方法包括PCA降维方法。
[0049]作为优选,所述异常值检测模型用于通过孤立森林算法进行异常值检测;
[0050]所述模型构建模块用于通过如下步骤对所述异常值检测模型进行模型训练:
[0051]将样本数据划分为训练样本和测试样本;
[0052]基于训练数据建立孤立树;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向家宽用户的投诉预测方法,其特征在于,包括如下步骤;获取历史家宽数据,所述历史家宽数据包括基础数据、性能数据、上网数据和TCP链路数据;以所述历史家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常数据并进行特征选择,得到作为样本数据的历史家宽数据;构建异常值检测模型以及用户投诉预测模型,以样本数据为输入,对所述异常值检测模型以及用户投诉模型进行模型训练,得到训练后异常值检测模型以及训练后用户投诉预测模型;获取待测家宽数据,所述待测家宽数据包括基础数据、性能数据、上网数据和TCP链路数据;以所述待测家宽数据为目标数据,对所述目标数据进行数据预处理,去除异常值并进行特征选择,得到作为待测数据的实时家宽数据;以所述待测数据为输入数据,通过到训练后异常值检测模型对输入数据进行异常值检测,并通过训练后用户投诉预测模型预测用户投诉概率。2.根据权利要求1所述的面向家宽用户的投诉预测方法,其特征在于,对所述目标数据进行数据预处理,包括如下步骤:对所述目标数据进行缺失值处理以及离群值处理,去除异常数据;对去除异常数据后的目标数据进行特征编码以及数据标准化处理,得到格式统一的目标数据;通过降维方法对格式统一的目标数据进行特征选择,所述降维方法包括PCA降维方法。3.根据权利要求1所述的面向家宽用户的投诉预测方法,其特征在于,所述异常值检测模型用于通过孤立森林算法进行异常值检测;以样本数据为输入,对所述异常值检测模型进行模型训练,包括如下步骤:将样本数据划分为训练样本和测试样本;基于训练数据建立孤立树;通过孤立树计算每个测试数据的异常分数,对所述孤立树进行评价;对应的,以待测数据为输入,通过所述训练后异常值检测模型对待测数据进行异常值检测。4.根据权利要求1所述的面向家宽用户的投诉预测方法,其特征在于,所述异常值检测模型用于通过单特征高斯分布进行异常值检测;以样本数据为输入,对所述异常值检测模型级进行模型训练,包括如下步骤:计算历史家宽数据的均值;计算历史家宽数据的均值;计算历史家宽数据的标准差;对应的,训练后异常值检测模型通过如下步骤进行异常值检测:如果待检测家宽数据不在均值正负两个标准差之内,标记为告警数据。5.根据权利要求1

4任一项所述的面向家宽用户的投诉预测方法,其特征在于,所述用户投诉预测模型用于通过逻辑回归算法预测用户投诉概率;以样本数据为输入,对所述用户投诉模型进行模型训练,包括如下步骤:
构建预测分类函数,所述预测分类函数用于通过逻辑回归算法预测用户投诉概率;通过预测分类函数预测输入数据的分类结果;构造损失函数,所述损失函数表示输出分类结果与实际分类结果之间的偏差,所述输出分类结果为通过预测分类函数计算得到的分类结果,所述实际分类结果为输入数据对应的实际结果,所述分类结果为用户投诉概率值;对所有输入数据的偏差计算R方差作为评价标准,将所述评价标准作为损失函数J(θ)函数;通过梯度下降方法求解所述损失函数,得到训练后预测分类函数;对应的,通过训练后用户投诉预测模型预测用户投诉概率,包括如下步骤:通过所述训练后预测分类函数计算每个待测数据的分类结果;使用sigmoid函数将多个特征进行线性求和,表达式为能够实现将分类结果转化成一个区分二分类问题的结果,并将分类结果约束到(0,1)。6.一种面向家宽用户的投诉预测系统,其特征在于,用于通过如权利要求1

5任一项所述的面...

【专利技术属性】
技术研发人员:张梦妍刘康张京辉
申请(专利权)人:浪潮通信信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1