本发明专利技术公开了一种电网客服话务量区间预测方法及系统,通过获取历史话务数据和话务量影响因素数据,并进行缺失值补充后,再对补充后的话务量影响因素数据进行相似日聚类。在利用预测模型对处理好的数据和聚类结果进行特征提取得到特征数据后,采用分位数回归模型对特征数据进行计算得到条件分位数,再采用非参数核密度估计方法对条件分位数进行计算得到区间预测结果,将区间预测结果发送给电网客户服务排班系统,以使电网客户服务排班系统根据区间预测结果进行话务排班调度。本方法通过结合话务影响因素对电网客服话务量概率进行预测,可以实现现代供电服务体系预测不确定性的有效量化,提高电网客服话务量区间预测的准确率。率。率。
【技术实现步骤摘要】
一种电网客服话务量区间预测方法及系统
[0001]本专利技术涉及话务量区间预测领域,尤其涉及一种电网客服话务量区间预测方法及系统。
技术介绍
[0002]随着社会的不断发展,电力客服中心规模不断壮大,作为企业与客户沟通的重要桥梁,发挥着越来越重要的作用,其运营管理模式也需要随着社会经济发展不断更新。目前电力客服中心话务量预测管理应用主要依靠历史经验,存在排班效率低、需求值与排班人员拟合度差、人力资源投入大、服务水平未达到期望值等问题。传统话务预测技术无法适应目前含现代供电服务中的增值业务的较复杂的服务场景,造成话务服务的人力资源利用不合理。目前,主要的话务量预测模型包括惯性预测、Kalman滤波、话务量OLAP分析等,均属于点预测。
[0003]区间预测可实现现代供电服务体系预测不确定性的有效量化,相较于经典确定性预测可提供更加全面的预测信息,为电力客服系统分析与决策提供关键数据支撑。
技术实现思路
[0004]本专利技术提供了一种电网客服话务量区间预测方法及系统,可实现现代供电服务体系预测不确定性的有效量化,提高电网客服话务量区间预测的准确率。
[0005]为了解决上述技术问题,本专利技术实施例提供了一种电网客服话务量区间预测方法,包括:获取历史话务数据和话务量影响因素数据,并对历史话务数据和话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据;对完整话务量影响因素数据进行相似日聚类得到完整话务量影响因素数据的聚类结果;将完整历史话务数据和完整话务量影响因素数据的聚类结果输入构建好的预测模型中,以使预测模型对完整历史话务数据和完整话务量影响因素数据的聚类结果进行特征提取得到特征数据后,采用分位数回归模型对特征数据进行计算得到不同分位数点的条件分位数,再采用非参数核密度估计方法对条件分位数进行计算得到区间预测结果,将区间预测结果发送给电网客户服务排班系统,以使电网客户服务排班系统根据区间预测结果进行话务排班调度。
[0006]实施本实施例,通过获取历史话务数据和话务量影响因素数据,并对历史话务数据和话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据,对完整话务量影响因素数据进行相似日聚类得到完整话务量影响因素数据的聚类结果,将完整历史话务数据和完整话务量影响因素数据的聚类结果输入构建好的预测模型中,以使预测模型对完整历史话务数据和完整话务量影响因素数据的聚类结果进行特征提取得到特征数据后,采用分位数回归模型对特征数据进行计算得到条件分位数,再采用非
参数核密度估计方法对条件分位数进行计算得到区间预测结果,将区间预测结果发送给电网客户服务排班系统,以使电网客户服务排班系统根据区间预测结果进行话务排班调度。本方法通过结合话务影响因素对电网客服话务量概率进行预测,可以实现现代供电服务体系预测不确定性的有效量化,提高电网客服话务量区间预测的准确率。
[0007]作为优选方案,对历史话务数据和话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据,具体为:通过利用相邻正常数据拟合多项式来获得历史话务数据的近似值和话务量影响因素数据的近似值;将近似值作为缺失值补充至历史话务数据和话务量影响因素数据后,得到完整历史话务数据和完整话务量影响因素数据。
[0008]实施本实施例,通过利用相邻正常数据拟合多项式来获得历史话务数据的近似值和话务量影响因素数据的近似值,将近似值作为缺失值补充至历史话务数据和话务量影响因素数据中,得到完整历史话务数据和完整话务量影响因素数据,通过对数据进行缺失值补充,同时也对数据的异常值进行了清洗,有利保证数据的完整性和准确度,提高预测精度。
[0009]作为优选方案,对完整话务量影响因素数据进行相似日聚类得到完整话务量影响因素数据的聚类结果,具体为:将完整话务量影响因素数据进行标准化后,选取多个中心点;将各个完整话务量影响因素数据日话务量影响因素数据分配到小于预设距离的中心点,得到多个簇并重新计算每个簇的中心点,作为完整话务量影响因素数据的聚类结果。
[0010]作为优选方案,采用分位数回归模型对特征数据进行计算得到不同分位数点的条件分位数,具体为:利用分位数回归函数对特征数据进行求解,得到不同分位数点的回归系数向量,其中,分位数回归函数为:其中,表示因变量P
p
的第τ个条件分位数,τ的范围为(0,1),β(τ)是回归系数的向量,表示为特征数据;对不同分位数点的回归系数向量进行求解得到不同分位数点的条件分位数,其中,求解公式为:其中,L为神经网络损失函数值,表示为特征数据,为不对称函数表示为:其中s为函数γ的自变量。
[0011]作为优选方案,采用非参数核密度估计方法对条件分位数进行计算得到区间预测
结果,具体为:利用非参数核密度估计函数对条件分位数进行计算得到区间预测结果,其中,核密度估计函数为:其中,V(u
a
)为第a个待预测日话务量的概率分布,u
a
为概率函数自变量,N
a
为a个待预测时刻的相似日数量,h为带宽,取h=0.01,K()为核函数,取核函数为高斯函数,G
P
为样本向量,G
P
=[,,
…
,]。
[0012]作为优选方案,预测模型是通过训练获得,具体为:将完整历史话务数据和完整话务量影响因素数据的聚类结果分为训练集和测试集;构建预测模型,并将完整历史话务数据和完整话务量影响因素数据的聚类结果输入预测模型中进行计算得到实际区间预测结果;根据误差函数将实际区间预测结果与期望区间预测结果进行对比得到误差,并根据误差更新模型参数,直到达到训练次数得到训练好的预测模型。
[0013]作为优选方案,为了解决相同的技术问题,本专利技术实施例还提供了一种电网客服话务量区间预测系统,包括数据获取模块、聚类模块和预测区间计算模块,其中,数据获取模块用于获取历史话务数据和话务量影响因素数据,并对历史话务数据和话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据;聚类模块用于对完整话务量影响因素数据进行相似日聚类得到完整话务量影响因素数据的聚类结果;预测区间计算模块用于将完整历史话务数据和完整话务量影响因素数据的聚类结果输入构建好的预测模型中,以使预测模型对完整历史话务数据和完整话务量影响因素数据的聚类结果进行特征提取得到特征数据后,采用分位数回归模型对特征数据进行计算得到不同分位数点的条件分位数,再采用非参数核密度估计方法对条件分位数进行计算得到区间预测结果,将区间预测结果发送给电网客户服务排班系统,以使电网客户服务排班系统根据区间预测结果进行话务排班调度。
[0014]作为优选方案,数据获取模块包括近似值计算单元和填充单元,近似值计算单元用于通过利用相邻正常数据拟合多项式来获得历史话务数据的近似值和话务量影响因素数据的近似值;填充单元用于将近似值作为缺失值补充至历史话务数据和话务量影响因素数据中,得到完整历史话务数本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种电网客服话务量区间预测方法,其特征在于,包括:获取历史话务数据和话务量影响因素数据,并对所述历史话务数据和所述话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据;对所述完整话务量影响因素数据进行相似日聚类得到所述完整话务量影响因素数据的聚类结果;将所述完整历史话务数据和所述完整话务量影响因素数据的聚类结果输入构建好的预测模型中,以使所述预测模型对所述完整历史话务数据和所述完整话务量影响因素数据的聚类结果进行特征提取得到特征数据后,采用分位数回归模型对所述特征数据进行计算得到不同分位数点的条件分位数,再采用非参数核密度估计方法对所述条件分位数进行计算得到区间预测结果,将所述区间预测结果发送给电网客户服务排班系统,以使电网客户服务排班系统根据所述区间预测结果进行话务排班调度。2.如权利要求1所述的电网客服话务量区间预测方法,其特征在于,所述对所述历史话务数据和所述话务量影响因素数据进行缺失值补充,得到完整历史话务数据和完整话务量影响因素数据,具体为:通过利用相邻正常数据拟合多项式来获得所述历史话务数据的近似值和所述话务量影响因素数据的近似值;将所述近似值作为缺失值补充至所述历史话务数据和所述话务量影响因素数据后,得到完整历史话务数据和完整话务量影响因素数据。3.如权利要求1所述的电网客服话务量区间预测方法,其特征在于,所述对所述完整话务量影响因素数据进行相似日聚类得到所述完整话务量影响因素数据的聚类结果,具体为:将所述完整话务量影响因素数据进行标准化后,选取多个中心点;将各个所述完整话务量影响因素数据日话务量影响因素数据分配到小于预设距离的中心点,得到多个簇并重新计算每个簇的中心点,作为所述完整话务量影响因素数据的聚类结果。4.如权利要求1所述的电网客服话务量区间预测方法,其特征在于,所述采用分位数回归模型对所述特征数据进行计算得到不同分位数点的条件分位数,具体为:利用分位数回归函数对所述特征数据进行求解,得到不同分位数点的回归系数向量,其中,所述分位数回归函数为:其中,表示因变量P
p 的第τ个条件分位数,τ的范围为(0,1),β(τ)是回归系数的向量,表示为特征数据;对所述不同分位数点的回归系数向量进行求解得到不同分位数点的条件分位数,其中,求解公式为:其中,L为神经网络损失函数值,表示为特征数据,为不对称函数表示为:
其中s为函数γ的自变量。5.如权利要求1述的电网客服话务量区间预测方法,其特征在于,所述采用非参数核密度估计方法对所述条件分位数进行计算得到区间预测结果,具体为:利用非参数核密度估计函数对所述条件分位数进行计算得到区间预测结果,其中,核密度估计函数为:其中,V(u
a
)为第a个待预测日话...
【专利技术属性】
技术研发人员:伍广斌,苏立伟,蒋崇颖,覃浩,康峰,林楷东,陈海燕,谭火超,王帅,张艳,
申请(专利权)人:广东电网有限责任公司客户服务中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。