基于支持向量回归算法的抽油机井检泵周期预测方法技术

技术编号:28126813 阅读:27 留言:0更新日期:2021-04-19 11:42
本发明专利技术设计一种基于支持向量回归(SVR)算法的抽油机井检泵周期预测方法,属于油井检测技术领域。该方法包括获取有关检泵周期数据集;进行数据清洗、数据预处理;灰度关联分析算法找出主控因素;基于滑动窗口的方法构造数据体;根据SVR算法建立模型,寻找出最优精度模型进行预测。本发明专利技术由于采取以上技术方案,可以更好的解决由于抽油泵使用年限和作业队伍数量限制等原因造成对井产油量的严重影响和巨大经济损失,为油田检泵方法提供一种新的检泵周期预测方式。周期预测方式。

【技术实现步骤摘要】
基于支持向量回归算法的抽油机井检泵周期预测方法


[0001]本专利技术涉及一种周期预测方法,特别涉及一种基于支持向量回归(SVR)算法的抽油机井检泵周期预测方法,属于油井检测


技术介绍

[0002]在机械采油工艺中,有杆泵采油方式在我国的原油开采中占据十分重要的地位。当下油田对抽油机井广泛采用使用维修策略,即当某种故障导致油井不能正常生产时再进行维修。频繁检泵不仅造成产量损失,而且增加作业成本,而且由于使用年限以及作业队伍数量的限制等原因,有时导致部分油井待作业时间较长,严重影响油井产量,造成巨大经济损失。
[0003]近些年来,基于状态维护的方式受到越来越多的关注,其中基于周期预测来进行维护的方式是关键的环节。因此研究抽油机井检泵周期预测模型,通过灰度关联算法分析主控因素,网格遍历算法寻找最优精度模型来提高模型准确率具有重要的理论和实际意义,将大幅度提高油田整体开发经济效益。

技术实现思路

[0004]针对上述问题,本专利技术的目的是避免传统抽油机井检泵维修策略方法的不确定性造成的人力资源和财力资源大量浪费,从而提高油田作业队伍的作业质量和整体经济效益。
[0005]为实现上述目的,本专利技术采取以下技术方案:基于支持向量回归算法的抽油机井检泵周期预测方法,其包括以下几个步骤:
[0006](1)采集油田抽油机井的生成数据,抽油机状态数据,检泵周期数据。
[0007](2)对采集的数据进行数据清洗,数据预处理。
[0008](3)找出主控因素,加强数据间时序性强度重新构建数据体。
[0009](4)进行算法建模,寻找最优模型参数。
[0010](5)构建SVR算法模型
[0011]所述步骤1),采集的生成数据和抽油机状态数据作为模型自变量,检泵周期数据即上次各种措施后下泵正常启抽之日至本次失效之日的间隔天数段作为因变量。
[0012]所述步骤2),通过均方差法对异常数据进行去除,通过最大

最小标准化将数据映射到[0,1]区间。
[0013]所述步骤3),通过灰度关联算法对所有特征值进行一个关联性大小排序,从而来筛选主要影响输出的特征值。通过滑动窗口方法设置窗口大小和步长来对重新构建数据,加强数据间的时序性强度。
[0014]所述步骤4),通过步骤3)所选取的特征值和重构后的数据体作为模型的训练数据,检泵周期作为算法的输出值来构建SVR模型。使用网格搜索算法来寻找最优惩罚参数c和核函数参数g。
[0015]所述步骤5),对步骤4)寻找的最优值来设置SVR的参数,并将数据输入SVR模型,得到最优预测精确度的模型。
[0016]本专利技术由于采取以上技术方案,其具有以下优点:1、本专利技术通过均方差法去除了异常数据,提高了数据的准确性,通过标准化去除量纲,使不同的特征具有可比性,消除量纲引起的特征数值量级别对分析结果的影响。2、通过灰度关联分析算法找出最具有代表性的影响周期变化的特征,又基于滑动窗口的设置,让数据之间的联系性加强,提高模型预测的准确性。
附图说明
[0017]图1.检泵周期预测算法流程图;
[0018]图2.SVR示意图;
[0019]图3.滑动窗口示意图。
具体实施方式
[0020]为了更加清晰的阐述本专利技术的技术方案,下面结合附图和实施例对本专利技术进行详细的描述。
[0021]本实施方式所述的一种基于支持向量回归算法的抽油机井检泵周期预测方法流程图如图1,该方法具体通过以下步骤实现:
[0022]1.采集了油田连续10年的抽油机状态数据,生成数据,检泵周期数据。具体得到了如日产油量,日产水量,日产气量,日生产时间,含水率,上行电流,下行电流,冲次,冲程,泵径,泵深,排量,最大载荷,最小载荷等作为算法所需自变量,得到了油田抽油机井每次检泵的周期作为算法所需因变量。
[0023]2.对每个特征数据进行统计和分布查询,通过均方差法筛选异常数据。由于油井数据具有不同的量纲和数量级,如果直接使用筛选后的数据进行建模训练,数据中值较高的对算法影响较大,从而忽略了数值均值较低的特征。因此要对筛选后的数据,进行min

max标准化,将每个特征值结果映射到[0,1]之间,具体转换函数如下:
[0024][0025]其中x,min,max分别是特征值的样本数据,特征值样本数据中最小值,特征值样本数据中最大值。
[0026]3.对步骤2的数据进行灰度关联算法分析,对所有特征值(子序列)与检泵周期(母序列)进行关联度计算,得到关联度大小排序,找出与检泵周期关联性最大的前8个特征值作为模型的输入。其中关于子序列的各个指标与母序列的关联系数计算方法如下:
[0027][0028]式中ρ为分辨系数,0<ρ<1,若ρ越小,关联系数间差异越大,区分能力越强。通常ρ取0.5。x0(k),x
i
(k)分别表示母序列第k个数,子序列第i个特征值的第k个数。ζ
i
(k)则表示第i个特征的第k个值与母序列第k个值的关联系数。通过关联系数来计算关联度再进行最
后的排序。其中关联度得计算如下:
[0029][0030]其中r
i
为第i个特征与母序列的关联度大小,n为样本数量。最后对所有进r
i
行排序即可得到关联度排序,最终所选主控因素为:冲程,冲次,泵径,泵深,沉没度,含水率,最大载荷,最小载荷。
[0031]4.对步骤3选取后的数据进行基于滑动时间窗口的方式进行数据更改,如图3所示示意图。选取窗口大小为100,步长为10,更改数据体,从而加强数据间时序性的强度。
[0032]5.对步骤4更改后的样本进行划分训练集和测试集,进行SVR算法建模,通过网格遍历搜索算法来遍历SVR算法中的核函数参数g和惩罚参数c,使用预测值与真实值的均方误差MSE作为模型的性能指标,均方误差越小模型越优,通过找到最小均方误差所设的参数来设置SVR最终模型参数。其中均方误差MSE计算方式为:
[0033][0034]其中第i个样本的预测值,y
i
为第i个样本的实际值,n为样本数量。
[0035]上述实施例仅用于说明本专利技术,其中各方法的实施步骤等都是可以有所变化的,凡是在本专利技术技术方案的基础上进行的等同变换和改进,均不应排除在本专利技术的保护范围之外。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于支持向量回归算法的抽油机井检泵周期预测方法,其包括如下步骤:1)采集影响检泵周期的样本数据,包括生产时间,日产液量,含水率,上行电流,下行电流,油压,套压,泵径,泵深,冲程,冲次,最大载荷,最小载荷;2)对采集的数据进行数据清洗,去除重复数据,奇异数据,选取完整检泵周期作为检泵周期数据体;3)对数据体进行去量纲预处理;4)采用灰度关联分析算法进行主控因素提取;5)基于支持向量回归建立预测模型。2.如权利要求1中所述的基于支持向量回归算法的抽油机井检泵周期预测方法,其特征在于,所述步骤2)对原始样本进行数据筛选,对每个特征值的均值和方差进行统计,选取数值范围为[均值

方差,均值+方差]。3.如权利要求1中所述的基于支持向量回归算法的抽油机井检泵周期预测方法,其特征在于,所述步骤3)对筛选后的数据再进行最大

最小标准化预处理,使数据分布在区间[0,1]。4.如权利要求1中所述的基...

【专利技术属性】
技术研发人员:刘新平邓杰杨鹏磊张晓东
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1