【技术实现步骤摘要】
本专利技术涉及数据挖掘领域,尤其涉及一种基于弱通配符的石油生产数据频繁模式挖掘方法。
技术介绍
时间序列是按时间次序排列的观测值集合。在工程、经济、自然科学和社会科学等等领域中,存在大量这样的观察数据。这类数据的顺序与大小反映了数据所包含的信息,反映了数据内部的相互联系。正是这种相互联系或相关性表征了产生这些数据的现象、过程、系统的“动态”或“记忆”。这种相关性一旦被定量地描述出来,就可以从系统的过去值预测其将来的值。时间序列分析是分析各种相依有序的离散数据集合的方法。其研究对象是一串随时间变化而又相互关联的动态数据。由于各自的物理背景不同,这种动态数据所包含的信息和呈现的规律也不同。处理的主要手段之一是根据数据的特征用相应的数学模型去作近似的描述。目前比较成熟的平稳序列的时间序列模型有MA模型、AR模型和ARMA模型。序列模式挖掘,序列模式挖掘是数据挖掘研究的一个重要的研究领域。目前,成熟的序列模式挖掘算法主要有三类:基于Apriori性质的候选码生成-测试的算法;基于垂直格式的候选码生成-测试的算法;基于投影数据库的模式增长算法。近年来,序列模式挖掘在分布式环境下的应用的研究逐渐成为热点,提出了各种算法。现有技术一的方案:根据图2的结果可知道,采用指数平滑的方法,在参数分别是0.2,0.5的情况下,平均误差分别为0.0275,0.01183。为了比较,设计一种朴素预测法方法,也就是假设今天的产量是x,直接预测明天的产量也将是x,用这种方法计算出来的产量的平均误差也仅仅只有0.0069。换而言之,指数平滑预测方法并没有优于直接的朴素预测。传统的预测方法 ...
【技术保护点】
一种基于弱通配符的石油生产数据频繁模式挖掘方法,其特征在于,S1将油田日产液量时序数据转换为编码序列;S2通过对编码序列进行挖掘,得到不同类型的频繁序列模式,从各种角度对油井进行全面刻画。
【技术特征摘要】
1.一种基于弱通配符的石油生产数据频繁模式挖掘方法,其特征在于,S1将油田日产液量时序数据转换为编码序列;S2通过对编码序列进行挖掘,得到不同类型的频繁序列模式,从各种角度对油井进行全面刻画。2.根据权...
【专利技术属性】
技术研发人员:汪敏,闵帆,邓魁,苏赋,李志伟,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。