当前位置: 首页 > 专利查询>辽宁大学专利>正文

一种基于改进模型迁移学习的微震事件识别方法技术

技术编号:29403081 阅读:68 留言:0更新日期:2021-07-23 22:41
一种基于改进模型迁移学习的微震事件识别方法,步骤1)时间序列数据的预处理;步骤2)CNN特征提取;步骤3)LSTM特征提取;步骤4)源域特征及时间序列特征迁移;步骤5)微震分类器生成与识别。本发明专利技术通过上述方法,提供了一种基于改进模型迁移学习的微震事件识别方法,在考虑微震数据图像特征的同时,迁移源域和原始时间序列数据的特征,最终实现微震事件的有效识别。

【技术实现步骤摘要】
一种基于改进模型迁移学习的微震事件识别方法
本专利技术属于微震事件数据处理领域,涉及一种微震事件的识别方法,专利技术具体始终涉及一种基于改进模型迁移学习的微震事件识别方法。
技术介绍
矿山微震监测系统运用于大部分矿区中,其源源不断地产生大量的微震数据。由于这些数据有混入噪声及其他干扰信号的可能性,使得微震数据及其复杂。微震数据一般具有数据量大、维度高、更新快等特点。微震事件识别问题是微震大数据处理领域中的重点问题,具有较高的应用价值。微震事件识别任务中,基于深度学习的CNN和LSTM等神经网络技术是解决微震事件识别问题的有效方法。基于神经网络的识别方法具有以下优势:模型针对微震事件数据自动提取特征,特征逐层传递;通过参数共享机制大大减小了参数的数量,显著提高了计算机的处理效率;参数系统随机设置并通过反向误差回传机制被逐步修改,提高分类的准确性。CNN主要通过卷积操作对微震事件图像数据进行特征提取,共享权重并且网络结构加深;LSTM通过对微震事件时间序列数据进行特征提取,能够解决长期依赖关系,可以防止梯度消失并使时间序列数据在较长的时间跨度内充分利用时间信息。现有的微震事件识别方法主要存在两方面的问题。一方面,由于微震事件数据量过小,在训练神经网络模型时容易出现过拟合等问题;另一方面,基于神经网络的微震事件识别模型效率和精度不高。因此,本专利技术基于神经网络和迁移学习的方法,首先构建CNN和LSTM模型,利用CNN和LSTM分别对图像和时间序列数据进行特征提取;然后结合迁移学习的思想,对源域数据进行特征迁移学习来解决数据量小的问题,同时对时间序列数据的特征进行迁移学习,最终提出一种基于改进模型迁移学习的微震事件识别方法。
技术实现思路
为了解决现有微震事件识别方法的不足,本专利技术提供一种基于改进模型迁移学习的微震事件识别方法,能够快速有效地处理微震事件数据准确识别的问题。为了实现上述目的,本专利技术创造采用了如下技术方案:一种基于改进模型迁移学习的微震事件识别方法,其步骤为:步骤1)时间序列数据的预处理:把源域和目标域时间序列数据转化为图像,并对目标域进行选取有效时间序列数据操作;步骤2)CNN特征提取过程:通过卷积层、池化层和全连接层的特征提取,得到每层对应的权重w和偏置值b;步骤3)LSTM特征提取过程:添加注意力机制评估,使得数据对应权值改变,通过LSTM的输入门、忘记门、内部记忆单元和输出门进行时间序列数据的特征提取;步骤4)源域特征及时间序列特征迁移:大样本源域特征对卷积层、池化层和第一层全连接层的迁移,图像所对应原始时间序列数据通过LSTM循环神经网络处理后进行第二层全连接层的特征迁移;步骤5)微震分类器生成与识别:通过数据标签与特征的对应关系,训练模型生成分类器,最终实现微震事件的识别。所述的步骤1)中,具体步骤为:1.1)时间序列数据转化为图像:利用MATLAB对源域和目标域时间序列数据的xyz三分量数值求平均值,画出微震数据图像;1.2)选取有效时间序列数据:1.2.1)长短时窗法选取:设定两个时窗,一个较长的叫长时窗,一个较短的叫短时窗,他们合二为一叫一个大的滑动窗口,该滑动窗口在时间序列的起始点进行滑动,每次滑动点数K,每次滑动后按照如下公式计算:阈值T=短时窗内点幅值之和average/长时窗内点幅值之和average,当阈值T大于某个经验值时,认为长时窗与短时窗接壤的点为P波到时点,该时间序列数据就为有效时间序列数据;1.2.2)时间序列数据对齐:从原始震源事件文件中读取的原始时间序列记录长度并不一致,需对原始时间序列的长度作对齐操作,对于不足设定长度采样点的时间序列,在原观测时间序列数据前补0,使其整段时间序列长度统一。所述的步骤2)中,具体步骤为:2.1)卷积层特征提取:在离散的三维彩色原始数据图像空间中,图像和卷积核分别定义为(H,W,C)和(k1,k2,c)的三维张量,其中H、W、C分别表示图像的长度、宽度和通道数,c表示通道数对应卷积核个数;m、n为空间坐标,分别表示第c个图像通道上第m行和第n列的像素点;当一个卷积核在彩色图像I上滑动运算时,多维张量的卷积运算可以表示为:其中Km,m,c表示第c个图像通道坐标为mn的卷积核的值大小,Ii+m,j+n,c表示第c个图像中i+m和j+n所对应的区域大小;当一个卷积核在彩色图像上滑动到Im,n位置上,卷积层的特征图可以表示为:其中u、v表示图像所滑动的横纵坐标步长,p、q表示卷积核中所对应的横纵坐标,bp,q为输出特征图所对应的偏置值,σ为ReLU激活函数;2.2)池化层特征提取:使用最大池化函数进行池化,p、q、m、n表示所选定池化的区域;2.3)全连接层特征提取:全连接层中的每个神经元与其前一层的所有神经元进行全连接;全连接层可以整合卷积层和池化层中具有类别区分性的局部信息,并负责对特征进行进一步的降维和提纯;用l表示全连接层的个数,每层有n个神经元,激活后全连接层的计算过程如公式如下:其中σ为激活函数,表示激活后的全连接层的值,表示下标为ij的全连接层权重的大小,表示该层全连接层的值,表示对应层的偏置值。所述的步骤3)中,具体步骤为:3.1)注意力机制评估:由微震事件时间序列数据特点得出P波到时之后的特征相对明显,因此引入注意力机制进行权值评估;3.1.1)运用softmax()函数归一化计算权重的大小,使有用时间序列数据信息权值变大,无用时间序列数据信息权值变小;3.1.2)计算权值与原始时间序列数据的值得到注意力机制评估后的值,作为LSTM的输入,使有用时间序列数据信息增大;3.2)LSTM特征提取:LSTM由忘记门、输入门、内部记忆单元和输出门来控制细胞状态,通过这些门控功能来进行信息传递,提取时间序列数据的特征,公式如下:遗忘门ft=σ(Wf·[ht-1,xt]+bf)输入门it=σ(Wi·[ht-1,xt]+bi)内部记忆单元输出门ot=σ(Wo·[ht-1,xt]+bo)ht=ot*tanh(Ct)其中xt为时间序列数据的输入,ht为时间序列数据的输出,W和b分别为权重和偏置值,σ表示sigmoid()激活函数,tanh表示tanh()激活函数;经过LSTM对时间序列数据的处理之后,输入到全连接层。所述的步骤4)中,具体步骤为:4.1)对源域数据的特征迁移学习:源域数据为大地震数据集,目标数据为小微震数据集,地震领域与矿山微震领域相似;源域数据集定义为(xs,ys),目标数据集定义为(xt,yt),其中x和y分别为数据和相应的标签;用源域数据集训练好一个完整的CNN模型,得到每层的权重w和偏置b,把得到的特征迁移到第一层全连接层和之前的卷积、池化层,把源域的特征迁移到模型中去;4.2)对时间序列数据的特征迁移学习:时间序列数据经过LSTM的特征本文档来自技高网
...

【技术保护点】
1.一种基于改进模型迁移学习的微震事件识别方法,其特征在于:其步骤为:/n步骤1)时间序列数据的预处理:把源域和目标域时间序列数据转化为图像,并对目标域进行选取有效时间序列数据操作;/n步骤2)CNN特征提取过程:通过卷积层、池化层和全连接层的特征提取,得到每层对应的权重w和偏置值b;/n步骤3)LSTM特征提取过程:添加注意力机制评估,使得数据对应权值改变,通过LSTM的输入门、忘记门、内部记忆单元和输出门进行时间序列数据的特征提取;/n步骤4)源域特征及时间序列特征迁移:大样本源域特征对卷积层、池化层和第一层全连接层的迁移,图像所对应原始时间序列数据通过LSTM循环神经网络处理后进行第二层全连接层的特征迁移;/n步骤5)微震分类器生成与识别:通过数据标签与特征的对应关系,训练模型生成分类器,最终实现微震事件的识别。/n

【技术特征摘要】
1.一种基于改进模型迁移学习的微震事件识别方法,其特征在于:其步骤为:
步骤1)时间序列数据的预处理:把源域和目标域时间序列数据转化为图像,并对目标域进行选取有效时间序列数据操作;
步骤2)CNN特征提取过程:通过卷积层、池化层和全连接层的特征提取,得到每层对应的权重w和偏置值b;
步骤3)LSTM特征提取过程:添加注意力机制评估,使得数据对应权值改变,通过LSTM的输入门、忘记门、内部记忆单元和输出门进行时间序列数据的特征提取;
步骤4)源域特征及时间序列特征迁移:大样本源域特征对卷积层、池化层和第一层全连接层的迁移,图像所对应原始时间序列数据通过LSTM循环神经网络处理后进行第二层全连接层的特征迁移;
步骤5)微震分类器生成与识别:通过数据标签与特征的对应关系,训练模型生成分类器,最终实现微震事件的识别。


2.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤1)中,具体步骤为:
1.1)时间序列数据转化为图像:利用MATLAB对源域和目标域时间序列数据的xyz三分量数值求平均值,画出微震数据图像;
1.2)选取有效时间序列数据:
1.2.1)长短时窗法选取:设定两个时窗,一个较长的叫长时窗,一个较短的叫短时窗,他们合二为一叫一个大的滑动窗口,该滑动窗口在时间序列的起始点进行滑动,每次滑动点数K,每次滑动后按照如下公式计算:阈值T=短时窗内点幅值之和average/长时窗内点幅值之和average,当阈值T大于某个经验值时,认为长时窗与短时窗接壤的点为P波到时点,该时间序列数据就为有效时间序列数据;
1.2.2)时间序列数据对齐:从原始震源事件文件中读取的原始时间序列记录长度并不一致,需对原始时间序列的长度作对齐操作,对于不足设定长度采样点的时间序列,在原观测时间序列数据前补0,使其整段时间序列长度统一。


3.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤2)中,具体步骤为:
2.1)卷积层特征提取:在离散的三维彩色原始数据图像空间中,图像和卷积核分别定义为(H,W,C)和(k1,k2,c)的三维张量,其中H、W、C分别表示图像的长度、宽度和通道数,c表示通道数对应卷积核个数;m、n为空间坐标,分别表示第c个图像通道上第m行和第n列的像素点;当一个卷积核在彩色图像I上滑动运算时,多维张量的卷积运算可以表示为:



其中Km,m,c表示第c个图像通道坐标为mn的卷积核的值大小,Ii+m,j+n,c表示第c个图像中i+m和j+n所对应的区域大小;
当一个卷积核在彩色图像上滑动到Im,n位置上,卷积层的特征图可以表示为:



其中u、v表示图像所滑动的横纵坐标步长,p、q表示卷积核中所对应的横纵坐标,bp,q为输出特征图所对应的偏置值,σ为ReLU激活函数;
2.2)池化层特征提取:使用最大池化函数进行池化,p、q、m、n表示所选定池化的区域;
2.3)全连接层特征提取:全连接层中的每个神经元与其前一层的所有神经元进行全连接;全连接层可以整合卷积层和池化层中具有类别区分性的局部信息,并负责对特征进行进一步的降维和提纯;用l表示全连接层的个数,每层有n个神经元,激活后全连接层的计算过程如公式如下:



其中σ为激活函数,表示激活后的全连接层的值,表示下标为ij的全连接层权重的大小,表示该层全连接层的值,表示对应层的偏置值。


4.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤3)中,具体步骤为:
3.1)注意力机制评估:由微震事件时间序列数据特点得出P波到时之后的特征相对明显,因此引入注意力机制进行权值评估;
3.1.1)运用softmax...

【专利技术属性】
技术研发人员:丁琳琳曹鲁杰于海友潘一山张翰林
申请(专利权)人:辽宁大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1