本发明专利技术提供了一种用于生产过程数据建模的基于互相关的特征构造方法,用于智能制造领域产品质量预测问题。其包括以下步骤:对收集的生产过程数据进行规整与预处理;根据数据特性和任务目的,设置互相关算子的超参数;设定互相关算子的权重;对数据矩阵使用设定好的互相关算子进行操作,将互相关算子在感兴趣的数据区域进行滑动计算互相关算子;所有感兴趣区域用定义的互相关算子操作完后,得到特征矩阵;这些特征矩阵进行串联,则得到一个新的特征矩阵集合;得的特征矩阵可以用于机器学习的异常检测,分类,回归等任务,进而得到预测性维护的结果。
A feature construction method based on cross-correlation for data modeling of production process
【技术实现步骤摘要】
用于生产过程数据建模的基于互相关的特征构造方法
本专利技术涉及一种特征构造方法,具体涉及一种用于生产过程数据建模的基于互相关的特征构造方法,属于生产过程建模、互相关、机器学习、特征构造
技术介绍
产品的最终质量往往可以通过生产过程中收集到的数据反映。同构数据分析,可以起到预测最终产品质量的效果。然而,如何提取好的特征用于预测是一个很重要的技术问题。生产过程数据分析工作主要通过数据收集、机器学习建模和计算力支撑实现。数据一般存储与MES系统或者其他数据存储设备,经过处理和加工后形成可以使用的有用数据,这些数据表达生产过程中的各种要素(例如,加工工况、温度等信息)。健康状态的表达需要通过对数据的分析和洞察。传统的方法是基于人工的观察或者通过信号处理的方式提取特征进行分析。随着机器学习的流行和使用,基于统计机器学习的方法在智能制造领域得到更多的推广和使用。传统的基于信号处理的方法主要是通过傅里叶变换、小波变换、PCA降维,再根据专家经验进行特征选择和组合。机器学习则通过自动的方法提前特征,再结合分类或者回归算法进行结果预测。两种方法各有优劣。基于机器学习的特征提取方法非常多,可分为特征提取、特征降维、新特征构造,这些方法都可以被统一称作特征工程。构造出的特征可以用于机器学习模型的建模和预测。在很多的实践中,例如一些数据竞赛,获奖选手往往都采用了新的方法构造出更多的特征,从而得到更好的预测效果。采用的方法一般是对原始数据的加减乘除,或者多项式特征,不是很全面。
技术实现思路
本专利技术目的是提供了一种用于生产过程数据建模的基于互相关的特征构造方法,用于智能制造领域产品质量预测问题。本专利技术为实现上述目的,通过以下技术方案实现:一种用于生产过程数据建模的基于互相关的特征构造方法,包括以下步骤:S1.对收集的生产过程数据进行规整与预处理;S2.根据数据特性和任务目的,设置互相关算子的超参数;S3.设定互相关算子的权重;S4.对数据矩阵使用设定好的互相关算子进行操作,将互相关算子在感兴趣的数据区域进行滑动计算互相关算子;S5.所有感兴趣区域用定义的互相关算子操作完后,得到特征矩阵;S6.这些特征矩阵进行串联,则得到一个新的特征矩阵集合;S7.得的特征矩阵可以用于机器学习的异常检测,分类,回归等任务,进而得到预测性维护的结果。所述用于生产过程数据建模的基于互相关的特征构造方法优选方案,经过规整与预处理的数据是多维的,且具有相同的样本数据,形成M行N列数据矩阵。所述用于生产过程数据建模的基于互相关的特征构造方法优选方案,设置互相关算子的超参数过程如下:给定一个图像,互相关算子,它们的互相关为:,其中M代表样本数,N代表每条样本所包含的变量个数。本专利技术的优点在于:本专利技术提出的方法是基于互相关算子,不需要使用数据进行训练,需要用定义好的互相关算子对原始数据进行新的特征构造,构造出的特征可以用于机器学习模型的建模和预测;通过一个预定义好的互相关算子在已有的采样样本上进行滑动,将感兴趣区域内的信息通过线性或者非线性变换提取出来,这种做法的优势在于可以灵活地将当前样本的上下文信息提取到,从而更加准确全面地描述当前样本的状态,达到提升预测准确率的效果。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。图1为本专利技术流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种用于生产过程数据建模的基于互相关的特征构造方法,包括以下步骤:S1.对收集的生产过程数据进行规整与预处理,经过规整与预处理的数据应该是多维的,且具有相同的样本数据,形成M行N列数据矩阵;S2.根据数据特性和任务目的,设置互相关算子的超参数,包括大小、操作的步长、算子的个数、是否补0填充;设置互相关算子的超参数过程如下:给定一个图像,互相关算子,它们的互相关为:,其中M代表样本数,N代表每条样本所包含的变量个数;S3.设定互相关算子的权重;假设在时间维度上尽可能保留上下文的信息,设置一个行数较多的互相关算子,给不同的时间点赋予不同的权重,通常当前样本权重最高,越远离当前样本权重越低。S4.对数据矩阵使用设定好的互相关算子进行操作,将互相关算子在感兴趣的数据区域进行滑动计算互相关算子;S5.所有感兴趣区域用定义的互相关算子操作完后,得到特征矩阵;S6.这些特征矩阵进行串联,则得到一个新的特征矩阵集合;S7.得的特征矩阵可以用于机器学习的异常检测,分类,回归等任务,进而得到预测性维护的结果。具体实施例例如一个五行三列(通常互相关算子的形状为奇数,以便于计算)的互相关算子,如下:观察这个互相关算子的数字特征,可以发现这是一个中间高四周低的类高斯分布,由于互相关操作的中心是落在当前关注的数据点上,因此这样设计的意义是在时间序列上根据先后分配权重,在特征维度中也分配权重,综合这样一个5x3的区域提取特征。如果当前采集的样本更注重于变量之间的相关性,那么互相关算子可以设置列数较多,例如上面提到的算子的转置。如果想同时考虑时间维度和变量维度上的相关性,可以同时运用上面提到的两个算子得到两个特征,或者设置一个更大的互相关算子,如5x5。互相关算子的步长(Strides)表示每次操作移动跨度,通常为1-5。互相关算子个数选取的越多,所构造出的新特征越多。一般要进行一定程度的填充(Padding),防止在边缘区域做互相关计算时溢出或者使原数据矩阵变小的情况。比较关键的是互相关算子的设置,除了上述提到的固定权重的赋值的方法,还可以采取符合某种概率分布的随机赋值、选取某些行列的均值等方式。最后应说明的是:以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
【技术保护点】
1.一种用于生产过程数据建模的基于互相关的特征构造方法,其特征在于,包括以下步骤:/nS1.对收集的生产过程数据进行规整与预处理;/nS2. 根据数据特性和任务目的,设置互相关算子的超参数;/nS3.设定互相关算子的权重;/nS4. 对数据矩阵使用设定好的互相关算子进行操作,将互相关算子在感兴趣的数据区域进行滑动计算互相关算子;/nS5.所有感兴趣区域用定义的互相关算子操作完后,得到特征矩阵;/nS6. 这些特征矩阵进行串联,则得到一个新的特征矩阵集合;/nS7.得的特征矩阵可以用于机器学习的异常检测,分类,回归等任务,进而得到预测性维护的结果。/n
【技术特征摘要】
1.一种用于生产过程数据建模的基于互相关的特征构造方法,其特征在于,包括以下步骤:
S1.对收集的生产过程数据进行规整与预处理;
S2.根据数据特性和任务目的,设置互相关算子的超参数;
S3.设定互相关算子的权重;
S4.对数据矩阵使用设定好的互相关算子进行操作,将互相关算子在感兴趣的数据区域进行滑动计算互相关算子;
S5.所有感兴趣区域用定义的互相关算子操作完后,得到特征矩阵;
S6.这些特征矩阵进行串联,则得到一个新的特征矩阵集合;
S7.得的特征矩阵...
【专利技术属性】
技术研发人员:段强,安程治,李锐,金长新,
申请(专利权)人:山东浪潮人工智能研究院有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。