基于聚类超球体模型的产品质量快速判定方法技术

技术编号:23985911 阅读:45 留言:0更新日期:2020-04-29 13:31
一种基于聚类超球体模型的产品质量快速判定方法,通过大量样本数据确定最小封闭超球体,并求出超球体的半径和球心,计算检测点与球心的距离,实现对生产过程中产品质量的快速且高准确率判定。该方法具体包括:首先对选定的训练数据集做k‑means聚类,使其分为k个子数据集;其次,对每个子集的数据进行最小封闭超球体的优化求解,确定其半径和球心,并计算出镜像球心在原始数据域的确切原像,进而优化判别函数;最后计算待检测样本点与每一个超球体球心的距离,并将其与超球体半径做比较,从而判定出该检测点的质量情况。本发明专利技术与现有产品质量判定方法相比,提出的聚类超球体模型能更精细化确定多超球体的边界,并通过超球体镜像球心的原像极大简化了判别函数,提高了质量判定的快速性。

A fast method of product quality determination based on clustering hypersphere model

【技术实现步骤摘要】
基于聚类超球体模型的产品质量快速判定方法
本专利技术属于产品质量快速且高准确率判定的
,涉及到单一类数据向量判别边界建模的方法。
技术介绍
在流程工业中,产品制造过程涉及多个连续衔接的工序,每个工序都要求工艺参数的设定值和质量指标控制在确定的范围内,才能确保成品的最终质量。目前,企业对产品质量管控的主要方法是通过“事后”抽样来判定产品的整体品质。这种依赖于“事后”判定的方式容易导致批量的产品质量判废。为了减少因质量异议产生的经济索赔和产品退货,当前制造类企业需要提高产品质量稳定性以保证产品的可持续发展。随着工业4.0时代的来临,制造技术正逐步从自动化、数字化、网络化向智能化方向发展。作为工业4.0的重要策略之一,信息物理融合系统(CyberPhysicalSystem,CPS)具有自主判断、自主决策、自主调控的能力,将CPS和数字孪生模型应用于智能制造引起了业内的高度关注。经过近十年的升级改造,多数制造类企业在信息化系统和控制技术上取得了显著进步,都配置了ERP/MES/PCS/PLC等信息化系统、通讯网络和检测系统。但是,现有的制造体制主要处于集中式管理模式,缺乏产品质量在线管控能力,难以实现产品质量个性化定制的智能制造要求,需要探求一种产品质量快速且高准确率判定方法。一般而言,对于产品质量判定的方法大多基于数据驱动和支持向量数据描述进行单一类数据建模,文献(Yi-HuangLiu,Yan-ChenLiu,Yen-Jenchen.Fastsupportvectordatadescriptionsfornoveltydetection[J].Fastsupportvectordatadescriptionsfornoveltydetection,2010,21(8):1296-1313)提出了一种快速支持向量机数据描述方法,但该方法只适用于正常数据与异常数据分离明显的情况,当两类数据比较相近时判定准确率较低。文献(徐钢,张晓彤,黎敏,徐金梧.基于嵌入式CPS模型的产品质量在线管控方法[J].机械工程学报,2017,53(12):94-101)提出一种基于软超球体模型的质量判定的方法。这类算法虽然能很好的解决准确率的问题,但其计算量大,且不利于在大数据样本下进行建模,不满足制造工厂实际生产情况。文献(NicoLuizAlbertoLima,Klaus-RobertMüller,MariusKloft,ShinichiNakajima.Supporvectordatadescriptionsandk-meansclustering:oneclass?[J].IEEETransactionsonneuralnetworksandLearningsystems,2018,29(9):3944-4006)提出一种利用多个超球体模型的支持向量数据描述方法,该方法解决了大样本下建模的问题,但是其建模过程复杂且最后的判别函数计算量大,检测过程较慢,不满足产品质量在线判定的实时性要求。鉴于上诉方法的优缺点,本专利技术拟采用聚类超球体模型来实现生产过程中产品质量的高准确率判定。
技术实现思路
本专利技术的目的是提供一种大数据样本下单一类产品质量判定的方法,该方法能适应于样本数据大,难以获得足够的异常样本,检测实时性要求高等应用场合。聚类超球体模型可以通过实际检测样本与每个超球体球心的距离判定产品质量,具有良好的实时性、泛化能力和准确率。所述产品质量判定方法的高准确率主要体现在:首先采用k-means算法将大量样本数据S={x1,x2,...,xm}分为k个不相交的子集,即L={L1,L2,...,Lk},其中Li(i=1,2,...,k)为聚类后得到的k个不相交的子集,称每个子集为一个簇,L的累积最小化平方误差为:k是手动设定的值。k值越大,判定准确率越高,但计算量也会增大。所以,一般是根据训练结果,用户来设定k值。其中x是簇Li的均值向量。E值越小,表明簇内样本相似度越高。通过不断的更新均值向量μi和数据划分,使E值达到最小化。其次在于超球体模型的建立。超球体模型可由如下优化问题求得:约束条件如下:ξi≥0,i=1,2,...,n其中,xi为样本数据,r为超球体半径,C为超球体球心,A为惩罚系数,ξi为松弛变量。引入拉格朗日乘子将上诉优化问题转换为其对偶形式:约束条件为:其中αi,αj为朗格朗日乘子,为核函数。借助高斯核的非线性映射并通过SMO算法求得超球体的半径和球心,所述产品质量判定方法的快速性主要体现在:对于待检测样本x,通过其与球心C的距离判定其是否在超球体内部,从而判定产品质量是否异常情况。其最终的判别函数为:其中D′=1-r2+1/ζ2,x为测试样本,为镜像球心的原像,当检测样本在每个超球体中求得的判别函数Df(x)都大于0时,判定该检测点为异常点。本专利技术的有益效果是:1、单一类数据向量模型简单便于理解,只针对一类样本便能确定精确的产品质量判定边界,符合异常样本不足的实际工业生产情况,有较强的可操作性。2、针对原始单超球体可能造成检测准确度不高的问题,本专利技术通过对样本进行k-means聚类,使其细分为k个子数据集,做到了更精细化的处理,使判定准确度更高。3、本专利技术通过找到超球体镜像球心的原像,简化了判别函数的方程式,从原始的多个高斯核函数的累加计算方法,简化到只需要计算一次高斯核函数,在大量样本的情况下不会影响到其检测速度,具有较高的异常检测实时性。附图说明图1是本专利技术实施例的判别边界结构示意图;图2是本专利技术实施例的高斯映射空间结构示意图;图3是本专利技术实施例的产品质量判定流程图。具体实施方式:下面结合附图和具体实施例对本专利技术作进一步详细介绍,下述实施例仅是示例性的,不构成对本专利技术的限定。图1为本专利技术判别边界结构示意图。产品质量判定的方法主要是通过实际的生产数据来确定一个可供质量判定的边界,称为单一类分类问题。在给定大量样本S={x1,x2,...,xm}的情况下,其中xi为实际生产过程中p维的正常数据向量,首先将上述样本通过k-means算法将样本分为k个不相交的子集,即L={L1,L2,...,Lk},其中Li(i=1,2,...,k)为聚类后得到的k个不相交的子集,称每个子集为一个簇,L的累积最小化平方误差为:其中x是簇Li的均值向量。E值越小,表明簇内样本相似度越高。通过不断的更新均值向量μi和数据划分,使E值达到最小化。其具体步骤如下:(1)从S中随机选择k个样本作为初始均值向量{μ1,μ2,...,μk};(2)计算样本xj与各均值向量μi(1≤i≤k)的距离:dji=||xj-μi||2;(3)根据距离最近的均值向量确定xj的簇标记:λj=argmini∈{1,2,...,k}dji,并将样本xj划入相应的簇:Lλi=Lλ本文档来自技高网
...

【技术保护点】
1.一种基于聚类超球体模型的产品质量快速判定方法,其特征在于,通过大量样本数据确定最小封闭超球体,并求出超球体的半径和球心,计算检测点与球心的距离,实现对生产过程中产品质量的快速判定,该方法具体包括:/n首先对选定的训练数据集做k-means聚类,使其分为k个不相交的子集;其次,对每个子集的数据进行最小封闭超球体的优化求解,确定其半径和球心,并计算出镜像球心在原始数据域的确切原像,进而优化判别函数,大大加快了对检测点异常判定的速度;最后计算待检测样本点与每一个超球体球心的距离,并将其与超球体半径做比较,从而判定出该检测点的质量情况。/n

【技术特征摘要】
1.一种基于聚类超球体模型的产品质量快速判定方法,其特征在于,通过大量样本数据确定最小封闭超球体,并求出超球体的半径和球心,计算检测点与球心的距离,实现对生产过程中产品质量的快速判定,该方法具体包括:
首先对选定的训练数据集做k-means聚类,使其分为k个不相交的子集;其次,对每个子集的数据进行最小封闭超球体的优化求解,确定其半径和球心,并计算出镜像球心在原始数据域的确切原像,进而优化判别函数,大大加快了对检测点异常判定的速度;最后计算待检测样本点与每一个超球体球心的距离,并将其与超球体半径做比较,从而判定出该检测点的质量情况。


2.根据权利要求1所述的基于聚类超球体模型的产品质量快速判定方法,所述的在建立超球体模型之前需要先将训练数据集做k-means聚类,使其分为k个子集是:给定样本集S={x1,x2,...,xm},其中xi为实际生产过程中p维的正常数据向量,通过k-means算法将该样本分为k个不相交的子集,即L={L1,L2,...,Lk},其中Li(i=1,2,...,k)为聚类后得到的k个子集,称每个子集为一个簇,L的累积最小化平方误差为:



其中是簇Li的均值向量;E值越小,表明簇内样本相似度越高;通过不断的更新均值向量μi和数据划分,使E值达到最小化;其具体步骤如下:
(1)从S中随机选择k个样本作为初始均值向量{μ1,μ2,...,μk};
(2)计算样本xj与各均值向量μi(1≤i≤k)的距离:dji=||xj-μi||2;
(3)根据距离最近的均值向量确定xj的簇标记:λj=argmini∈{1,2,...,k}dji,并将样本xj划...

【专利技术属性】
技术研发人员:卢少武黄伟鹏唐小琦张庆祥李振瀚颜昌亚周向东曾祥兵
申请(专利权)人:东莞市三姆森光电科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1