当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于无监督学习的最小量化特征检测方法技术

技术编号:27977251 阅读:20 留言:0更新日期:2021-04-06 14:11
本发明专利技术公开一种基于无监督学习的最小量化特征检测方法,首先对碎片数据集使用VGG16网络进行分类,再采用多通道特征叠加加权平均的方法消除图片中存在的噪声,获取叠加特征图,再使用k‑means聚类算法二分类分离出物体与背景,然后使用Otsu算法将物体本身剥离出来,再通过仿射变换得到第一级注意力机制图,即碎片图;将碎片图输入VGG16网络中再次训练,重复上述步骤,最终获得可量化分类指标图;解决了兵马俑海量碎片分类时碎片大小不一,无法进行准确标注的问题,大大增加文物工作者对文物复原的效率。

【技术实现步骤摘要】
一种基于无监督学习的最小量化特征检测方法
本专利技术属于文物保护领域,涉及计算机深度学习及图形处理技术,具体涉及一种基于无监督学习的最小量化特征检测方法。
技术介绍
兵马俑挖掘出土的文物现在有很多件,但是文物都是残缺不全的,面对发掘出土的如此多的碎片,使用人工进行复原就势必会花费大量的人力物力,而且也需要付出非常多的时间。因此基于深度学习的卷积神经网络在兵马俑碎片分类中起到了至关重要的作用,使用深度卷积神经网络进行兵马俑碎片部位拼接可以大幅提升分类速度与分类精度。但是使用卷积神经网络进行分类也存在着碎片部位大小不一,有的碎片过小无法进行分类的问题,因此,检测出兵马俑碎片部位可分类量化指标是筛选兵马俑碎片的关键。通常使用人工分拣来对碎片进行筛选,花费大量的人力和时间。但是这种碎片拼接的方式,虽然在一定程度上可以减少分类的时间,但是由于人工分拣并不足够精准,势必会出现分拣出的碎片过小导致模型无法分类或分类错误,为复原兵马俑的后续工作带来困难。
技术实现思路
针对现有技术的缺点或不足,本专利技术的目的在于提供一种基于无监督学习的最小量化特征检测方法,使用分类量化指标将小尺度的碎片进行人工筛选,大尺度的碎片进行深度学习分类,有效地提升分类精度。为实现上述目的,本专利技术所采用的技术方案是:一种基于无监督学习的最小量化特征检测方法,包括以下步骤:步骤一,为得到显著特征区域,使用VGG16预训练模型和兵马俑碎片数据集进行迁移学习,得到一个碎片分类模型,通过对最后一层卷积层的特征提取,将最后一层卷积特征使用加权平均的方法可视化出来,得到可视化特征图;步骤二,将步骤一得到的可视化特征图进行二分类聚类消除噪声,使用K-Means聚类算法做二分类,分出背景和轮廓特征,得到聚类特征图;步骤三,使用Otsu算法将步骤二中得到的聚类特征图做二值化分割,得到二值化图像;步骤四,对步骤三中的二值化图像进行标注框标注,然后通过仿射变换映射回原图;需要做特征图标注框二维坐标(x,y)到二维坐标(u,v)的线性变换,其数学表达式形式如下:对应的齐次坐标矩阵表示形式为:其中,取h20、h21为0,h22为1;坐标变换:步骤五,将步骤四中通过仿射变换映射回原图的区域的进行切割,得到去除背景噪声后的物体图,作为第一级注意力机制物体图;步骤六,在确定提取到的图像有良好的分类性能后,将步骤五中第一级注意力机制提取到的物体图像再次进行特征提取到的图像再通过预训练后的VGG16进行第二次特征提取与聚类,使用k-means聚类算法对可视化后的特征图进行三分类聚类,分出最小量化特征与轮廓,得到三分类聚类图;步骤七,将步骤六中得到的三分类聚类图使用Otsu算法确定聚类特征图二值化分割阈值,得到二值化图像;步骤八,查找步骤七中二值化图像的轮廓,用标注框标注后通过仿射变换映射回原图;步骤九,将经过放射变换后的局部图像切割下来,即为可量化分类指标。进一步,所述步骤二具体过称为:将通过卷积层的特征图融合为一张特征图后,随机选取k个聚类质心点为μ1,μ2,……,μk∈Rn;重复下面过程直到收敛:对于每一个样例i,计算其应该属于的类对于每一个类j,重新计算该类的质心k是事先给定的聚类数,c(i)代表样例i与k个类中距离最近的那个类,c(i)的值是1到k中的一个,质心μj代表对属于同一个类的样本中心点的猜测,拿星团模型来解释就是要将所有的星星聚成k个星团,首先随机选取k个宇宙中的点作为k个星团的质心,然后第一步对于每一个星星计算其到k个质心中每一个的距离,然后选取距离最近的那个星团作为c(i),这样经过第一步每一个星星都有了所属的星团;第二步对于每一个星团,重新计算它的质心μj,重复迭代第一步和第二步直到质心不变或者变化很小,得到一张聚类后的特征图。进一步,所述步骤三具体过程为:假设存在阈值TH将图像所有像素分为小于TH的C1和大于TH的C2两类,则这两类像素各自的均值就为m1、m2,图像全局均值为mG,同时像素被分为C1和C2类的概率分别为p1、p2,则有:p1*m1+p2*m2=mG(1)p1+p2=1(2)根据方差的概念,类间方差表达式为:/sigma2=p1(m1-mG)2+p2(m2-mG)2(3)把上式化简,将式(1)代入式(3),可得:/sigma2=p1p2(m1-m2)2使得上式最大化的灰度级k就是OTSU阈值了;其中:根据公式,遍历0~255个灰度级,求出上式最大的k即为阈值,使用阈值k过滤所有符合要求的像素,得到二值化图像。进一步,所述步骤六中采用k-means聚类算法对可视化后的特征图进行三分类聚类,具体过程为:6.1)选择K个聚类的初始中心;6.2)对任意一个样本点,求其到K个聚类中心的距离,将样本点归类到距离最小的中心的聚类,如此迭代n次;6.3)每次迭代过程中,利用均值等方法更新各个聚类的中心点;6.4)对K个聚类中心,通过步骤6.2)-步骤6.3)迭代更新后,如果位置点变化很小,则认为达到稳定状态,迭代结束,对不同的聚类块和聚类中心可选择不同的颜色标注,最终得到三分类聚类图。进一步,所述步骤七具体过程为:对于图像I(x,y),前景和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为ω0,平均灰度为μ0;背景像素点数占整幅图像的比例为ω1,平均灰度为μ1;整幅图像的平均灰度记为μ,类间方差记为g;假设图像大小为M×N,图像中像素的灰度值小于阈值T的像素个数为N0,像素灰度大于阈值T的像素个数为N1,那么:ω0=N0/M×Nω1=N1/M×NN0+N1=M×Nω0+ω1=1μ=ω0×μ0+ω1×μ1g=ω0(μ0-μ)2+ω1(μ1-μ)2g=ω0ω1(μ0-μ1)2采用遍历的方法使得类间方差g最大的阈值T,使用阈值T过滤所有符合要求的像素,得到二值化图像。本专利技术基于无监督学习的最小量化特征检测方法,首先对碎片数据集使用VGG16网络进行分类,在得到不错的分类结果(98.6%)后,即可认为VGG16是可以充分提取到兵马俑碎片特征,再采用多通道特征叠加加权平均的方法消除图片中存在的噪声,获取叠加特征图。再使用k-means聚类算法二分类分离出物体与背景,然后使用Otsu算法将物体本身剥离出来,再通过仿射变换得到第一级注意力机制图,即碎片图。将碎片图输入VGG16网络中再次训练,重复上述步骤,最终获得可量化分类指标图。本专利技术找到深度卷积神经网络的可分类量化训练指标,使用这个分类量化指标将小于该尺度的碎片进行人工筛选,大于该尺度的碎片进行深度学习分类,可以有效地提升分类精度;用于在图片中标注物体可训练显著特征区域,其特征在本文档来自技高网...

【技术保护点】
1.一种基于无监督学习的最小量化特征检测方法,其特征在于包括以下步骤:/n步骤一,为得到显著特征区域,使用VGG16预训练模型和兵马俑碎片数据集进行迁移学习,得到一个碎片分类模型,通过对最后一层卷积层的特征提取,将最后一层卷积特征使用加权平均的方法可视化出来,得到可视化特征图;/n步骤二,将步骤一得到的可视化特征图进行二分类聚类消除噪声,使用K-Means聚类算法做二分类,分出背景和轮廓特征,得到聚类特征图;/n步骤三,使用Otsu算法将步骤二中得到的聚类特征图做二值化分割,得到二值化图像;/n步骤四,对步骤三中的二值化图像进行标注框标注,然后通过仿射变换映射回原图;/n需要做特征图标注框二维坐标(x,y)到二维坐标(u,v)的线性变换,其数学表达式形式如下:/n

【技术特征摘要】
1.一种基于无监督学习的最小量化特征检测方法,其特征在于包括以下步骤:
步骤一,为得到显著特征区域,使用VGG16预训练模型和兵马俑碎片数据集进行迁移学习,得到一个碎片分类模型,通过对最后一层卷积层的特征提取,将最后一层卷积特征使用加权平均的方法可视化出来,得到可视化特征图;
步骤二,将步骤一得到的可视化特征图进行二分类聚类消除噪声,使用K-Means聚类算法做二分类,分出背景和轮廓特征,得到聚类特征图;
步骤三,使用Otsu算法将步骤二中得到的聚类特征图做二值化分割,得到二值化图像;
步骤四,对步骤三中的二值化图像进行标注框标注,然后通过仿射变换映射回原图;
需要做特征图标注框二维坐标(x,y)到二维坐标(u,v)的线性变换,其数学表达式形式如下:



对应的齐次坐标矩阵表示形式为:



其中,取h20、h21为0,h22为1;
坐标变换:






步骤五,将步骤四中通过仿射变换映射回原图的区域的进行切割,得到去除背景噪声后的物体图,作为第一级注意力机制物体图;
步骤六,在确定提取到的图像有良好的分类性能后,将步骤五中第一级注意力机制提取到的物体图像再次进行特征提取到的图像再通过预训练后的VGG16进行第二次特征提取与聚类,使用k-means聚类算法对可视化后的特征图进行三分类聚类,分出最小量化特征与轮廓,得到三分类聚类图;
步骤七,将步骤六中得到的三分类聚类图使用Otsu算法确定聚类特征图二值化分割阈值,得到二值化图像;
步骤八,查找步骤七中二值化图像的轮廓,用标注框标注后通过仿射变换映射回原图;
步骤九,将经过放射变换后的局部图像切割下来,即为可量化分类指标。


2.根据权利要求1所述的基于无监督学习的最小量化特征检测方法,其特征在于:所述步骤二具体过称为:
将通过卷积层的特征图融合为一张特征图后,随机选取k个聚类质心点为μ1,μ2,……,μk∈Rn;
重复下面过程直到收敛:
对于每一个样例i,计算其应该属于的类



对于每一个类j,重新计算该类的质心



k是事先给定的聚类数,c(i)代表样例i与k个类中距离最近的那个类,c(i)的值是1到k中的一个,质心μj代表对属于同一个类的样本中心点的猜测,拿星团模型来解释就是要将所有的星星聚成k个星团,首先随机选取k个宇宙中的点作为k个星团的质心,然后第一步对于每一个星星计算其到k个质心中每一个的距离,然后选取距离最近的那个星团作为c(i),这样经过第一...

【专利技术属性】
技术研发人员:周明全刘喆田琦耿国华冯龙王小凤邓胡承
申请(专利权)人:西北大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1