【技术实现步骤摘要】
一种神经网络权重矩阵拆分与组合的方法
本专利技术属于深度学习
,涉及一种神经网络权重矩阵拆分与组合的方法,尤其涉及一种图像目标检测中YOLO系列神经网络权重矩阵拆分与组合方法。
技术介绍
深度学习的概念源于人工神经网络的研究,是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。其中,目标检测是与计算机视觉和图像处理有关的计算机技术,其涉及在数字图像和视频中检测特定类(例如人、建筑物或汽车)的语义对象的实例。目标检测在计算机视觉的许多领域都有应用,包括图像检索和视频监控。深度学习的核心就是卷积操作,它是用特定的卷积核(矩阵)来对整个输入图片(矩阵)通过对应元素相乘并求和来进行遍历。目的就是为了提取图像的抽象特征,一般来说网络结构越复杂和越深,它的效果会更好。一个完整的模型就是由很多卷积层与其它层堆叠而成。目标检测中的RCNN系列算法遵循2-stage的流程:首先找出一系列(预先设定好的)候选区域,而后对这些候选区域进行分类以及位置修正。YOLO则开启了1-stage的流派:直接用一个深度网络,回归出目标的位置和归类。YOLO(Youonlylookonce)是一个实时的目标检测系统,是一个使用卷积神经网络的目标检测框架,由大量的卷积层与其它层组合而成。它采用回归的方法进行目标框的检测以及分类;输入一张图片,马上可以得到图片中的物体类别与具体的坐标,它的检测速度很快,可以达到视频实时检测的需求。YOLO首先将图像分割成多个大小相同的网格,再对每个 ...
【技术保护点】
1.一种神经网络权重矩阵拆分与组合的方法,其特征在于,该方法用于具有one‑stage网络结构的目标检测中,在进行目标检测时,首先确定要检测的物体种类,通过收集图片数据进行训练,得到一个可以用来进行目标检测的效果好的神经网络权重矩阵,即原始权重矩阵W1;原有N个类别,当其中某一类或者多个类别不再需要需移除时,要进行神经网络权重矩阵拆分,即将原始权重矩阵中的某一类或者多个类别提取出来,并保持原有类别的识别效果不变;当其中某一类或者多个类别需要更新或者需要添加新类别时,要进行神经网络权重矩阵的组合即合并,亦即,将原始权重矩阵中的某一类或者多个类别提取出来进行单独训练之后,再通过权重矩阵组合添加合并进去。
【技术特征摘要】
1.一种神经网络权重矩阵拆分与组合的方法,其特征在于,该方法用于具有one-stage网络结构的目标检测中,在进行目标检测时,首先确定要检测的物体种类,通过收集图片数据进行训练,得到一个可以用来进行目标检测的效果好的神经网络权重矩阵,即原始权重矩阵W1;原有N个类别,当其中某一类或者多个类别不再需要需移除时,要进行神经网络权重矩阵拆分,即将原始权重矩阵中的某一类或者多个类别提取出来,并保持原有类别的识别效果不变;当其中某一类或者多个类别需要更新或者需要添加新类别时,要进行神经网络权重矩阵的组合即合并,亦即,将原始权重矩阵中的某一类或者多个类别提取出来进行单独训练之后,再通过权重矩阵组合添加合并进去。2.如权利要求1所述的神经网络权重矩阵拆分与组合的方法,其特征在于,进行神经网络权重矩阵拆分时,将包含多种检测类别的神经网络权重矩阵中的某一类或者多类单独提取出来,并保持原有类别的识别效果不变;拆分的方法是:将多余的一个类别或J个类别在原始权重矩阵W1的三个不同尺度层的最后一个卷积层即C1、C2、C3层的卷积核上的对应值直接移除,即将C1、C2、C3层的权重矩阵的第二个维度从n=(5+N)*3改为b=(N-1+5)*3或b=(N-J+5)*3,其它层的权重矩阵保持不变;即完成对W1的修改,修改后的W1称为W2。3.如权利要求2所述的神经网络权重矩阵拆分与组合的方法,其特征在于,进行神经网络权重矩阵拆分的具体方法如下:a、将原始权重矩阵W1的三个不同尺度层的最后一个卷积层取出,分别为C1、C2、C3层,得到三个维度分别为m*n的权重矩阵,m为上一层通道数,n为本层通道数;原始权重矩阵W1有N类,则n=(5+N)*3;b、在n中提取出相应的要单独提取出来的一类或者多个类别对应的维度,即提取出n列中的对应列,记为a;当只提取出一类时,a为(5+1)*3=18;当提取出J个类别时,a为(5+J)*3;c、将提取出来的一类或者多个类别的新的维度组成一个m*a的权重矩阵,将提取之后剩下的N-1或N-J个类别的维度组成一个新的权重矩阵,替换掉原本的卷积层;原始权重矩阵的第二个维度是n=(5+N)*3,提取一类之后,提取出的那一类的权重矩阵的第二个维度是a=(5+1)*3=18,提取之后剩下的N-1类的权重矩阵的第二个维度是b=(N-1+5)*3;提取J个类别之后,提取出的那J个类别的权重矩阵的第二个维度是a=(5+J)*3,提取之后剩下的N-J个类别的权重矩阵的第二个维度是b=(N-J+5)*3;d、用相同的方法处理卷积层的偏置矩阵;e、得到拆分后的新权重矩阵W2。4.如权利要求1所述的神经网络权重矩阵拆分与组合的方法,其特征在于,对取出的或要添加的新类别的权重矩阵W3单独进行训练;需要更新时,从原神经网络权重矩阵W1中提取出其中的某一类或者多个类别的权重矩阵,对取出的权重矩阵进行单独训练之后再添加进去;需要添加新类别时,从原神经网络权重矩阵...
【专利技术属性】
技术研发人员:邓春华,刘子威,林云汉,朱子奇,丁胜,
申请(专利权)人:武汉科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。