为了解决现有技术简笔画识别准确率低的问题,本发明专利技术提出了一种基于卷积神经模糊网络的简笔画识别方法,将输入数据在模糊卷积层进行模糊处理,通过模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度,得到含有模糊逻辑的特征;再将该含有模糊逻辑的特征输入全连接层构中进行分类,最终识输入数据对应的简笔画。本发明专利技术提出的基于卷积神经模糊网络的识别方法能够很好的克服现有的识别方法识别准确率低的问题,有效提高识别效率。
A simple stroke recognition method based on convolution neural fuzzy network
【技术实现步骤摘要】
一种基于卷积神经模糊网络的简笔画识别方法
本专利技术涉及深度学习及图像识别
,特别涉及一种基于卷积神经模糊网络的简笔画识别方法。
技术介绍
随着互联网信息技术及多媒体应用的飞速发展,海量的图片信息、数据应运而生,图像识别技术也逐渐渗透到日常生活的各个领域当中,如目标跟踪、车载导航、生物医学、军事和电子商务等,为我们的日常生活和工作带来了很大的便利。而简笔画是一种较为简练的绘画形式,具有简单、直观的特点,也是人机交互、网络交际的主要形式之一。早期的简笔画识别主要遵循传统的图像分类模式,即从简笔画中提取相应的如方向梯度直方图(HOG)、尺度不变特征变换(SIFT)、形状上下文特征等手工特征并送入分类其中分类,但这些手工特征主要是为自然图像设计的,而简笔画由于输入的自由度大和随机性强而具有抽象性和稀疏性的特征,且颜色较于自然图像来说更为单调,因此这些方法并不完全适用于简笔画识别。后来又先后提出了用局部特征表示和全局结构的关系来处理局部和全局的变化,采用图像变形模型结合SVM分类器来识别简笔画,还有基于图像熵、基于边缘特征、基于轮廓特征的方法等,上述这些方法的最大缺陷是依靠人工的特征提取,除却需要大量的人力物力,还可能存在着不客观性和不准确性,因此这几种识别方法也逐渐遭到淘汰。深度学习的出现离不开神经网络的快速发展,它主要针对于生物大脑认知原理的研究,特别是视觉的研究。人类识别物体的过程其实是分层次进行的——瞳孔接收到原始信号交由大脑皮层初步处理,大脑进行抽象来判定物体的形状,最后对其进行进一部抽象,判定物体的类别。深度学习就是模仿大脑这一识别特点,构造出多层神经网络来逐层地提取和收集信息,最后由高层网络组合前面各层级信息来抽取出较为完整的全局对象,做出分类。随着GPU技术的进步和卷积网络的提出,目前为止在简笔画识别领域,已经提出了由多尺度多通道的深度神经网络框架并去得了良好的识别效果,后来更是针对简笔画在本质上是由有顺序的笔画所构成这一特点,加入了递归神经网络,提升了识别效率。早期对于简笔画识别方面的研究主要采用基于手工特征如SIFT特征、HOG特征等传统图像分类模式的方法,但这些手工特征主要是为自然图像设计的,而不同于自然图像,简笔画具有特有的抽象性、稀疏性以及颜色单一性,因此以上方法并不完全适用于简笔画识别。后来,针对这一情况又提出了基于图像轮廓、基于图像熵、基于费舍尔向量的方法等,但这些方法均依靠人工提取特征,需要消耗大量的人力,同时特征的选择也对经验有着较高的要求。现有的基于深度学习神经网络的识别方法并未针对输入自由性大,随机性强所具有的模糊性这一特点做出考虑。卷积神经网络会自动的进行特征提取且不能很好的表示出数据的模糊性、歧义性。而且简笔画具有输入自由度大和随机性强的特点,并且每个人在绘画过程中的笔画顺序也不是完全一样,甚至可能会出现数据不完整性情况,因此具有模糊性的特点,从而对识别准确率造成一定影响。
技术实现思路
为了解决现有技术简笔画识别准确率低的问题,本专利技术提出了一种基于卷积神经模糊网络的简笔画识别方法。本专利技术解决上述技术问题所采取的技术方案是:一种基于卷积神经模糊网络的简笔画识别方法,将输入数据在模糊卷积层进行模糊处理,通过模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度,得到含有模糊逻辑的特征;再将该含有模糊逻辑的特征输入全连接层构中进行分类,最终识输入数据对应的简笔画。所述的模糊卷积层进行模糊处理的过程是:S1.将输入数据在模糊化层进行处理,得到模糊逻辑表示;S2.将S1步骤得到的模糊逻辑表示放入模糊卷积层进行处理,提取笔画特征;S3.对提取到的笔画特征进行压缩,简化网络计算复杂度,得到含有模糊逻辑的特征。所述的S1步骤的具体方法是:假设X是输入数据对应的矩阵,X中的每个元素都被赋予与隶属函数相关的多个标签;模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度;模糊集通过由最大乘积运算得到的模糊关系计算得出,即:其中i,j表示元素x在输入矩阵X中的索引位,δ(x-xij)是克罗内克函数;为预定义参考模糊数。所述的S2步骤的具体方法是:将S1步骤得到的模糊逻辑表示放入模糊卷积层进行处理,将模糊卷积滤波器应用于模糊化的二维数据,具体如下:其中,模糊卷积滤波器中的Wμ为:Wμ=fuzzification(W)m是输入矩阵的维度,其中,输入矩阵宽、高均为m;a、b为常数参数,x(i+a)(j+b)依次表示输入矩阵中的每个元素。最后,通过激活函数对模糊卷积后得到的输出进行非线性变换yij=δ(xij);其中,δ(xij)为卷积层的激活函数。所述的全连接层构进行分类的过程是:将模糊逻辑层传递过来的特征去模糊处理得到清晰特征z,即其中cy是去模糊隶属函数的质心,最后将z传入全连接层进行分类。本专利技术的有益效果是:本专利技术提出的基于卷积神经模糊网络的识别方法能够很好的克服现有的识别方法识别准确率低的问题,有效提高识别效率。模糊理论的基本思想就是把经典集合中的绝对隶属关系灵活化,即元素对“集合”的隶属度不再是局限于0和1,而是可以取0到1间的任一数值,通过隶属函数来刻画处于中间过渡事务对差异双方所具有的倾向性。卷积神经模糊网络,将模糊逻辑与深度学习模型结合起来,利用模糊神经网络处理模糊值的能力来增强对模糊性数据的处理能力,能够从模糊数据中提取到有用的高级特征,提升识别准确率。附图说明图1为卷积神经模糊网络框架图。具体实施方式下面结合附图对本专利技术进行进一步的说明。如图1,所述的一种基于卷积神经模糊网络的简笔画识别方法,其中所述的卷积神经模糊网络是基于传统卷积神经网络构建的,由一些模糊卷积层和一个全连接层构,每个模糊卷积层通常包括模糊卷积,非线性处理和池化这三个步骤。卷积神经网络主要可以归结成一下三个阶段:1).将输入数据在模糊化层进行处理,得到模糊逻辑表示假设X是输入矩阵,X中的每个元素都被赋予与隶属函数相关的多个标签。模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度。模糊集通过由最大乘积运算得到的模糊关系计算得出,即其中i,j表示元素x在输入矩阵X中的索引位,δ(x-xij)是克罗内克函数。将1)阶段得到的模糊逻辑表示放入模糊卷积层进行处理模糊卷积层一般包括三个步骤,即模糊卷积、非线性处理和池化。模糊卷积是指将模糊卷积滤波器应用于模糊化的二维数据的过程,如式③所示,而模糊卷积滤波器中的Wμ由式④得出。Wμ=fuzzification(W)……④然后通过激活函数对模糊卷积后得到的输出进行非线性变换yij=δ(xij)。最后一个步骤则是池化,它能够对提取到的特征进行压缩,提取出主要特征,使特征图变小,简化网络计算复杂度。通过一系列模糊卷积层后,对提取到的特征进行去模糊处理后,传入所述的全连接层。卷积神经模糊网络中的全连接层本文档来自技高网...
【技术保护点】
1.一种基于卷积神经模糊网络的简笔画识别方法,包括多个模糊卷积层、一个全连接层构;其特征在于,将输入数据在模糊卷积层进行模糊处理,通过模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度,得到含有模糊逻辑的特征;再将该含有模糊逻辑的特征输入全连接层构中进行分类,最终识输入数据对应的简笔画。/n
【技术特征摘要】
1.一种基于卷积神经模糊网络的简笔画识别方法,包括多个模糊卷积层、一个全连接层构;其特征在于,将输入数据在模糊卷积层进行模糊处理,通过模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度,得到含有模糊逻辑的特征;再将该含有模糊逻辑的特征输入全连接层构中进行分类,最终识输入数据对应的简笔画。
2.根据权利要求1所述的一种基于卷积神经模糊网络的简笔画识别方法,其特征在于,所述的模糊卷积层进行模糊处理的过程是:
S1.将输入数据在模糊化层进行处理,得到模糊逻辑表示;
S2.将S1步骤得到的模糊逻辑表示放入模糊卷积层进行处理,提取笔画特征;
S3.对提取到的笔画特征进行压缩,简化网络计算复杂度,得到含有模糊逻辑的特征。
3.根据权利要求2所述的一种基于卷积神经模糊网络的简笔画识别方法,其特征在于,所述的S1步骤的具体方法是:
假设X是输入数据对应的矩阵,X中的每个元素都被赋予与隶属函数相关的多个标签;模糊隶属度函数计算每个输入节点对一个特定模糊集的隶属度;模糊集通过由最大乘积运算得到的模糊...
【专利技术属性】
技术研发人员:唐瑜祺,孙为军,邱耀儒,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。