【技术实现步骤摘要】
一种用于灰度图像上色的三通路卷积神经网络结构
本专利技术属于神经网络领域,尤其涉及在利用神经网络对灰度图像上色的应用之中,采用一个包含三个通道的卷积神经网络分别对图像的三个通道进行上色,并最后整合成一幅彩色图片,即用于灰度图像上色的三通路卷积神经网络。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络。目前,卷积神经网络是人工智能研究界的重点研究对象,庞大的参数量和灵活的优化算法使得卷积神经网络在图像处理,视频音频处理等方面有着不俗的表现。目前有不少研究利用神经网络对灰度图像上色,这些算法多数基于特征学习,即学习原始灰度图像中的物体信息,并根据信息对物体上色。由此看来,这与机器视觉领域的语义分割有很大相似性。同时,卷积神经网络对于研究者来说又有很大的不确定性。其中一大问题是大量的参数需要大量的训练数据来进行参数的最优逼近。对于主流研究领域,像这样的大型数据集是存在的,但是有一些小众研究方向则没有这么多的数据。此外。神经网络的学习过程往往是人为不可控的,在实践中很难保证神经网络按照预先设定的思路进行。图像上色是人类一直关注的问题。早些年由于设备和技术的限制,很多珍贵的照片都是黑白的。同时,即使是彩色的画作经历了一段时间后色彩也会暗淡。在神经网络兴起之前,想通过算法实现对这些不包含色彩信息的图像上色是一件非常困难的事情。但是近些年的研究使得这样的想法成为了现实。
技术实现思路
针对现有技术存在的问题, ...
【技术保护点】
1.一种用于灰度图像上色的三通路卷积神经网络结构,其特征在于:分为三个部分,第一是数据集的选择和处理,第二是网络结构的搭建,第三是损失函数和最优化算法的选择;搭建完成后即可根据数据集对该神经网络进行训练并分析上色结果;/n(1)数据集处理/n根据实际需要,在构建数据集时采用加权法将彩色图片转化成为灰度图片,以供实际训练测试需求,同时将未去色的图像作为最终判断的对比标杆,以建立神经网络的损失;/n(2)网络结构/n根据RGB三个通路的特征分别设计,红色通道往往包含更多的人物信息和突出的色彩信息;绿色通道一般包含更多的景物信息;蓝色通道更多是大面积的自然景观和空旷区域;/n三通道设计具体如下:/n将训练集图片调整大小至128*128,通过切片方式将RGB三个色彩通道数据分割出来;R分量输入红色通道,红色通道包含9个卷积层,卷积核大小均为3*3,卷积核个数分别为:3、16、32、32、64、32、32、16、1,所有卷积操作的步长均为1,保障特征图的长宽不变,只有深度发生变化;G分量输入绿色通道,绿色通道包含6个卷积层,卷积核大小为4*4,卷积核数量为:3、16、32、32、16、1,同样, ...
【技术特征摘要】
1.一种用于灰度图像上色的三通路卷积神经网络结构,其特征在于:分为三个部分,第一是数据集的选择和处理,第二是网络结构的搭建,第三是损失函数和最优化算法的选择;搭建完成后即可根据数据集对该神经网络进行训练并分析上色结果;
(1)数据集处理
根据实际需要,在构建数据集时采用加权法将彩色图片转化成为灰度图片,以供实际训练测试需求,同时将未去色的图像作为最终判断的对比标杆,以建立神经网络的损失;
(2)网络结构
根据RGB三个通路的特征分别设计,红色通道往往包含更多的人物信息和突出的色彩信息;绿色通道一般包含更多的景物信息;蓝色通道更多是大面积的自然景观和空旷区域;
三通道设计具体如下:
将训练集图片调整大小至128*128,通过切片方式将RGB三个色彩通道数据分割出来;R分量输入红色通道,红色通道包含9个卷积层,卷积核大小均为3*3,卷积核个数分别为:3、16、32、32、64、32、32、16、1,所有卷积操作的步长均为1,保障特征图的长宽不变,只有深度发生变化;G分量输入绿色通道,绿色通道包含6个卷积层,卷积核大小为4*4,卷积核数量为:3、16、32、32、16、1,同样,...
【专利技术属性】
技术研发人员:徐江涛,史兴萍,查万斌,秦书臻,路凯歌,
申请(专利权)人:天津大学青岛海洋技术研究院,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。