一种非自然对象的图像识别、替换方法和装置制造方法及图纸

技术编号:28040683 阅读:30 留言:0更新日期:2021-04-09 23:23
本发明专利技术公开了一种非自然对象的图像识别、替换方法和装置,所述方法包括:利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;根据二值化的图像,对非自然对象进行识别。应用本发明专利技术可以提高图像识别的准确率、提高替换后的图像的清晰度。

【技术实现步骤摘要】
一种非自然对象的图像识别、替换方法和装置
本专利技术涉及图像处理
,特别是指一种非自然对象的图像识别、替换方法和装置。
技术介绍
现有的图像识别技术,多对待识别的图像采用直接灰度化处理方式,利用图像灰度化后灰度值的梯度变化情况作为前景物与背景间边缘识别的关键信息;进而利用相关算子、变换进行边缘提取。然而,在前景物与背景色灰度化后的灰度值过于接近的情况下,现有的图像识别技术会遇到识别困难,致使关键边缘信息破碎,复杂场景识别率较差。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种非自然对象的图像识别、替换方法和装置,以提高图像识别的准确率、提高替换后的图像的清晰度。基于上述目的,本专利技术提供一种非自然对象的图像识别方法,包括:利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;根据二值化的图像,对非自然对象进行识别。其中,所述根据主成分分析结果,确定图像二值化的阈值,具体包括:利用所述非自然对象所在区域的图像的色彩值在主成分分析中的分布特征,选取贡献率最大的第一、第二主成分平面上小区域分布密度最大的像素点的颜色为目标颜色;在以目标颜色的像素点组合的点集中,计算各像素点的色彩均值;根据计算的色彩均值,并参考所述三维色彩模型下第一、第二主成分在各坐标轴上的贡献率,确定所述阈值。本专利技术还提供一种非自然对象的图像替换方法,包括:根据如上所述的图像识别方法,从待识别的图像中得到非自然对象所在区域的图像,并对其二值化得到二值化图像,进而识别出非自然对象;根据识别结果,替换掉所述非自然对象所在区域的图像中的非自然对象,且对替换对象进行透视变换,得到替换后的图像;将替换后的图像置入原图像;其中,所述原图像为所述待识别的图像。较佳地,所述非自然对象具体为文字,以及所述根据识别结果,替换掉所述非自然对象所在区域的图像中的非自然对象,具体包括:根据识别出的文字的字体、大小,将相应字体、字号的文字替换掉所述非自然对象所在区域的图像中的文字。其中,所述对替换对象进行透视变换,具体包括:对所述二值化的图像进行边缘提取;选取提取的任意一组可能的边缘直线,进行四边形构建尝试后,将包围所述非自然对象的最小面积的四边形,作为最终识别结果并输出该四边形的顶点坐标;利用所述顶点坐标计算所述替换对象的透视变形参数,对所述替换对象进行透视变换。较佳地,在所述将替换后的图像置入原图像后,还包括:采用图像融合算法,通过以置入的图像的边界数据为初值的泊松方程的计算,对置入的图像在色彩上进行精细处理。本专利技术还提供一种非自然对象的图像识别装置,包括:初步识别模块,用于利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;色彩主成分分析模块,用于统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;图像二值化模块,用于根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;对象识别模块,用于根据二值化的图像,对非自然对象进行识别。本专利技术还提供一种非自然对象的图像替换装置,包括:如上所述基于色彩主成分分析的图像识别装置中的各模块,以及还包括:图像替换模块,用于根据所述对象识别模块的识别结果,替换掉所述非自然对象所在区域的图像中的非自然对象,且对替换对象进行透视变换,得到替换后的图像;图像置入模块,用于将替换后的图像置入原图像;其中,所述原图像为所述待识别的图像。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如上所述的非自然对象的图像识别、替换方法。本专利技术的技术方案中,利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;根据二值化的图像,对非自然对象进行识别。相比于现有技术,本专利技术技术方案由于在对图像进行二值化之前,利用非自然对象在色彩上具有的一致性,通过三维色彩模型(RGB色彩模型)对图像像素点的分布情况进行统计分析,根据色彩的主成分分析结果来确定二值化的阈值,更能区别作为前景物的非自然对象以及背景色;尤其对于前景物与背景色灰度化后的灰度值过于接近的情况,通过色彩的主成分分析结果确定的阈值仍能很好地界定出前景物与背景之间的灰度值界限;从而二值化的图像中能够清晰体现出前景物与背景,提高从图像中识别作为前景物的非自然对象的准确率;进一步,本专利技术的技术方案中,在识别出非自然对象后,可以使用识别结果替换掉图像中的非自然对象,且对替换对象进行透视变换,从而提高替换后的图像的清晰度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种非自然对象的图像识别方法流程图;图2为本专利技术实施例提供的一种待识别的图像的示意图;图3为本专利技术实施例提供的一种非自然对象所在区域的图像的示意图;图4为本专利技术实施例提供的取样的像素点的色彩值在三维色彩模型下的三维空间分布的示意图;图5a为本专利技术实施例提供的一种灰度化、二值化后的示意图;图5b为本专利技术实施例提供的一种二值化的图像的边缘提取示意图;图6为本专利技术实施例提供的一种对非自然对象所在区域的图像中的替换对象进行透视变换的方法流程图;图7为本专利技术实施例提供的一种对图像中的非自然对象进行替换后的图像的示意图;图8为本专利技术实施例提供的一种替换后的图像置入到原图像后得到的图像的示意图;图9a、9b分别为本专利技术实施例提供的一种非自然对象的图像识别、替换装置的内部结构框图;图10为本专利技术实施例提供的一种电子设备硬件结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,除非另外定义,本专利技术实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要本文档来自技高网...

【技术保护点】
1.一种非自然对象的图像识别方法,其特征在于,包括:/n利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;/n统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;/n根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;/n根据二值化的图像,对非自然对象进行识别。/n

【技术特征摘要】
20201127 CN 202011364981X1.一种非自然对象的图像识别方法,其特征在于,包括:
利用经过预先训练得到的神经网络从待识别的图像中,初步识别并输出非自然对象所在区域的图像;
统计取样得到的像素点的色彩值在三维色彩模型下的三维空间分布,并进行主成分分析;
根据主成分分析结果,确定图像二值化的阈值,并根据确定的阈值,对所述非自然对象所在区域的图像进行二值化;
根据二值化的图像,对非自然对象进行识别。


2.根据权利要求1所述的方法,其特征在于,所述根据主成分分析结果,确定图像二值化的阈值,具体包括:
利用所述非自然对象所在区域的图像的色彩值在主成分分析中的分布特征,选取贡献率最大的第一、第二主成分平面上小区域分布密度最大的像素点的颜色为目标颜色;
在以目标颜色的像素点组合的点集中,计算各像素点的色彩均值;
根据计算的色彩均值,并参考所述三维色彩模型下第一、第二主成分在各坐标轴上的贡献率,确定所述阈值。


3.根据权利要求1所述的方法,其特征在于,所述图像二值化的阈值具体包括:所述三维色彩模型中R值坐标轴的上、下阈值、G值坐标轴的上、下阈值、B值坐标轴的上、下阈值;以及
所述根据计算的色彩均值,并参考所述三维色彩模型下第一、第二主成分在各坐标轴上的贡献率,确定所述阈值,具体包括:
根据如下公式1~6分别计算出所述三维色彩模型中R值坐标轴的上、下阈值、G值坐标轴的上、下阈值、B值坐标轴的上、下阈值:
Rh=W+SR×P×QR(公式1)
Rl=W-SR×P×QR(公式2)
Gh=W+SG×P×QG(公式3)
Gl=W-SG×P×QG(公式4)
Bh=W+SB×P×QB(公式5)
Bl=W-SB×P×QB(公式6)
其中,W表示所述色彩均值,P表示所述非自然对象在所述非自然对象所在区域的图像中所占面积的预估比值参数,SR、SG、SB分别表示第一、第二主成分在R、G、B值坐标轴的取值区域,QR、QG、QB分别表示第一、第二主成分在R、G、B值坐标轴上的贡献率,Rh、Rl分别表示R值坐标轴的上、下阈值,Gh、Gl分别表示G值坐标轴的上、下阈值,Bh、Bl分别表示B值坐标轴的上、下阈值。


4.一种非自然对象的图像替换方法,其特征在于,包括:
根据如权利要求1-3任一所述的图像识别方法,从待识别的图像中得到非自然对象所在区...

【专利技术属性】
技术研发人员:高灵超程志华李浩松王路涛刘文立郝赫王一梦郭敬林
申请(专利权)人:国家电网有限公司大数据中心北京国电通网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1