一种图像检测方法和装置制造方法及图纸

技术编号:24996177 阅读:10 留言:0更新日期:2020-07-24 17:58
本发明专利技术公开了一种图像检测方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:提取第一目标图像的嵌入特征;分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息;根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果。其检测模型训练速度快,具备快速迭代优化的能力,对线上图像误检测情况能够快速响应,检测效率高,泛化能力强,可迁移性高,在新业务场景下也能达到很好的检测效果,充分满足多业务场景的检测需求。

【技术实现步骤摘要】
一种图像检测方法和装置
本专利技术涉及计算机
,尤其涉及一种图像检测方法和装置。
技术介绍
目前很多网站和App(应用程序)都提供了UGC(用户生产并发布的内容)的功能,使得每个用户都可以发布自己生产、编辑的多媒体信息,平台对线上多媒体内容的监管难度陡增,现有的人工审核方式面临巨大挑战,同时多媒体内容形式多样,包含文本、图像、音频、视频等,对审核人员也提出了更高的要求。现有内容审核主要包括两种方案:一种是以图像分类卷积网络作为检测模型,应用较多的有Inception(GoogLeNet(一种深度网络结构)的核心结构,用于增加网络深度和宽度)、Resnet(残差网络)两类网络结构,图像经过图像分类卷积网络输出各个类别的概率值,如果违规类别的概率值过高,则说明该图像是有问题的;另一种是采用pHash(感知哈希)算法进行图像相似检测,拦截和违规名单中相似的图像。目前内容审核存在诸多难点,一是内容安全系统必然不能对业务场景下所有可能出现的违规内容实现全部召回,不法分子总是试图绕过审核系统去传播违规内容,这对内容安全系统的快速优化迭代提出了要求;二是业务场景多样性,直播、短视频、社交网络、电商平台等,每时每分都会在线上产生大量的、多样的图像信息,需要对各种业务场景都有很好的拦截效果,这对内容安全系统的可迁移性提出了要求;三是无论是违规内容的传播,还是线上信息的阻塞,都会对用户体验造成负面影响,因此对违规风险内容的拦截要尽可能是实时的,这对内容安全系统的高效性提出了要求。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:第一种方案检测模型训练时间长,当线上出现误检测(例如漏杀或误杀)的违规内容时,迭代优化模型的速度较慢,从而在出现误检测图像之后无法快速响应,影响检测效率,第二种方案虽能通过扩充违规图像库实现快速迭代优化,但是其不具有泛化能力,对图像库以外的图像无法拦截,且上述两种方案可迁移性均不高,难以满足多业务场景的检测需求。
技术实现思路
有鉴于此,本专利技术实施例提供一种图像检测方法和装置,检测模型训练速度快,具备快速迭代优化的能力,对线上图像误检测情况能够快速响应,检测效率高,泛化能力强,可迁移性高,在新业务场景下也能达到很好的检测效果,充分满足多业务场景的检测需求。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种图像检测方法。一种图像检测方法,包括:提取第一目标图像的嵌入特征;分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息;根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果。可选地,所述提取第一目标图像的嵌入特征之前,包括:利用第一图像训练数据集训练图像分类网络,所述图像分类网络包括所述归一化层和用于提取所述第一目标图像的嵌入特征的图像嵌入特征提取器。可选地,所述分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息之前,包括:通过训练后的所述图像嵌入特征提取器,提取所述第一图像训练数据集的嵌入特征,以得到第一图像特征训练集;利用所述第一图像特征训练集训练所述图像分类器。可选地,所述输出所述第一目标图像是否为特定类别图像的检测结果之后,还包括:将误检测图像加入所述第一图像训练数据集,得到第二图像训练数据集,所述误检测图像包括所述第一目标图像中的检测结果有误的图像;通过所述图像嵌入特征提取器,提取所述第二图像训练数据集的嵌入特征,以得到第二图像特征训练集;利用所述第二图像特征训练集重新训练所述图像分类器。可选地,所述利用所述第二图像特征训练集重新训练所述图像分类器之后,包括:提取第二目标图像的嵌入特征;通过所述归一化层得到所述第二目标图像的嵌入特征对应的第一类别输出值,以及通过利用所述第二图像特征训练集训练后的所述图像分类器,得到所述第二目标图像的嵌入特征对应的第二类别输出值;根据所述第一类别输出值和第一权重,以及所述第二类别输出值和第二权重,输出所述第二目标图像是否为所述特定类别图像的检测结果,其中,所述第一权重和所述第二权重通过对包括所述图像分类网络和所述图像分类器的图像检测模型训练得到。可选地,所述利用所述第一图像特征训练集训练所述图像分类器之后,包括:收集第二业务场景中的图像样本,所述第二业务场景不同于所述第一图像训练数据集和所述第一目标图像所在的第一业务场景;通过训练后的所述图像嵌入特征提取器,提取所述第二业务场景中的图像样本的嵌入特征,以得到第三图像特征训练集;利用所述第三图像特征训练集重新训练所述图像分类器。可选地,所述利用所述第三图像特征训练集重新训练所述图像分类器之后,包括:提取第三目标图像的嵌入特征;通过所述归一化层得到所述第三目标图像的嵌入特征对应的第三类别输出值,以及通过利用所述第三图像特征训练集训练后的所述图像分类器,得到所述第三目标图像的嵌入特征对应的第四类别输出值;根据所述第三类别输出值和第三权重,以及所述第四类别输出值和第四权重,输出所述第三目标图像是否为所述特定类别图像的检测结果,所述第三权重和所述第四权重通过对包括所述图像分类网络和所述图像分类器的图像检测模型训练得到,且所述第三权重和所述第四权重与业务场景相关。可选地,所述图像嵌入特征提取器为深度卷积网络。可选地,所述根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果,包括:判断所述归一化层输出的类别输出值和所述图像分类器输出的类别输出值二者之中,是否至少一者所指示的类别与特定类别相同,若是,则输出所述第一目标图像为所述特定类别图像的检测结果,否则输出所述第一目标图像不为所述特定类别图像的检测结果。可选地,所述图像分类器为轻量级图像分类器。根据本专利技术实施例的另一方面,提供了一种图像检测装置。一种图像检测装置,包括:特征提取模块,用于提取第一目标图像的嵌入特征;类别信息确定模块,用于分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息;图像检测模块,用于根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果。可选地,还包括第一训练模块,用于:利用第一图像训练数据集训练图像分类网络,所述图像分类网络包括所述归一化层和用于提取所述第一目标图像的嵌入特征的图像嵌入特征提取器。可选地,所述特征提取模块还用于:通过训练后的所述图像嵌入特征提取器,提取所述第一图像训练数据集的嵌入特征,以得到第一图像特征训练集;所述第一训练模块还用于:利用所述第一图像特征训练集训练所述图像分类器。可选地,还包括第二训练模块,用于:将误检测图像加入所述第一图像训练数据集,得到第二图像训练数据集,所述误检测图像包括所述第一目标图像中的检测结果有误的图像;所述特征提取模块还用于:通过所述图像嵌入特征提取器,提取所述第二图像训练数据集的嵌入特征,以得到本文档来自技高网
...

【技术保护点】
1.一种图像检测方法,其特征在于,包括:/n提取第一目标图像的嵌入特征;/n分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息;/n根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果。/n

【技术特征摘要】
1.一种图像检测方法,其特征在于,包括:
提取第一目标图像的嵌入特征;
分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息;
根据所述归一化层确定的所述类别信息和所述图像分类器确定的所述类别信息,输出所述第一目标图像是否为特定类别图像的检测结果。


2.根据权利要求1所述的方法,其特征在于,所述提取第一目标图像的嵌入特征之前,包括:
利用第一图像训练数据集训练图像分类网络,所述图像分类网络包括所述归一化层和用于提取所述第一目标图像的嵌入特征的图像嵌入特征提取器。


3.根据权利要求2所述的方法,其特征在于,所述分别通过归一化层和图像分类器,确定所述第一目标图像的嵌入特征对应的类别信息之前,包括:
通过训练后的所述图像嵌入特征提取器,提取所述第一图像训练数据集的嵌入特征,以得到第一图像特征训练集;
利用所述第一图像特征训练集训练所述图像分类器。


4.根据权利要求2所述的方法,其特征在于,所述输出所述第一目标图像是否为特定类别图像的检测结果之后,还包括:
将误检测图像加入所述第一图像训练数据集,得到第二图像训练数据集,所述误检测图像包括所述第一目标图像中的检测结果有误的图像;
通过所述图像嵌入特征提取器,提取所述第二图像训练数据集的嵌入特征,以得到第二图像特征训练集;
利用所述第二图像特征训练集重新训练所述图像分类器。


5.根据权利要求4所述的方法,其特征在于,所述利用所述第二图像特征训练集重新训练所述图像分类器之后,包括:
提取第二目标图像的嵌入特征;
通过所述归一化层得到所述第二目标图像的嵌入特征对应的第一类别输出值,以及通过利用所述第二图像特征训练集训练后的所述图像分类器,得到所述第二目标图像的嵌入特征对应的第二类别输出值;
根据所述第一类别输出值和第一权重,以及所述第二类别输出值和第二权重,输出所述第二目标图像是否为所述特定类别图像的检测结果,其中,所述第一权重和所述第二权重通过对包括所述图像分类网络和所述图像分类器的图像检测模型训练得到。


6.根据权利要求2所述的方法,其特征在于,所述利用所述第一图像特征训练集训练所述图像分类器之后,包括:
收集第二业务场景中的图像样本,所述第二业务场景不同于所述第一图像训练数据集和所述第一目标图像所在的第一业务场景;
通过训练后的所述图像嵌入特征提取器,提取...

【专利技术属性】
技术研发人员:苏晨张晓东李晓敦闫立志李江东周鑫磊周利华
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1