一种重图识别方法和装置制造方法及图纸

技术编号:28538386 阅读:28 留言:0更新日期:2021-05-21 09:02
本发明专利技术公开了一种重图识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定图片对,基于与各个图片对应的像素带,确定图片对的重合像素带;根据合像素带的逆向文件频率和在各个图片中的出现次数,计算重合像素带在各个图片中的词频逆向文件频率占比;基于词频逆向文件频率占比生成对比指标向量,输入对比指标向量至逻辑回归模型,得到重图分类结果,以识别图片对是否为重图。该实施方式以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题;无需进行图片标注,因此对于新品类/类型图片的识别无需进行标注和训练操作,以此实现了新品图片的快速响应。

【技术实现步骤摘要】
一种重图识别方法和装置
本专利技术涉及计算机
,尤其涉及一种重图识别方法和装置。
技术介绍
电商平台中同一物品可能在多家店铺售卖,其中可能存在盗图后的简单修改。从图片角度区分两个店铺所售卖是否为同一物品或近似物品,对于电商运营中的物品维权有很大的意义。基于人工查找相同物品耗费人力、时间成本较高,由此现有主要利用多层卷积方式对图片进行主体识别,以确定要匹配的物品在图片中的位置,然后提取该位置处图片的特征向量,以此计算不同图片的相似度。但实现本专利技术的过程中,专利技术人发现现有技术至少存在如下问题:采用的多层卷积方式耗费资源量较大,且需在GPU(GraphicsProcessingUnit,图形处理器)服务器上运行,而GPU服务器价格昂贵,且复用率低;需要进行图片标注和机器学习,对于新类型的图片需要重新标注和训练,影响图片处理速度。
技术实现思路
有鉴于此,本专利技术实施例提供一种重图识别方法和装置,至少能够解决现有算法准确率低、耗费资源多、处理新分类速度慢的问题。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种重图识别方法,包括:确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。可选的,在所述确定图片对之前,还包括:接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。可选的,在所述对所述图片集中各个图片进行灰度处理之前,还包括:获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。可选的,在所述基于与各个图片对应的像素带,确定所述图片对的重合像素带之前,包括:获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。可选的,所述根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比,包括:统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比。可选的,所述获取各个像素带的逆向文件频率,包括:根据同一像素带在各个图片中的出现次数,确定出现次数不为零的图片的数量,结合图片集中图片的总数量,得到所述总数量与所述数量的比值;对所述比值取对数,得到所述同一像素带在所述图片集中的逆向文件频率。可选的,所述基于所述词频逆向文件频率占比生成对比指标向量,还包括:统计与各个图片对应的像素带的种类数量;以及统计所述图片对中重合像素带的种类数量和不重合像素带的种类数量;并且计算所述重合像素带的种类数量在所述像素带的种类数量中的数量占比;基于所述词频逆向文件频率占比、所述像素带的种类数量、所述重合像素带的种类数量、所述不重合像素带的种类数量和所述数量占比,生成所述对比指标向量。为实现上述目的,根据本专利技术实施例的另一方面,提供了一种重图识别装置,包括:像素带重合模块,用于确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;占比计算模块,用于根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;重图识别模块,用于基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。可选的,还包括图片对组合模块,用于:接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。可选的,所述图片对组合模块,还用于:获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。可选的,还包括像素带组合模块,用于:获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。可选的,所述占比计算模块,用于:统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比。可选的,所述占比计算模块,用于:根据同一像素带本文档来自技高网...

【技术保护点】
1.一种重图识别方法,其特征在于,包括:/n确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;/n根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;/n基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。/n

【技术特征摘要】
1.一种重图识别方法,其特征在于,包括:
确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;
根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;
基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。


2.根据权利要求1所述的方法,其特征在于,在所述确定图片对之前,还包括:
接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;
根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;
判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;
根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;
提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。


3.根据权利要求2所述的方法,其特征在于,在所述对所述图片集中各个图片进行灰度处理之前,还包括:
获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。


4.根据权利要求1所述的方法,其特征在于,在所述基于与各个图片对应的像素带,确定所述图片对的重合像素带之前,包括:
获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;
根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;
组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。


5.根据权利要求1所述的方法,其特征在于,所述根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比,包括:
统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到...

【专利技术属性】
技术研发人员:赵墨农亢维盼
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1