一种图片识别方法技术

技术编号:39501505 阅读:21 留言:0更新日期:2023-11-24 11:32
本申请提供一种图片识别方法

【技术实现步骤摘要】
一种图片识别方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理和图片识别的
,具体而言,涉及一种图片识别方法

装置

电子设备及存储介质


技术介绍

[0002]人工智能生成内容
(Artificial Intelligence Generated Content

AIGC),
是指利用人工智能
(AI)
技术生成的各种类型的内容,如文本

图像

音频等
。AIGC
可以根据输入的数据和模型进行自主创作和生成,而无需人类直接参与创作过程
。AIGC
图片是指使用
AIGC
技术生成的图片或图像,例如:使用
stablediffusion
工具生成的图片或图像

[0003]目前,
AIGC
图片的识别方式大都是通过检测原始采集图片是否被修改的方式,例如:使用基于图像结构的检测算法

基于纹理分析的算法

基于光照一致性的算法来检测图片是否被
AI
修改过的
AIGC
图片

然而在实践的过程中发现,被修图软件修改过的图片也会被认为是
AIGC
图片,也就是说,通过检测原始采集图片是否被修改的方式来进行图片识别的准确率较低


技术实现思路

[0004]本申请实施例的目的在于提供一种图片识别方法

装置

电子设备及存储介质,用于改善图片识别的准确率较低的问题

[0005]本申请实施例提供了一种图片识别方法,包括:计算多模态数据中的文本数据与多模态数据中的图片数据之间的相似度值;对图片数据进行修改识别,获得修改结果;根据相似度值和修改结果识别出图片数据的类别

在上述方案的实现过程中,通过计算出多模态数据中的文本数据与图片数据之间的相似度值,并根据该相似度值和该图片数据的修改结果来确定图片数据的类别,改善了通过图片数据的修改结果来进行图片识别的准确率较低的情况,有效地利用了文本数据与图片数据之间的相似度值来提高图片识别的准确率

[0006]可选地,在本申请实施例中,在计算多模态数据中的文本数据与多模态数据中的图片数据之间的相似度值之前,还包括:从社区平台系统的数据库中获取多模态数据;或者,接收社区平台系统的服务器发送的多模态数据

在上述方案的实现过程中,通过从社区平台系统的数据库中获取多模态数据,或者,接收社区平台系统的服务器发送的多模态数据,从而改善了单独写程序采集多模态数据的效率较低的情况,有效地提高了多模态数据的获取效率

[0007]可选地,在本申请实施例中,计算多模态数据中的文本数据与多模态数据中的图片数据之间的相似度值,包括:使用对比文本图像的预训练
CLIP
模型计算出文本数据与图片数据之间的相似度值

在上述方案的实现过程中,通过使用对比文本图像的预训练
CLIP
模型计算出文本数据与图片数据之间的相似度值,从而有效地计算出了文本数据与图片数据之间的相似度值,并根据该相似度值和该图片数据的修改结果来确定图片数据的类别,改善了通过图片数据的修改结果来进行图片识别的准确率较低的情况

[0008]可选地,在本申请实施例中,对图片数据进行修改识别,包括:根据图片数据的纹理一致性

光照一致性

颜色一致性

边缘一致性

压缩块边界或统计特征对图片数据进行修改识别

在上述方案的实现过程中,通过根据图片数据的纹理一致性

光照一致性

颜色一致性

边缘一致性

压缩块边界或统计特征对图片数据进行修改识别,从而改善了识别出图片数据是否被修改的正确率较低的情况,有效地提高了对图片数据进行修改识别的正确率

[0009]可选地,在本申请实施例中,根据相似度值和修改结果识别出图片数据的类别,包括:判断修改结果和相似度值是否满足预设条件,预设条件包括:修改结果为图片数据被修改过,且相似度值大于预设阈值;若是,则将图片数据的类别确定为人工智能生成内容
AIGC
图片

在上述方案的实现过程中,通过在修改结果为图片数据被修改过,且相似度值大于预设阈值的情况下,才将图片数据的类别确定为人工智能生成内容
AIGC
图片,从而有效地利用了文本数据与图片数据之间的相似度值来提高图片识别的准确率

[0010]可选地,在本申请实施例中,在判断修改结果和相似度值是否满足预设条件之后,还包括:若修改结果为图片数据被修改过,且相似度值小于或等于预设阈值,则将图片数据的类别确定为用户生成内容
UGC
图片

在上述方案的实现过程中,通过在修改结果为图片数据被修改过,且相似度值小于或等于预设阈值的情况下,才将图片数据的类别确定为用户生成内容
UGC
图片,从而有效地利用了文本数据与图片数据之间的相似度值来提高图片识别的准确率

[0011]可选地,在本申请实施例中,根据相似度值和修改结果识别出图片数据的类别,包括:若修改结果为图片数据没有被修改过,则将图片数据的类别确定为原始采集图片

在上述方案的实现过程中,通过在修改结果为图片数据没有被修改过的情况下,才将图片数据的类别确定为原始采集图片,从而改善了确定原始采集图片的效率较低的情况,有效地提高了原始采集图片的效率

[0012]本申请实施例还提供了一种图片识别装置,包括:相似度值计算模块,用于计算多模态数据中的文本数据与多模态数据中的图片数据之间的相似度值;修改结果获得模块,用于对图片数据进行修改识别,获得修改结果;图片类别识别模块,用于根据相似度值和修改结果识别出图片数据的类别,图片数据的类别包括:人工智能生成内容
AIGC
图片

用户生成内容
UGC
图片和原始采集图片

[0013]可选地,在本申请实施例中,图片识别装置,还包括:模态数据获取模块,用于从社区平台系统的数据库中获取多模态数据;或者,模态数据接收模块,用于接收社区平台系统的服务器发送的多模态数据

[0014]可选地,在本申请实施例中,相似度值计算模块,包括:模型处理子模块,用于使用对比文本图像的预训练
CLIP
模型计算出文本数据与图片数据之间的相似度值

[0015]可选地,在本申请实施例中,修改结果获得模块,包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图片识别方法,其特征在于,包括:计算多模态数据中的文本数据与所述多模态数据中的图片数据之间的相似度值;对所述图片数据进行修改识别,获得修改结果;根据所述相似度值和所述修改结果识别出所述图片数据的类别,所述图片数据的类别包括:人工智能生成内容
AIGC
图片

用户生成内容
UGC
图片和原始采集图片
。2.
根据权利要求1所述的方法,其特征在于,在所述计算多模态数据中的文本数据与所述多模态数据中的图片数据之间的相似度值之前,还包括:从社区平台系统的数据库中获取所述多模态数据;或者,接收社区平台系统的服务器发送的所述多模态数据
。3.
根据权利要求1所述的方法,其特征在于,所述计算多模态数据中的文本数据与所述多模态数据中的图片数据之间的相似度值,包括:使用对比文本图像的预训练
CLIP
模型计算出所述文本数据与所述图片数据之间的相似度值
。4.
根据权利要求1所述的方法,其特征在于,所述对所述图片数据进行修改识别,包括:根据所述图片数据的纹理一致性

光照一致性

颜色一致性

边缘一致性

压缩块边界或统计特征对所述图片数据进行修改识别
。5.
根据权利要求1所述的方法,其特征在于,所述根据所述相似度值和所述修改结果识别出所述图片数据的类别,包括:判断所述修改结果和所述相似度值是否满足预设条件,所述预设条件包括:所述修改结果为所述图片数据被修改过,且所述相似度值大...

【专利技术属性】
技术研发人员:阳成文周斌王志伟
申请(专利权)人:上海识装信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1