一种标识信息的处理方法技术

技术编号:39741620 阅读:15 留言:0更新日期:2023-12-17 23:42
本申请实施例公开了一种标识信息的处理方法

【技术实现步骤摘要】
一种标识信息的处理方法、处理系统以及存储介质


[0001]本申请实施例涉及计算机视觉
,尤其一种标识信息的处理方法

处理系统以及存储介质


技术介绍

[0002]现有的检测互联网上图片或视频中的
logo(
商标
)
对相应的分类推荐和版权保护有重要作用

而网络上传播的视频以及图片的数量庞大,通过人工检测的方式难以实现;现有的,通过机器学习的目标检测技术检测视频以及图片中的
logo。
[0003]现有的图片或视频中的
logo
往往包括两个部分,
logo
图像和
logo
文本

由于
logo
图像具有多种图像风格,而文本部分的结构和变化则更为复杂,导致目标检测技术的检测结果较差,存在大量的错判和漏判情况


技术实现思路

[0004]本申请实施例提供了一种标识信息的处理方法

处理系统以及存储介质,能够有效提高标识信息的识别结果的准确性

[0005]本申请实施例提供了一种标识信息的处理方法,包括:
[0006]获取图像数据

预先训练的图像检测模型以及预先训练的文字识别模型;
[0007]将所述图像数据分别输入所述图像检测模型以及所述文字识别模型,得到所述图像检测模型输出的所述图像数据中标识图像的位置区域以及标识图像的标识类别,并得到所述文字识别模型输出的所述图像数据中标识文本的位置区域以及标识文本的标识类别;
[0008]确定所述图像数据中标识类别相同的目标标识图像与目标标识文本;
[0009]将所述目标标识图像的位置区域以及所述目标标识文本的位置区域作为目标位置区域,并确定所述目标位置区域之间的目标区域距离;
[0010]基于所述目标区域距离识别所述图像数据中是否存在标识信息

[0011]进一步的,所述获取图像数据包括:
[0012]获取符合预设校验要求的视频流;
[0013]基于第一抽取密度抽取所述视频流得到多帧初始视频图像;
[0014]基于所述多帧初始视频图像之间的图像特征相似度,筛选所述多帧初始视频图像,得到多帧视频图像,并将所述多帧视频图像作为所述图像数据;其中,所述第一抽取密度小于预设密度阈值

[0015]进一步的,所述确定所述目标位置区域之间的区域距离包括:
[0016]在所述多帧视频图像的预设视频图像中,确定所述目标标识图像的位置区域与所述目标标识文本的位置区域之间的区域距离,并将所述区域距离作为所述目标区域距离;所述预设视频图像为所述多帧视频图像中任一视频图像;
[0017]所述基于所述目标区域距离确定所述图像数据中是否存在标识信息包括:
[0018]若所述区域距离小于预设距离阈值,则确定所述图像数据中存在标识信息;
[0019]若所述区域距离大于等于所述预设距离阈值,则确定所述图像数据中不存在标识信息

[0020]进一步的,所述获取图像数据包括:
[0021]获取符合预设校验要求的视频流;
[0022]基于第二抽取密度抽取所述视频流得到多帧视频图像,并将所述多帧视频图像作为所述图像数据;其中,所述第二抽取密度大于预设密度阈值

[0023]进一步的,若所述图像数据中存在标识信息,所述方法还包括:
[0024]基于所述目标区域距离,将所述目标标识图像的位置区域合并为文本去除区域,并将所述目标标识文本的位置区域合并为图像去除区域;
[0025]根据所述文本去除区域以及所述图像去除区域去除所述图像数据中的标识信息

[0026]进一步的,所述图像数据包括:从视频流抽取的多帧视频图像;
[0027]所述确定所述目标位置区域之间的目标区域距离包括:
[0028]在所述多帧视频图像的预设视频图像中,确定所述目标标识图像的位置区域之间的第一区域重合度,以及所述目标标识文本的位置区域之间的第二区域重合度,并将所述第一区域重合度以及所述第二区域重合度作为所述目标区域距离,所述预设视频图像为所述多帧视频图像中任一视频图像;
[0029]所述基于所述目标区域距离,将所述目标标识图像的位置区域合并为文本去除区域,并将所述目标标识文本的位置区域合并为图像去除区域包括:
[0030]若所述第一区域重合度大于预设重合度阈值,则合并所述预设视频图像中所述目标标识图像的位置区域,得到所述预设视频图像对应的初始图像去除区域;
[0031]在所述多帧视频图像的相邻帧视频图像中,基于区域重合度合并所述初始图像去除区域,得到所述图像去除区域;
[0032]若所述第二区域重合度大于预设重合度阈值,则合并所述预设视频图像中所述目标标识文本的位置区域,得到所述预设视频图像对应的初始文本去除区域;
[0033]在所述多帧视频图像的相邻帧视频图像中,基于区域重合度合并所述初始文本去除区域,得到所述文本去除区域

[0034]进一步的,所述图像数据包括:从视频流抽取的多帧视频图像;
[0035]所述根据所述文本去除区域以及所述图像去除区域去除所述图像数据中的标识信息包括:
[0036]确定所述视频流中是否存在片尾区域;
[0037]若是,则从所述视频流抽取的多帧视频图像中,将片尾区域对应的视频图像删除;
[0038]将剩余的视频图像中目标视频图像的文本去除区域以及图像去除区域,延伸至所述目标视频图像的相邻帧视频图像中,以确定所述视频流中每帧视频图像的文本去除区域以及图像去除区域,其中,所述相邻帧视频图像为在所述视频流的视频播放顺序上与所述目标视频图像相邻的视频图像;
[0039]将所述视频流中每帧视频图像的文本去除区域以及图像去除区域,输入预设插值算法,去除所述视频流中每帧视频图像的标识信息

[0040]进一步的,所述确定所述视频流中是否存在片尾区域包括:
[0041]获取在所述视频流的结尾时间段内抽取的多帧结尾视频图像;
[0042]按与所述视频流的视频播放顺序相反的顺序,逐一检测所述多帧结尾视频图像中的标识信息

二维码信息

纯屏比例以及相邻帧结尾视频图像的相似度;
[0043]根据检测结果确定所述多帧结尾视频图像中片尾开始的视频图像;
[0044]根据所述片尾开始的视频图像确定所述视频流中片尾的持续时长;
[0045]基于所述片尾的持续时长确定所述视频流中是否存在片尾区域

[0046]进一步的,所述获取预先训练的图像检测模型包括:
[0047]获取待检测的标识图像

背景图像以及初始图像检测模型;
[0048]将所述待检测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种标识信息的处理方法,其特征在于,包括:获取图像数据

预先训练的图像检测模型以及预先训练的文字识别模型;将所述图像数据分别输入所述图像检测模型以及所述文字识别模型,得到所述图像检测模型输出的所述图像数据中标识图像的位置区域以及标识图像的标识类别,并得到所述文字识别模型输出的所述图像数据中标识文本的位置区域以及标识文本的标识类别;确定所述图像数据中标识类别相同的目标标识图像与目标标识文本;将所述目标标识图像的位置区域以及所述目标标识文本的位置区域作为目标位置区域,并确定所述目标位置区域之间的目标区域距离;基于所述目标区域距离识别所述图像数据中是否存在标识信息
。2.
根据权利要求1所述的处理方法,其特征在于,所述获取图像数据包括:获取符合预设校验要求的视频流;基于第一抽取密度抽取所述视频流得到多帧初始视频图像;基于所述多帧初始视频图像之间的图像特征相似度,筛选所述多帧初始视频图像,得到多帧视频图像,并将所述多帧视频图像作为所述图像数据;其中,所述第一抽取密度小于预设密度阈值
。3.
根据权利要求2所述的处理方法,其特征在于,所述确定所述目标位置区域之间的区域距离包括:在所述多帧视频图像的预设视频图像中,确定所述目标标识图像的位置区域与所述目标标识文本的位置区域之间的区域距离,并将所述区域距离作为所述目标区域距离;所述预设视频图像为所述多帧视频图像中任一视频图像;所述基于所述目标区域距离确定所述图像数据中是否存在标识信息包括:若所述区域距离小于预设距离阈值,则确定所述图像数据中存在标识信息;若所述区域距离大于等于所述预设距离阈值,则确定所述图像数据中不存在标识信息
。4.
根据权利要求1所述的处理方法,其特征在于,所述获取图像数据包括:获取符合预设校验要求的视频流;基于第二抽取密度抽取所述视频流得到多帧视频图像,并将所述多帧视频图像作为所述图像数据;其中,所述第二抽取密度大于预设密度阈值
。5.
根据权利要求1所述的处理方法,其特征在于,若所述图像数据中存在标识信息,所述方法还包括:基于所述目标区域距离,将所述目标标识图像的位置区域合并为文本去除区域,并将所述目标标识文本的位置区域合并为图像去除区域;根据所述文本去除区域以及所述图像去除区域去除所述图像数据中的标识信息
。6.
根据权利要求5所述的处理方法,其特征在于,所述图像数据包括:从视频流抽取的多帧视频图像;所述确定所述目标位置区域之间的目标区域距离包括:在所述多帧视频图像的预设视频图像中,确定所述目标标识图像的位置区域之间的第一区域重合度,以及所述目标标识文本的位置区域之间的第二区域重合度,并将所述第一区域重合度以及所述第二区域重合度作为所述目标区域距离,所述预设视频图像为所述多
帧视频图像中任一视频图像;所述基于所述目标区域距离,将所述目标标识图像的位置区域合并为文本去除区域,并将所述目标标识文本的位置区域合并为图像去除区域包括:若所述第一区域重合度大于预设重合度阈值,则合并所述预设视频图像中所述目标标识图像的位置区域,得到所述预设视频图像对应的初始图像去除区域;在所述多帧视频图像的相邻帧视频图像中,基于区域重合度合并所述初始图像去除区域,得到所述图像去除区域;和
/
或,若所述第二区域重合度大于预设重合度阈值,则合并所述预设视频图像中所述目标标识文本的位置区域,得到所述预设视频图像对应的初始文本去除区域;在所述多帧视频图像...

【专利技术属性】
技术研发人员:寇志娟李革委胡鹏
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1