一种标识信息的处理方法技术

技术编号：39741620 阅读：23 留言：0更新日期：2023-12-17 23:42

本申请实施例公开了一种标识信息的处理方法

全部详细技术资料下载

【技术实现步骤摘要】
一种标识信息的处理方法、处理系统以及存储介质

[0001]本申请实施例涉及计算机视觉
，尤其一种标识信息的处理方法
、
处理系统以及存储介质
。

技术介绍

[0002]现有的检测互联网上图片或视频中的
logo(
商标
)
对相应的分类推荐和版权保护有重要作用
。
而网络上传播的视频以及图片的数量庞大，通过人工检测的方式难以实现；现有的，通过机器学习的目标检测技术检测视频以及图片中的
logo。
[0003]现有的图片或视频中的
logo
往往包括两个部分，
logo
图像和
logo
文本
。
由于
logo
图像具有多种图像风格，而文本部分的结构和变化则更为复杂，导致目标检测技术的检测结果较差，存在大量的错判和漏判情况
。

技术实现思路

[0004]本申请实施例提供了一种标识信息的处理方法
、
处理系统以及存储介质，能够有效提高标识信息的识别结果的准确性
。
[0005]本申请实施例提供了一种标识信息的处理方法，包括：
[0006]获取图像数据
、
预先训练的图像检测模型以及预先训练的文字识别模型；
[0007]将所述图像数据分别输入所述图像检测模型以及所述文字识别模型，得到所述图像检测模型输出的所述图像数据中标识图像的位置区域以及标识图像的标识类别，并得...

【技术保护点】

【技术特征摘要】
1.
一种标识信息的处理方法，其特征在于，包括：获取图像数据
、
预先训练的图像检测模型以及预先训练的文字识别模型；将所述图像数据分别输入所述图像检测模型以及所述文字识别模型，得到所述图像检测模型输出的所述图像数据中标识图像的位置区域以及标识图像的标识类别，并得到所述文字识别模型输出的所述图像数据中标识文本的位置区域以及标识文本的标识类别；确定所述图像数据中标识类别相同的目标标识图像与目标标识文本；将所述目标标识图像的位置区域以及所述目标标识文本的位置区域作为目标位置区域，并确定所述目标位置区域之间的目标区域距离；基于所述目标区域距离识别所述图像数据中是否存在标识信息
。2.
根据权利要求1所述的处理方法，其特征在于，所述获取图像数据包括：获取符合预设校验要求的视频流；基于第一抽取密度抽取所述视频流得到多帧初始视频图像；基于所述多帧初始视频图像之间的图像特征相似度，筛选所述多帧初始视频图像，得到多帧视频图像，并将所述多帧视频图像作为所述图像数据；其中，所述第一抽取密度小于预设密度阈值
。3.
根据权利要求2所述的处理方法，其特征在于，所述确定所述目标位置区域之间的区域距离包括：在所述多帧视频图像的预设视频图像中，确定所述目标标识图像的位置区域与所述目标标识文本的位置区域之间的区域距离，并将所述区域距离作为所述目标区域距离；所述预设视频图像为所述多帧视频图像中任一视频图像；所述基于所述目标区域距离确定所述图像数据中是否存在标识信息包括：若所述区域距离小于预设距离阈值，则确定所述图像数据中存在标识信息；若所述区域距离大于等于所述预设距离阈值，则确定所述图像数据中不存在标识信息
。4.
根据权利要求1所述的处理方法，其特征在于，所述获取图像数据包括：获取符合预设校验要求的视频流；基于第二抽取密度抽取所述视频流得到多帧视频图像，并将所述多帧视频图像作为所述图像数据；其中，所述第二抽取密度大于预设密度阈值
。5.
根据权利要求1所述的处理方法，其特征在于，若所述图像数据中存在标识信息，所述方法还包括：基于所述目标区域距离，将所述目标标识图像的位置区域合并为文本去除区域，并将所述目标标识文本的位置区域合并为图像去除区域；根据所述文本去除区域以及所述图像去除区域去除所述图像数据中的标识信息
。6.
根据权利要求5所述的处理方法，其特征在于，所述图像数据包括：从视频流抽取的多帧视频图像；所述确定所述目标位置区域之间的目标区域距离包括：在所述多帧视频图像的预设视频图像中，确定所述目标标识图像的位置区域之间的第一区域重合度，以及所述目标标识文本的位置区域之间的第二区域重合度，并将所述第一区域重合度以及所述第二区域重合度作为所述目标区域距离，所述预设视频图像为所述多
帧视频图像中任一视频图像；所述基于所述目标区域距离，将所述目标标识图像的位置区域合并为文本去除区域，并将所述目标标识文本的位置区域合并为图像去除区域包括：若所述第一区域重合度大于预设重合度阈值，则合并所述预设视频图像中所述目标标识图像的位置区域，得到所述预设视频图像对应的初始图像去除区域；在所述多帧视频图像的相邻帧视频图像中，基于区域重合度合并所述初始图像去除区域，得到所述图像去除区域；和
/
或，若所述第二区域重合度大于预设重合度阈值，则合并所述预设视频图像中所述目标标识文本的位置区域，得到所述预设视频图像对应的初始文本去除区域；在所述多帧视频图像...

【专利技术属性】
技术研发人员：寇志娟，李革委，胡鹏，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人