本发明专利技术提供一种LOGO识别方法、系统、存储介质及电子设备,包括:构建LOGO特征数据库;构建LOGO文本数据库;获取包含LOGO的图像;截取图像中LOGO图像;在LOGO图像中进行文字识别;若识别到文字,计算识别到的文字与LOGO文本数据库中的每个LOGO文字的字错率,并当字错率小于第一预设阈值时,选择字错率最小的LOGO文字对应的LOGO名称作为图像中包含的LOGO的名称;若未识别到文字,提取LOGO图像的图像特征;计算图像特征与LOGO特征数据库中的每个LOGO特征的相似度,并当相似度大于第二预设阈值时,选择相似度最大的LOGO特征对应的LOGO名称作为图像中包含的LOGO的名称。本发明专利技术的LOGO识别方法、系统、存储介质及电子设备能够同时对图形LOGO和文字LOGO进行准确识别,有效提升了LOGO识别的召回率。LOGO识别的召回率。LOGO识别的召回率。
【技术实现步骤摘要】
LOGO识别方法、系统、存储介质及电子设备
[0001]本专利技术属于图像处理的
,特别是涉及一种LOGO识别方法、系统、存储介质及电子设备。
技术介绍
[0002]LOGO是徽标或者商标的外语缩写,起到对徽标拥有公司的识别和推广的作用,通过形象的徽标可以让消费者记住公司主体和品牌文化。网络中的徽标主要是各个网站用来与其它网站链接的图形标志,代表一个网站或网站的一个板块。
[0003]现有技术中,常用的LOGO识别方法包括以下步骤:构建LOGO特征检索库,提取图像中的LOGO的特征,将抽取的LOGO特征与LOGO特征检索库中的LOGO特征进行相似度计算,选取大于阈值的类别作为识别的LOGO类别。
[0004]然而,上述方法对图形LOGO有效,却不能准确识别文字LOGO。这是因为文字LOGO的特征大多数是相似的。由于特征没有差异性,导致误检率很高。
技术实现思路
[0005]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种LOGO识别方法、系统、存储介质及电子设备,能够同时对图形LOGO和文字LOGO进行准确识别,有效提升了LOGO识别的召回率。
[0006]第一方面,本专利技术提供一种LOGO识别方法,所述方法包括以下步骤:构建LOGO特征数据库,所述LOGO特征数据库包括LOGO名称和LOGO特征;构建LOGO文本数据库,所述LOGO文本数据库包括LOGO名称和LOGO文字;获取包含LOGO的图像;截取所述图像中LOGO图像;在所述LOGO图像中进行文字识别;若识别到文字,计算识别到的文字与所述LOGO文本数据库中的每个LOGO文字的字错率,并当所述字错率小于第一预设阈值时,选择字错率最小的LOGO文字对应的LOGO名称作为所述图像中包含的LOGO的名称;若未识别到文字,提取所述LOGO图像的图像特征;计算所述图像特征与所述LOGO特征数据库中的每个LOGO特征的相似度,并当所述相似度大于第二预设阈值时,选择相似度最大的LOGO特征对应的LOGO名称作为所述图像中包含的LOGO的名称。
[0007]在第一方面的一种实现方式中,截取所述图像中LOGO图像包括以下步骤:
[0008]基于DETR模型获取所述LOGO图像在所述图像中的坐标信息;
[0009]基于所述坐标信息从所述图像中截取所述LOGO图像。
[0010]在第一方面的一种实现方式中,在所述LOGO图像中进行文字识别包括以下步骤:
[0011]基于CRNN模型识别所述LOGO图像中的文字。
[0012]在第一方面的一种实现方式中,提取所述LOGO图像的图像特征包括以下步骤:
[0013]基于VIT模型提取所述LOGO图像的图像特征。
[0014]在第一方面的一种实现方式中,所述第一预设阈值取值为0.2。
[0015]在第一方面的一种实现方式中,所述第二预设阈值取值为0.8。
[0016]在第一方面的一种实现方式中,所述相似度采用余弦相似度。
[0017]第二方面,本专利技术提供一种LOGO识别系统,所述系统包括第一构建模块、第二构建模块、获取模块、截取模块、识别模块、文字处理模块和图像处理模块;
[0018]所述第一构建模块用于构建LOGO特征数据库,所述LOGO特征数据库包括LOGO名称和LOGO特征;
[0019]所述第二构建模块用于构建LOGO文本数据库,所述LOGO文本数据库包括LOGO名称和LOGO文字;
[0020]所述获取模块用于获取包含LOGO的图像;
[0021]所述截取模块用于截取所述图像中LOGO图像;
[0022]所述识别模块用于在所述LOGO图像中进行文字识别;
[0023]所述文字处理模块用于若识别到文字,计算识别到的文字与所述LOGO文本数据库中的每个LOGO文字的字错率,并当所述字错率小于第一预设阈值时,选择字错率最小的LOGO文字对应的LOGO名称作为所述图像中包含的LOGO的名称;
[0024]所述图像处理模块用于若未识别到文字,提取所述LOGO图像的图像特征;计算所述图像特征与所述LOGO特征数据库中的每个LOGO特征的相似度,并当所述相似度大于第二预设阈值时,选择相似度最大的LOGO特征对应的LOGO名称作为所述图像中包含的LOGO的名称。
[0025]第三方面,本专利技术提供一种电子设备,所述电子设备包括:处理器和存储器;
[0026]所述存储器用于存储计算机程序;
[0027]所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行上述的LOGO识别方法。
[0028]第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被电子设备执行时实现上述的LOGO识别方法。
[0029]如上所述,本专利技术所述的LOGO识别方法、系统、存储介质及电子设备,具有以下有益效果:
[0030]本专利技术所述的LOGO识别方法、系统、存储介质及电子设备能够兼顾图形LOGO识别和文字LOGO识别,丰富了应用场景;有效提升了LOGO识别准确度,提升了LOGO识别的召回率。
附图说明
[0031]图1显示为本专利技术的电子设备于一实施例中的场景示意图;
[0032]图2显示为本专利技术实施例所述的LOGO识别方法于一实施例中的流程图;
[0033]图3显示为本专利技术实施例所述的LOGO识别系统于一实施例中的结构示意图;
[0034]图4显示为本专利技术的电子设备于一实施例中的结构示意图。
[0035]元件标号说明
[0036]11手机
[0037]12平板电脑
[0038]13笔记本电脑
[0039]31第一构建模块
[0040]32第二构建模块
[0041]33获取模块
[0042]34截取模块
[0043]35识别模块
[0044]36文字处理模块
[0045]37图像处理模块
[0046]41处理单元
[0047]42存储器
[0048]421随机存取存储器
[0049]422高速缓存存储器
[0050]423存储系统
[0051]424程序/实用工具
[0052]4241程序模块
[0053]43总线
[0054]44输入/输出接口
[0055]45网络适配器
具体实施方式
[0056]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0057]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种LOGO识别方法,其特征在于,所述方法包括以下步骤:构建LOGO特征数据库,所述LOGO特征数据库包括LOGO名称和LOGO特征;构建LOGO文本数据库,所述LOGO文本数据库包括LOGO名称和LOGO文字;获取包含LOGO的图像;截取所述图像中LOGO图像;在所述LOGO图像中进行文字识别;若识别到文字,计算识别到的文字与所述LOGO文本数据库中的每个LOGO文字的字错率,并当所述字错率小于第一预设阈值时,选择字错率最小的LOGO文字对应的LOGO名称作为所述图像中包含的LOGO的名称;若未识别到文字,提取所述LOGO图像的图像特征;计算所述图像特征与所述LOGO特征数据库中的每个LOGO特征的相似度,并当所述相似度大于第二预设阈值时,选择相似度最大的LOGO特征对应的LOGO名称作为所述图像中包含的LOGO的名称。2.根据权利要求1所述的LOGO识别方法,其特征在于:截取所述图像中LOGO图像包括以下步骤:基于DETR模型获取所述LOGO图像在所述图像中的坐标信息;基于所述坐标信息从所述图像中截取所述LOGO图像。3.根据权利要求1所述的LOGO识别方法,其特征在于:在所述LOGO图像中进行文字识别包括以下步骤:基于CRNN模型识别所述LOGO图像中的文字。4.根据权利要求1所述的LOGO识别方法,其特征在于:提取所述LOGO图像的图像特征包括以下步骤:基于VIT模型提取所述LOGO图像的图像特征。5.根据权利要求1所述的LOGO识别方法,其特征在于:所述第一预设阈值取值为0.2。6.根据权利要求1所述的LOGO识别方法,其特征在于:所述第二预设阈值取值为...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:上海蜜度信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。