基于SURF词汇树和模板匹配的快速电视台台标识别系统及其实现方法技术方案

技术编号:10470198 阅读:122 留言:0更新日期:2014-09-24 20:57
本发明专利技术公开了一种基于SURF词汇树和模板匹配的快速电视台台标识别系统及其实现方法,主要解决了现有技术中存在的台标识别方法响应时间较长,综合性能较差,的问题。该基于SURF词汇树和模板匹配的快速电视台台标识别系统的实现方法包括以下步骤:第一级SURF词汇树索引模块提取非相似台标训练集合中的SURF特征,通过Kmeans算法将提取的SURF特征聚类成词汇树,当待匹配的图片到达时,遍历词汇树返回给第二级模板匹配索引模块待识别图片所属的电视台;第二级模板匹配索引模块根据返回的非相似台标的信息,到指定电视台目录下进行模板匹配,找到最相似的频道。通过上述方案,本发明专利技术达到了高正确率、响应时间较快的目的,具有很高的实用价值和推广价值。

【技术实现步骤摘要】
基于SURF词汇树和模板匹配的快速电视台台标识别系统 及其实现方法
本专利技术涉及一种电视台台标识别方法,具体地说,是涉及一种基于SURF词汇树和 模板匹配的快速电视台台标识别系统及其实现方法。
技术介绍
随着智能电视的日益普及,台标作为电视台和电视栏目的标志,在媒体数据挖掘 领域已经成为了一个很重要的元素,而台标识别技术则成为了近年来的研究热点之一。将 计算机视觉理论结合图像处理技术,可以很好地解决电视台台标识别问题。 在计算机视觉领域,SIFT描述符成功地应用于对象识别和3D场景重建,而SURF是 SIFT的加速版本,具有尺度不变等很好的特性。通过SURF描述符,将两幅图像的匹配问题 归结于寻找特征点间相似问题,即近邻问题。而对于大规模高维数据近邻问题,一个比较成 熟的方案就是通过树结构划分数据空间,即SURF词汇树方案。 模板匹配算法是一项非常重要的图像处理技术,它能够在一幅图像中寻找与另一 幅模板图像最匹配部分的技术。因为模板匹配不具备像SURF那样的尺度不变性,一般采用 图像金字塔技术来弥补这一缺陷。 现今,衡量一个电视台台标识别方法好坏的具体指标如下: 1、正确率:给定了一个待识别的台标图片,算法返回的结果是正确的概率。 2、失败率:给定了一个待识别的台标图片,由于图像质量等原因算法无法识别的 概率。 3、错误率:给定了一个待识别的台标图片,算法返回的结果是错误的概率。 4、响应时间:给定一个待识别的台标图片,算法的响应时间,即匹配时间;还包括 算法准备的时间,即训练时间。 5、可扩展性:当在大数据量高并发的情况下,采用的方案能否扩展到分布式方案 来适应需求的变化。 以上五点,其中前三点是核心技术指标,第四点是保证了用户体验和整体效能,第 五点则关注方案将来的可扩展性。 目前的台标识别方法都在以上五个方面做了自己的折衷:SURF词汇树算法能够 在很短的时间对非相似台标做很高正确率、低错误率的识别,但是存在训练时间过长,并且 对相似台标存在高错误率的情况。模板匹配算法能够对相似台标做出很高正确率的识别, 但是存在计算量过大,识别的时间过长的问题。
技术实现思路
本专利技术的目的在于提供一种基于SURF词汇树和模板匹配的快速电视台台标识别 系统及其实现方法,主要解决现有技术中存在的台标识别方法响应时间较长,综合性能较 差,不能满足实际需求的问题。 为了实现上述目的,本专利技术采用的技术方案如下: 基于SURF词汇树和模板匹配的快速电视台台标识别系统,包括: 预处理模块:对终端采集的台标图片进行预处理,训练阶段对待训练图片进行预处理; 匹配阶段将待识别的图片进行预处理后发送给第一级SURF词汇树索引模块; 第一级SURF词汇树索引模块:负责各个电视台信息的索引;训练阶段,提取训练图片 的SURF特征点,利用Kmeans算法将提取的SURF特征点聚类成词汇树;匹配阶段,当有待识 别的图片到达时,在所训练的SURF词汇树上找到图片所对应的电视台信息,之后将待识别 图片及查找出的所属电视台信息发送至第二级模板匹配索引模块; 第二级模板匹配索引模块:负责具体的电视台下的各个频道信息的索引;训练阶段, 从训练图片中提取模板匹配所需要的模板,以电视台为单位按照目录的形式加载到内存; 匹配阶段,在接收到待识别的图片和图片所属的电视台信息时,到具体的电视台目录下进 行模板匹配,找到图片所属的电视台的具体频道,将结果返回给用户。 基于上述系统,本专利技术公开了一种基于SURF词汇树和模板匹配的快速电视台台 标识别系统的实现方法,包括以下步骤: 根据SURF词汇树算法以及模板匹配算法的特性,将电视台台标分为两类:非相似台 标和相似台标,其中,非相似台标为不同电视台下的频道;相似台标为同一电视台的多个频 道; (1) 第一级SURF词汇树索引模块提取非相似台标训练集合中的SURF特征,通过Kmeans 算法将提取的SURF特征聚类成词汇树,当待匹配的图片到达时,遍历词汇树返回给第二级 模板匹配索引模块待识别图片所属的电视台; (2) 第二级模板匹配索引模块根据返回的非相似台标的信息,到指定电视台目录下进 行模板匹配,找到最相似的频道。 进一步地,所述步骤(2)具体包括以下步骤: (2a)从输入的图像的左上角(0,0)开始,切割一块(0,0)到(x,y)的临时图像; (2b)用临时图像和模板图像进行对比,度量函数为h,对比的结果为c ; (2c)记录结果c,即图像(0,0)的匹配结果; (2d)切割输入图像从(0,1)到(x+1,y+Ι)的临时图像,返回步骤(2b),直至完成整个 图像的计算。 具体地说,所述第一级SURF词汇树索引模块的训练方法如下: (la) 将训练集中每张图片与其所属电视台台标标识的ID进行关联; (lb) 提取每张图片的SURF特征,得到一个特征集合F={fi}以及相应的图片ID集合 imgID={idi},它表示提取到的第i个特征出现在ID为idi的图片中; (lc) 对特征集合F进行分层聚类,采用Kmeans算法聚类成词汇树。 本专利技术中,所述分层聚类算法的具体实现步骤如下: (lcl)初始时,在树的第1层对特征集合F进行Kmeans聚类,把特征集合F分成K份 {Fi | i〈=i〈=k}; (lc2)计算出每个簇集的中心向量Ci ; (lc3)利用Kmeans聚类将每个簇集分成K个簇集,不断重复上述操作直到树的深度达 到预先设定的值,若树中某个簇集内的向量小于k,则这个节点就不再分裂。 所述步骤(1)中,若第一级SURF词汇树索引模块未在所训练的SURF词汇树上找 到所对应的台标的电视台信息,则直接返回终端匹配失败;若第二级模板匹配索引模块找 到最相似频道的相似度低于预设值,则返回终端匹配失败。 与现有技术相比,本专利技术具有以下有益效果: (1)通过使用本专利技术,在大数据量高并发情况下,可以很容易地扩展到分布式方案来适 应需求的变化,使得系统仍然保持着高正确率、低错误率,以及快速的响应时间,符合实际 需求。 【附图说明】 图1为本专利技术的系统框图。 【具体实施方式】 下面结合附图和实施例对本专利技术作进一步说明,本专利技术的实施方式包括但不限于 下列实施例。 实施例 如图1所示,本专利技术公开了一种在
技术介绍
五个方面都有着出色表现的基于SURF 词汇树和模板匹配的快速电视台台标识别方法,通过该方法实现的系统在大数据量高并发 情况下,可以很容易地扩展到分布式方案来适应需求的变化,使得系统仍然保持着高正确 率、低错误率,以及快速的响应时间。 在本申请中,根据SURF词汇树算法以及模板匹配算法的特性,把电视台台标分为 两类:第一类是非相似台标,即不同电视台下的频道,如AHNU、CCTV1 ;第二类是相似台标, 即同一电视台的多个频道,如CCTVUCCTV2。相应地将台标索引也分为两级索引:第一级索 引是基于SURF特征的词汇树索引,通过提取非相似台标训练集合中的SURF特征,然后通过 Kmeans算法聚类成词汇树,当待匹配的图片到达时,通过遍历词汇树返回给第二级索引待 识别图片所属的电视台,再本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410332809.html" title="基于SURF词汇树和模板匹配的快速电视台台标识别系统及其实现方法原文来自X技术">基于SURF词汇树和模板匹配的快速电视台台标识别系统及其实现方法</a>

【技术保护点】
基于SURF词汇树和模板匹配的快速电视台台标识别系统,其特征在于,包括:预处理模块:对终端采集的台标图片进行预处理,训练阶段对待训练图片进行预处理;匹配阶段将待识别的图片进行预处理后发送给第一级SURF词汇树索引模块;第一级SURF词汇树索引模块:负责各个电视台信息的索引;训练阶段,提取训练图片的SURF特征点,利用Kmeans算法将提取的SURF特征点聚类成词汇树;匹配阶段,当有待识别的图片到达时,在所训练的SURF词汇树上找到图片所对应的电视台信息,之后将待识别图片及查找出的所属电视台信息发送至第二级模板匹配索引模块;第二级模板匹配索引模块:负责具体的电视台下的各个频道信息的索引;训练阶段,从训练图片中提取模板匹配所需要的模板,以电视台为单位按照目录的形式加载到内存;匹配阶段,在接收到待识别的图片和图片所属的电视台信息时,到具体的电视台目录下进行模板匹配,找到图片所属的电视台的具体频道,将结果返回给用户。

【技术特征摘要】
1. 基于SURF词汇树和模板匹配的快速电视台台标识别系统,其特征在于,包括: 预处理模块:对终端采集的台标图片进行预处理,训练阶段对待训练图片进行预处理; 匹配阶段将待识别的图片进行预处理后发送给第一级SURF词汇树索引模块; 第一级SURF词汇树索引模块:负责各个电视台信息的索引;训练阶段,提取训练图片 的SURF特征点,利用Kmeans算法将提取的SURF特征点聚类成词汇树;匹配阶段,当有待识 别的图片到达时,在所训练的SURF词汇树上找到图片所对应的电视台信息,之后将待识别 图片及查找出的所属电视台信息发送至第二级模板匹配索引模块; 第二级模板匹配索引模块:负责具体的电视台下的各个频道信息的索引;训练阶段, 从训练图片中提取模板匹配所需要的模板,以电视台为单位按照目录的形式加载到内存; 匹配阶段,在接收到待识别的图片和图片所属的电视台信息时,到具体的电视台目录下进 行模板匹配,找到图片所属的电视台的具体频道,将结果返回给用户。2. 权利要求1所述的基于SURF词汇树和模板匹配的快速电视台台标识别系统的实现 方法,其特征在于,包括以下步骤: 根据SURF词汇树算法以及模板匹配算法的特性,将电视台台标分为两类:非相似台 标和相似台标,其中,非相似台标为不同电视台下的频道;相似台标为同一电视台的多个频 道; (1)第一级SURF词汇树索引模块提取非相似台标训练集合中的SURF特征,通过Kmeans 算法将提取的SURF特征聚类成词汇树,当待匹配的图片到达时,遍历词汇树返回给第二级 模板匹配索引模块待识别图片所属的电视台; (2)第二级模板匹配索引模块根据返回的非相似台标的信息,到指定电视台目录下进 行模板匹配,找到最相似的频道。3. 根据权利要求2所述的基于SURF词汇树和模板匹配的快速电视台台标识别系统的 实现方法,其特征在于,所述步骤(2)...

【专利技术属性】
技术研发人员:段翰聪梁尧张苗张杰李晓东孟庆康刘威
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1