音频信号中重复素材的自动识别制造技术

技术编号:3044715 阅读:269 留言:0更新日期:2012-04-11 18:40
描述了一种在没有重复音频素材(62)的特性的先验知识的情况下对至少一个媒体流内的所述重复素材进行识别的系统和方法。该系统和方法能够根据一个或多个媒体流来创建筛选数据库(68)。从所述媒体流中获取未知的样本音频(62),并将其与筛选数据库(68)比较,以便通过确定所述未知样本是否与筛选数据库(68)中的任何样本匹配来找出在媒体流内是否有匹配片段(66)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及媒体文件中的模式识别和辨别,更为具体地,本专利技术涉及 对一个或多个媒体流上的媒体信号、尤其是音频信号中的重复素材的识 别。
技术介绍
音乐或视频内容的版权所有者,通常针对每一次播放他们的歌曲或视 频的情况会被给予补偿。尤其是对于音乐版权所有者,确定上千个广播电 台中的任何一个上通过空中、而现在是在互联网上何时播放他们的歌曲是 一件令人生畏的任务。传统上,版权所有者将在这种情况下的版税收取移 交给第三方公司,由笫三方公司向为商业目的而播放音乐的实体收取订购 费,以补偿其目录上的版权所有者。这些费用随后基于统计模型分发给版 权所有者,该统计模型是为补偿那些版权所有者而依照哪些歌曲播放最多 而设计的。这些统计模型仅仅是对基于小的采样大小的实际播放实例的非 常粗略的估计。2006年1月4日授权的美国专利No. 6, 990, 453描述了一种用于将来 自媒体流、如广播电台信号的未知媒体样本与诸如歌曲数据库的已知媒体 文件进行比较的系统和方法,以便跟踪已知歌曲的播放情况。遗憾的是, 由于多种原因,媒体流的许多内容事先并不知道。例如,诸如脱口秀、唱 片节目即DJ的介绍或对话以及其它类似的音频的独特音频代表不可被识 别的独特音频。然而,可能有其它未被识别的音频,用来监视音频流的系统可对其感兴趣,并且实际上其可与应被补偿的版权所有者相关联。这种所感兴趣的 未被识别的音频可以是先前没有索引的歌曲或可使用版权音乐的商业广 告或其它已识别的和重复的音频段。这些未被识别的音频段可以在单个媒 体流内重复,或者在多个^^体流上重复,所述多个i^体流如在多个广播电 台上播放的区域商业广告。需要一种用于对一个或多个以其它方式未被识别的媒体流中的重复 段或样本进行识别的系统和方法,其中,该系统和方法能够将样本与先前 被采指紋的或索引的样本进行匹配,以发现重复的未被识别的媒体的发 生。
技术实现思路
因此,本申请描述了一种在没有重复素材的特性的先验知识的情况下对至少一个媒体流内重复的音频素材进行识别的方法。所述方法包括根 据一个或多个媒体流创建筛选数据库(screening database),从媒体流 中取得未知样本音频片段,在媒体流内寻找匹配片段,并确定所述未知样 本是否与筛选数据库中的M样本匹配。在另 一实施例中,描述了 一种用于对未被识别的^^体内容的至少一个 源中的未被识别的媒体内容的重复段进行识别的系统。该系统包括候选者 管理器,该候选者管理器接收未被识别的^^,并且将标识符与该未被识别的媒M;M目关联。该系统还包括指紋生成器,该指紋生成器可IMt 用于为未被识别的媒^IS:创建指紋;以及媒体搜索引擎,该媒体搜索引擎 连接到候选者管理器和指紋生成器,能够将未被识别^t体的指紋与先前存 储的未被识别的媒体指紋数据库进行比较,以便寻找未被识别媒体内容内 的重复段。前面相当宽泛地概述了本专利技术的特征和技术优点,以4更更易于理解对 本专利技术的后续详细描述。本专利技术的另外的特征和优点将在下文中描述,其 构成本专利技术的权利要求的主题。本领域的普通技术人员应理解,所揭示的 概念和特定实施例可以容易地用作修改或设计用于执行本专利技术的相同目 的的其它结构的基础。本领域的普通技术人员还应认识到,这种等同结构 不背离如所附权利要求中所阐述的本专利技术的精神和范围。根据结合附图的 以下描述,将更易于理解被相信是本专利技术特性的有关其识别和操作方法的 新颖性特征以及进一步的目的和优点。然而,应清楚地理解,提供的每个图仅用于说明和描述的目的,而并非作为对本专利技术的限制的定义。附图说明为了更完整的理解本专利技术及其优点,参考以下结合附图的描述,在附图中图1是创建未被识别的音频流中感兴趣的项目的数据库的系统实施 例的才匡图2是用于创建NRA的匹配重复段的方法实施例的流程图3是用于实施这里所描述的采指紋和定界标系统的计算机系统实 施例的框图4是用于构建声音文件的数据库索引的方法实施例的流程图5示意性图示了为声音样本如NRA段所计算的界标和指紋;以及图6是用于将NRA样本或段与先前被釆指紋的或索引的NRA样本或段 进行匹配的方法实施例的流程图。具体实施例方式现在通常的做法是使用自动化的方法来识别包含在音频信号内的预 录制的素材,所述音频信号如无线电或电视广播的记录、或在诸如夜总会 等的公共场所内的表演素材的记录。不管所使用的技术如何,这些方法需 要预先访问待识别的素材,以便可将信号与参考数据库中的已知内容匹 配。对于大多数素材,这不是个问题,因为该素材可能已经被商用了一段 时间,如音乐CD的情况。但是,也有相当百分比的音频信号是由可能不 易得到的素材构成的,例如,如在商业发行日之前的音乐、广告素材、或 为广播电台识别的目的而写的音乐。对于在对音频信号内容进行精确量化中所涉及的那些,这带来了两个 问题(1)应被识别的素材未被识别,因为该素材未被包含在参考数据库中, 以及(2 )当不包含所兴趣的素材时,信号的基本部分不能通过手动检查来 去除,因为自动化方法不明确地将其识别为不感兴趣的音频可以例如4吏用Wang的技术(序列号为60/563, 372的美国临时专 利申请,其4^P内^t过引用结合于此)直接被识别和分段,其中,从数 据库中被识别的音频被分段成已知的区域,剩余的区域留下作为未被识别 的音频(NRA)。 Wang的方法限于识别已经在数据库中的内容,而不能对 未包含在数据库中的素材进行识别和分段。为克服该限制,使用一种筛分(sifting)方法来检查来自故j&测 的媒体流的未被识别的音频段(NRA ),并检验其是否与最近的其它段或段 的部分匹配。 一旦发现这样的匹配,其将被分段并被包括于参考数据库中, 从而允许创建数据库,而不用事先访问感兴趣的目标素材。图1示出了创建NRA流中感兴趣项目的数据库的系统。系统10从未 被识别的音频源11中获取NRA流12,并识别可能感兴趣的NRA内的重复 段。NRA段12^LiL送到候选者管理器13,该候选者管理器收集媒体流中 数据的每个实例并用唯一的标识符来标记。候选者管理器13随后发送NRA 到指紋生成器14,在指紋生成器中,对来自NRA的原始音频段进行处理, 以提取指紋特征,并被索引到可搜索的数据库中。音频搜索引擎16响应 来自候选者管理器14的音频搜索请求,并使用来自指紋生成器14的NRA 指紋15将NRA段与先前被索引的NRA段的数据库进行比较。音频搜索引 擎16记录NRA段与索引的NRA段的匹配。当NRA的特定段积累了一定阈 值数量的匹配时,这意味着该系统IO在一个或多个音频流上多次看见了 相同的音频内容,该音频段被确定为感兴趣的,足以保证明确的识别。这 通过公布其重要内容、所公布的指紋18,并将其添加到其它已识别的搜 索引擎19来实现。在所监测的音频流中那些具有多次匹配的重要的NRA段可需要^Jl 送,以便被明确地识别和分类。识别所述重要的NRA段可需要将其发送给 人类操作员,该操作员将收听该音频以作出明确的识别。该人类操作员将 识别该音频,并输入必要的信息,以使该重要的NRA段被添加到已知的音 频内^lt据库,如通过引用结合于此的其它申请中所描述的。参考图2来描述一种用于识别重复素材的方法。方法20从一个或多本文档来自技高网
...

【技术保护点】
一种在没有重复音频素材的特性的先验知识的情况下对至少一个媒体流内的所述的重复素材进行识别的方法,其包括:    根据所述至少一个媒体流来创建筛选数据库;    从所述媒体流中获取未知样本音频片段;    在所述媒体流中寻找匹配片段;以及    确定所述的未知样本是否与所述筛选数据库中的任何样本匹配。

【技术特征摘要】
【国外来华专利技术】US 2005-2-8 60/651,0101.一种在没有重复音频素材的特性的先验知识的情况下对至少一个媒体流内的所述的重复素材进行识别的方法,其包括根据所述至少一个媒体流来创建筛选数据库;从所述媒体流中获取未知样本音频片段;在所述媒体流中寻找匹配片段;以及确定所述的未知样本是否与所述筛选数据库中的任何样本匹配。2. 如权利要求l所述的方法,其还包括 映射所述匹配片段到候选者组中;以及对所述候选者组进行评估,以便寻找适合于公布的最佳范本,由此最 佳范本匹配并行链可构成所识别的重复素材。3. 如权利要求1所述的方法,其中所述未知样本通过时间来划分界限;4. 如权利要求l所述的方法,其中所述未知样本通过已被识别的素 材的段来划分界限。5. 如权利要求2所述的方法,其中评估所述候选者组是基于对所述 候选者组中的所有其它样本的最佳相互匹配。6. 如权利要求l所述的方法,其还包括通过对不再通过用于包含 的准则的参考素材进行识别来周期性地修剪参考数据库。7. 如权利要求2所述的方法,其中映射所述匹配片段还包括基于 每个链内的相邻样本片段的匹配的连续性,比较相邻样本片段的并行链。8. 如权利要求7所述的方法,其中比较并行链包括选择时间上相邻的未知探测样本片段的第 一链,每个探测样本片M 对应媒体流内具有时间偏移;针对所述笫 一链中的每个探测样本片段,从所述筛选数据库中寻找一 组匹配片段,每个匹配样本在对应^^体流内具有时间偏移;以及按照对应媒体流内的所述匹配样本片段的时间相邻性,将与所述探测 样本片段并行的匹配样本片段分组成链,由此形成并行链。9. 如权利要求8所述的方法,其中对所述匹配样本片段分组还包括: 针对每个探测样本以及每个匹配样本,确定所述探测样本和所述匹配样本之间的相对时间偏移;生成相对时间偏移的直方图;以及针对所W目对时间偏移的直方图中的每个峰,从与所述直方图的峰中 的每个点相关联的匹配样本中形成相邻匹配样...

【专利技术属性】
技术研发人员:大卫L德布斯克达伦P布里格斯迈克尔卡利纳理查德温昌唐A礼俊王
申请(专利权)人:兰德马克数字服务有限责任公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1