当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于从混合音频记录选择性去除音频内容的系统和方法技术方案

技术编号:11975715 阅读:168 留言:0更新日期:2015-08-31 01:48
提供用于从音频记录(例如,嵌入在媒体文件中的音频记录)去除声音记录的系统和技术。系统可以包括识别组件、第一减法组件和第二减法组件。识别组件识别混合音频记录中的声音记录。第一减法组件确定声音记录的局部线性变换,并且从混合音频记录减去声音记录的局部线性变换,以生成新的混合音频记录。第二减法组件将声音记录的一个或多个片段与新的混合音频记录的一个或多个相应片段进行比较,并且至少部分地基于一个或多个相应片段与一个或多个片段的关联来减小新的混合音频记录的功率水平。

【技术实现步骤摘要】
【国外来华专利技术】用于从混合音频记录选择性去除音频内容的系统和方法相关申请的交叉引用本申请要求于2012年6月18日提交的名为“SYSTEMANDMETHODFORSELECTIVEREMOVALOFAUDIOCONTENTFROMAMIXEDAUDIORECORDING”的美国临时申请No.61/661,225和于2012年12月28日提交的名为“SYSTEMANDMETHODFORSELECTIVEREMOVALOFAUDIOCONTENTFROMAMIXEDAUDIORECORDING”的美国非临时申请No.13/730,076的益处,其每一个的全部结合于此作为参考。
本公开总体涉及音频处理,并且更具体地涉及从混合音频记录选择性地去除音频内容。
技术介绍
经常地,音频记录(例如,音频文件)包括多个声音记录。例如,音频记录可以是作为声学捕捉(例如,麦克风)或音频混合(例如,将多个声音记录混合为单个音频记录的音频过程)的结果的混合音频记录。在一个示例中,混合音频记录可以包括与所记录的歌曲交织的语音(例如,来自一些人说话的音频)。然而,在特定情形下,期望从音频记录去除一个或多个声音记录(例如,记录的歌曲)。
技术实现思路
以下提供说明书的简化概要,以提供说明书的一些方面的基本理解。本概要不是说明书的广泛概述。其既不旨在识别说明书的关键或重要元素,也不旨在描绘说明书的特定实现的任何范围或者权利要求的任何范围。其唯一目的在于以简化形式呈现说明书的一些概念,作为随后呈现的更详细说明的前奏。根据一个实现,一种系统包括识别组件、第一减法组件和第二减法组件。识别组件识别混合音频记录中的声音记录。第一减法组件确定声音记录的局部线性变换,并且从混合音频记录减去声音记录的局部线性变换,以生成新的混合音频记录。第二减法组件将声音记录的一个或多个片段与新的混合音频记录的一个或多个相应片段进行比较,并且至少部分地基于一个或多个相应片段与一个或多个片段的关联,来减小新的混合音频记录的功率水平。在一个示例中,一个或多个片段和/或一个或多个相应片段是时频片段。根据另一个实现,一种系统包括识别组件、处理组件和修改组件。识别组件识别嵌入在媒体文件中的第一音频文件中的一个或多个声音记录。处理组件实现一个或多个信号处理算法,以从第一音频文件去除一个或多个声音记录中的至少一个,以生成第二音频文件。修改组件用第二音频文件替换嵌入在媒体文件中的第一音频文件。另外,一个非限制性实现提供用于识别混合音频记录中的声音记录,确定声音记录的局部线性变换,从混合音频记录减去声音记录的局部线性变换,以生成新的混合音频记录,将声音记录的一个或多个片段与新的混合音频记录的一个或多个相应片段进行比较,并且至少部分地基于一个或多个相应片段与一个或多个片段的关联,来减小新的混合音频记录的功率水平。特别阐述的以下说明和附图示出说明书的多个方面。然而,这些方面指示可以采用说明书的原理的多种方式中的几种。当结合附图考虑时,说明书的其他优点和新特征将从说明书的以下详细说明变得显而易见。附图说明当结合附图考虑以下详细说明时,本专利技术的多个方面、实现、目标和优点将变得显而易见,其中,类似参考符号指示类似部件,并且其中:图1示出根据在此描述的多个方面和实现的示例性过滤组件的高级框图;图2示出根据在此描述的多个方面和实现的用于从音频记录去除声音记录的示例性系统;图3示出根据在此描述的多个方面和实现的用于从音频记录去除由用户选择的声音记录的示例性系统;图4示出根据在此描述的多个方面和实现的用于从音频记录去除声音记录的另一个示例性系统;图5示出根据在此描述的多个方面和实现的示例性音频记录;图6示出根据在此描述的多个方面和实现的示例性用户界面;图7示出根据在此描述的多个方面和实现的用于从音频记录去除声音记录的示例性方法的流程图;图8描述根据在此描述的多个方面和实现的用于实现信号处理以从音频记录去除声音记录的示例性方法的流程图;图9描述根据在此描述的多个方面和实现的用于从嵌入在媒体文件中的音频记录去除声音记录的示例性方法的流程图;图10描述根据在此描述的多个方面和实现的用于从嵌入在媒体文件中的音频记录去除由用户选择的声音记录的示例性方法的流程图;图11是示出适当的操作环境的示意性框图;以及图12是采样计算环境的示意性框图。具体实施方式现在参考附图描述本公开的多个方面,其中,类似参考数字被用于指代类似元件。在以下说明书中,为了解释的目的,阐述大量特定细节,以提供一个或多个方面的彻底理解。然而,将理解本公开的某些方面可以在没有这些特定细节或者具有其他方法、组件、材料等的情况下被实践。在其他实例中,众所周知的结构和设备以框图形式示出,以便于描述一个或多个方面。许多常规服务提供商允许用户将媒体内容(例如,音频和/或视频内容)上载到服务器(例如,媒体内容服务器)。然后,媒体内容可以被传送(例如,流送)至其他用户。通常,服务提供商提供用于用户的网络基础设施,但是其他非常少。从而,这些服务提供商对什么媒体内容正由用户上载和/或流送具有非常有限的控制,诸如例如受版权保护的媒体内容。当前版权保护方案将上载的媒体内容与有效和受保护内容的索引进行比较。版权持有者可以上载受版权保护的媒体内容作为参考。另外,版权持有者可以设置用于处理匹配的策略(例如,由用户上载的与受版权保护的媒体内容匹配的媒体内容)。如果进行匹配,则对照上载的媒体内容生成版权要求。例如,由用户上载到服务器(例如,媒体内容服务器)的媒体文件(例如,视频文件)可以包括受版权保护的媒体内容(例如,一个或多个受版权保护的歌曲)。从而,根据由版权持有者设置的策略,受版权保护的媒体内容可能需要从媒体文件被去除。用于从媒体文件(例如,视频文件)去除受版权保护的内容的一种常规解决方案包括:消除受版权保护的内容的声音(例如,消除受版权保护的歌曲的声音)。替选解决方案包括从服务器去除媒体文件。然而,用于从上载到服务器的媒体文件(例如,视频文件)去除受版权保护的音频内容的常规技术没有有效地从具有多个声音记录的混合音频记录(例如,嵌入在媒体文件中的音频记录)去除受版权保护的音频内容。例如,用于视频文件的声音记录可以包括某个人说话以及背景中的歌曲。然而,背景中的歌曲可能是受版权保护的内容。结果,期望在保留所记录的语音(例如,非歌曲音频内容)的同时,从视频文件去除歌曲(例如,受版权保护的内容)。为此,提供用于从混合音频记录选择性地去除音频内容的技术。例如,可以从混合音频记录(例如,声迹)去除一个或多个歌曲。在此公开的系统和方法涉及在保留混合音频记录的不同部分(例如,非受版权保护的部分、非歌曲部分等)的同时,去除混合音频记录的被识别部分。从而,可以保护混合音频记录的不同部分(例如,非受版权保护的部分)。首先参考图1,示出根据本公开的一个方面的从音频记录(例如,嵌入在媒体文件中的音频记录)选择性地去除一个或多个声音记录的示例性系统100。在一个示例中,系统100可以在托管用户上载的媒体内容的服务器上或者与其结合被实现。在本公开中解释的系统、装置或过程的多个方面可以构成在机器中具体化的机器可执行组件,例如,在与一个或多个机器相关联的一个或多个计算机可读介质中具体化。当由一个或多个机器执行时,本文档来自技高网...
用于从混合音频记录选择性去除音频内容的系统和方法

【技术保护点】
一种系统,包括:存储器,所述存储器存储计算机可执行组件;以及处理器,所述处理器被配置成执行存储在所述存储器中的以下计算机可执行组件:识别组件,所述识别组件识别混合音频记录中的声音记录;第一减法组件,所述第一减法组件确定所述声音记录的局部线性变换,并且从所述混合音频记录减去所述声音记录的所述局部线性变换,以生成新的混合音频记录;以及第二减法组件,所述第二减法组件将所述声音记录的一个或多个片段与所述新的混合音频记录的一个或多个相应片段进行比较,并且至少部分地基于所述一个或多个相应片段与所述一个或多个片段的关联来减小所述新的混合音频记录的功率水平。

【技术特征摘要】
【国外来华专利技术】2012.06.18 US 61/661,225;2012.12.28 US 13/730,0761.一种系统,包括:处理器;通信地耦合到所述处理器的存储器,所述存储器具有存储于其中的计算机可执行指令,包括:识别组件,所述识别组件被配置成从多个参考声音记录中识别与部分的混合音频记录相匹配的参考声音记录;第一减法组件,所述第一减法组件被配置成确定所述参考声音记录的局部线性变换,以将近似于所述部分的所述混合音频记录的所述参考声音记录进行变换,并且从所述部分的所述混合音频记录减去所述参考声音记录的所述局部线性变换以生成新的混合音频记录;以及第二减法组件,所述第二减法组件被配置成将所述部分的所述混合音频记录的一个或多个片段与所述新的混合音频记录的一个或多个相应片段进行比较,并且至少部分地基于所述一个或多个相应片段中的至少一个片段与所述部分的混合音频记录的所述一个或多个片段中的至少一个片段的谱相关,来减小所述新的混合音频记录中所述一个或多个相应片段中所述至少一个片段的功率水平。2.根据权利要求1所述的系统,其中,所述识别组件进一步被配置成识别所述部分的所述混合音频记录的开始时间和结束时间。3.根据权利要求1所述的系统,其中,所述一个或多个片段和所述一个或多个相应片段是基于所述参考声音记录和所述混合音频记录的各自光谱图。4.根据权利要求1所述的系统,其中,所述局部线性变换对所述参考声音记录实施矩阵运算。5.根据权利要求1所述的系统,其中,响应于确定所述一个或多个相应片段中的特定片段中的剩余声音低于预定阈值水平,通过所述第二减法组件将所述特定片段的功率水平减小到零。6.根据权利要求1所述的系统,其中,所述第二减法组件被进一步配置成将所述部分的所述混合音频记录的所述一个或多个片段的各自幅度与所述新的混合音频记录的所述一个或多个相应片段的各自的相应幅度进行比较。7.根据权利要求1所述的系统,其中,所述第二减法组件被进一步配置成使用短时傅里叶变换算法来将所述部分的所述混合音频记录的所述一个或多个片段与所述新的混合音频记录的所述一个或多个相应片段进行比较。8.根据权利要求1所述的系统,其中,所述第一减法组件被进一步配置成从多个局部线性变换中选择产生与所述部分的所述混合音频记录最接近匹配的所述局部线性变换。9.根据权利要求1所述的系统,其中,所述混合音频记录被嵌入在视频文件中。10.根据权利要求9所述的系统,其中,所述视频文件被存储在远程服务器上。11.根据权利要求1所述的系统,其中,所述第一减法组件被进一步配置成实现互相关,以使所述参考声音记录与所述部分的所述混合音频记录在时间上对准。12.根据权利要求1所述的系统,其中,所述第一减法组件被进一步配置成使用自适应过滤来确定用于所述声音记录的所述局部线性变换。13.根据权利要求6所述的系统,其中,所述第二减法组件被进一步配置成,基于所述部分的所述混合音频记录的所述一个或多个片段的各自幅度与所述新的混合音频记录的所述一个或多个相应片段的各自相应幅度的比较,从所述新的混合音频记录的至少一个对数幅度谱片段中减去所述部分的所述混合音频的至少一个对数幅度谱片段。14.根据...

【专利技术属性】
技术研发人员:克里斯托弗·拉罗萨萨姆·克瓦伦托马斯·查德威克·沃尔特斯理查德·弗朗西斯·莱恩罗伯特·史蒂文·格利克斯坦鲁沙巴·阿肖克·多希莫莉·卡斯尔·尼克斯杰森·马修·托夫
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1