时序文件的分类方法和分类系统技术方案

技术编号:14117438 阅读:99 留言:0更新日期:2016-12-08 00:48
本发明专利技术公开了一种时序文件的分类方法和分类系统。根据本发明专利技术的一个方面,时序文件的分类方法包括:从多个时序文件中提取时序特征;根据所提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的状态统计结果;利用所述多个时序文件的状态统计向量构建特征矩阵;以及根据所述特征矩阵对所述多个时序文件进行分类。由此,可以利用状态统计信息对时序文件进行分类,从而确保了分类结果的可靠性,并能够简化计算复杂度,从而实现快速且准确的分类。

【技术实现步骤摘要】

本专利技术涉及计算机文件分类领域,具体涉及时序文件的分类方法和分类系统
技术介绍
随着多媒体应用的发展,以音乐文件为代表的大量的时序文件资源出现。近年来,如何有效地组织和管理时序文件,越来越受到人们的关注。以音乐文件为例,对音乐文件标注分类是有效地组织和管理时序文件的重要手段。例如,依据音乐风格(如爵士、布鲁斯、古典、乡村、摇滚等)对音乐文件进行标注,是标注分类的一个重要方面。由于音乐文件的数量很大,所以人工标注往往费时费力,并且准确率不高,容易由于人工的疏忽或者认知能力有限而出错。为了解决上述问题,在现有技术中,提出了对时序文件进行自动分类的多种方法。为了实现时序文件的正确自动分类,主要有以下两个要点。一个是如何设计并选择合适的分类器对时序文件进行分类,另一个是从原始时序文件中抽取什么样的特征以适用于分类。在现有技术中,一方面已提出了很多对于如何设计并选择合适的分类器的解决方案。但另一方面,从原始时序文件中抽取什么样的特征以适用于分类一直是研究的难点,在现有技术中还缺乏令人满意的解决办法。
技术实现思路
有鉴于此,本专利技术提出了一种时序文件的分类方法和分类系统,以利用状态统计信息对时序文件进行分类。根据本专利技术的一个方面,提供了一种时序文件的分类方法,包括:从多个时序文件中提取时序特征;根据所提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的
状态统计结果;利用所述多个时序文件的状态统计向量构建特征矩阵;以及根据所述特征矩阵对所述多个时序文件进行分类。根据本专利技术的另一方面,提供了一种时序文件的分类系统,包括:特征提取装置,从多个时序文件中提取时序特征;计算装置,根据所述特征提取装置提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的状态统计结果;矩阵构建装置,利用所述计算装置计算的所述多个时序文件的状态统计向量构建特征矩阵;以及分类器,根据所述矩阵构建装置构建的特征矩阵对所述多个时序文件进行分类。根据本专利技术所提供的技术方案,可以利用状态统计信息对时序文件进行分类,这既不会像利用所提取的所有时序特征进行计算那样复杂,又能够保证保留了足够多的统计的特征信息用于分类计算,从而确保了分类结果的可靠性,又能够简化计算复杂度,从而实现快速且准确的分类。附图说明参照附图来阅读本专利技术的各实施方式,将更容易理解本专利技术的其它特征和优点,在此描述的附图只是为了对本专利技术的实施方式进行示意性说明的目的,而非全部可能的实施,并且不旨在限制本专利技术的范围。在附图中:图1示出了根据本专利技术一个实施方式的时序文件的分类方法的流程图;图2是示出了从原始时序文件中提取时序特征的示意图;图3示出了根据本专利技术一个实施方式根据所提取的时序特征计算每个时序文件的状态统计向量的流程图;图4是示出了根据本专利技术一个实施例对N个时序文件的时序特征进行聚类的示意图;图5示出了根据本专利技术一个实施方式计算每个时序文件的状态统计向量的流程图;图6是示出了根据图4所示的时序文件的时序特征的聚类结果生成聚类状态矩阵的示意图;图7示出了从图6所示的聚类状态矩阵中选取的行组合的一例;图8示出了根据本专利技术一个实施方式在多个行组合中分别进行双滑动窗口状态统计以生成时序文件的组合状态统计矩阵的流程图;图9示出了在图7所示的行组合中设置外窗口和内窗口的一例;图10示出了根据该实施方式的组合状态统计矩阵的一例;图11示出了根据本专利技术一个实施方式利用多个时序文件的状态统计向量构建特征矩阵的流程图;图12示出了根据本专利技术一个实施方式的时序文件的分类系统的框图;图13示出了根据本专利技术一个实施方式的计算装置的框图;图14示出了根据本专利技术一个实施方式的计算单元的框图;图15示出了根据本专利技术一个实施方式的统计子单元的框图;图16示出了根据本专利技术一个实施方式的矩阵构建装置的框图;以及图17示出了可用于实施根据本专利技术实施例的方法和系统的计算机的示意性框图。具体实施方式现参照附图对本专利技术的实施方式进行详细描述。应注意,以下描述仅仅是示例性的,而并不旨在限制本专利技术。此外,在以下描述中,将采用相同的附图标号表示不同附图中的相同或相似的部件。在以下描述的不同实施方式中的不同特征,可彼此结合,以形成本专利技术范围内的其他实施方式。图1示出了根据本专利技术一个实施方式的时序文件的分类方法的流程图。如图1所示,时序文件的分类方法1000可包括步骤S1100至S1400。当需要对时序文件进行分类时,在步骤S1100中,从多个时序文件中提取时序特征。在此,可以利用本领域已知的各种方法从原始的时序文件中提取时序特征。而且,所提取的时序特征可以是MFCC(Mel频率倒谱系数,Mel Frequency Cepstrum Coefficient)特征、FFT(快速傅里叶变换,Fast Fourier Transformation)特征等任何已知的特征。在以下的描述中,以MFCC特征为例进行描述,但本申请并不限于此。可以理解,如FFT等各种已知的时序特征均适用于本申请。图2是示出了从原始时序文件中提取时序特征的示意图。如图2所示,
从原始时序文件(例如,音乐文件)中提取的特征是时序特征,在图2右侧示出的每个柱状物代表从时序文件中提取的时序特征的一帧。再回到图1,在步骤S1200中,根据所提取的时序特征计算每个时序文件的状态统计向量。状态统计向量表征了时序文件的状态统计情况,其中的元素反映了时序文件的状态统计结果。具体的计算过程以及状态统计向量的示例将在以下描述。在步骤S1300中,利用计算得到的每个时序文件的状态统计向量来构建特征矩阵。随后,在步骤S1400中,根据该特征矩阵对所述多个时序文件进行分类。可利用已知的任何适当的分类器来进行分类。在此,特征矩阵是利用时序文件的状态统计向量构建的,因此,该特征矩阵包含了各时序文件的状态统计信息。利用这些状态统计信息对时序文件进行分类,既不会像利用所提取的所有时序特征进行计算那样复杂,又能够保证保留了足够多的统计的特征信息用于分类计算,从而确保了分类结果的可靠性,又能够简化计算复杂度,从而实现快速且准确的分类。图3示出了根据本专利技术一个实施方式根据所提取的时序特征计算每个时序文件的状态统计向量的流程图。如图3所示,上述步骤S1200可包括子步骤S1210和S1220。在子步骤S1210中,将从每个时序文件中提取的时序特征进行聚类。由于时序文件的时序特征(如,MFCC特征)的帧与帧之间完全相同的可能性很小,因此为了简化分类的计算过程,本申请认为较为相似的帧属于同一个聚类,从而将时序特征中的各帧进行聚类,以便用于后续的统计计算。图4是示出了根据本专利技术一个实施例对N个时序文件的时序特征进行聚类的示意图。如图4所示,N个时序文件1至N中每个时序文件的时序特征均包括多个帧,每个帧由图4左侧的一个柱状物表示,通过对时序特征的聚类,特征的每一帧被聚类为预设的类别中的一类。具体的聚类方法可采用现有技术中任意已知的方法,如均值漂移聚类(Mean-shift Clustering)、分批Kmeans聚类(MiniBatchKmeans Clustering)等方法。在图4所示的示例中,假定预设了10个本文档来自技高网
...
时序文件的分类方法和分类系统

【技术保护点】
一种时序文件的分类方法,包括:从多个时序文件中提取时序特征;根据所提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的状态统计结果;利用所述多个时序文件的状态统计向量构建特征矩阵;以及根据所述特征矩阵对所述多个时序文件进行分类。

【技术特征摘要】
1.一种时序文件的分类方法,包括:从多个时序文件中提取时序特征;根据所提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的状态统计结果;利用所述多个时序文件的状态统计向量构建特征矩阵;以及根据所述特征矩阵对所述多个时序文件进行分类。2.如权利要求1所述的方法,其中根据所提取的时序特征计算每个时序文件的状态统计向量包括:将从每个时序文件中提取的时序特征进行聚类;以及根据每个时序文件的时序特征的聚类结果计算每个时序文件的状态统计向量。3.如权利要求2所述的方法,其中每个时序文件的状态统计向量是基于双滑动窗口统计模型计算得到的。4.如权利要求2所述的方法,其中通过以下步骤计算每个时序文件的状态统计向量:根据每个时序文件的时序特征的聚类结果生成所述时序文件的聚类状态矩阵;从所述聚类状态矩阵中选取多个行组合;在所述多个行组合中分别进行双滑动窗口状态统计,以生成所述时序文件的组合状态统计矩阵;以及将所述组合状态统计矩阵平坦化,以得到所述时序文件的状态统计向量。5.如权利要求4所述的方法,其中在所述多个行组合中分别进行双
\t滑动窗口状态统计,以生成所述时序文件的组合状态统计矩阵包括:在每个行组合中设置外窗口,并在所述外窗口中设置内窗口;在所述外窗口中滑动所述内窗口,以获取多个状态观测值;根据所述多个状...

【专利技术属性】
技术研发人员:杨铭夏迎炬孙健侯翠琴
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1