获取多媒体文件的方法、装置及计算机可读存储介质制造方法及图纸

技术编号:16605648 阅读:29 留言:0更新日期:2017-11-22 15:29
本发明专利技术公开了一种获取多媒体文件的方法、装置及计算机可读存储介质,属于网络通信技术领域。方法包括:提取采集的语音信号的参考音符序列,该参考音符序列包括多个音符;对于多媒体文件库中的任一多媒体文件,当该任一多媒体文件的音符序列具有重复结构时,获取该任一多媒体文件的基准音符子序列,该基准音符子序列包括至少一个音符且该基准音符子序列包括的音符的数目小于该任一多媒体文件包括的音符的数目;根据该参考音符序列和该任一多媒体文件的基准音符子序列,确定该语音信号与该任一多媒体文件之间的匹配度;根据该语音信号与该任一多媒体文件之间的匹配度,从多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。本发明专利技术提供了效率。

Method, device and computer readable storage medium for acquiring multimedia files

The invention discloses a method, a device and a computer readable storage medium for acquiring multimedia files, belonging to the field of network communication technology. Methods include: reference note sequences extracted from speech signal, the reference note sequence includes a plurality of notes; for any multimedia multimedia file in the database, when the sequence of notes any of the multimedia files with repetitive structure, obtain the reference tone any of the multimedia file symbol sequence, the reference sequence of notes including the number of at least one note and the note reference sequence including the note number is less than any of the multimedia files including notes; according to the reference sequence and note any of the multimedia file reference note sequence, determine the matching degree between the speech signal and any of the multimedia files; according to the matching degree between the speech any signal with the multimedia file, get the matching degree of multimedia files meet the target preset conditions from the multimedia documents in the library. The present invention provides efficiency.

【技术实现步骤摘要】
获取多媒体文件的方法、装置及计算机可读存储介质
本专利技术涉及网络通信
,特别涉及一种获取多媒体文件的方法、装置及计算机可读存储介质。
技术介绍
目前,大部分终端都支持音乐软件,并且大部分音乐软件都具有听歌识曲的功能;在用户不知道歌名时,用户可以对着终端哼出想要搜索的歌曲的旋律,终端通过听歌识曲的功能,从多媒体服务器中搜索出该旋律对应的歌曲。终端从多媒体服务器中搜索该旋律对应的歌曲时,终端采集用户输入的语音信号,向多媒体服务器发送该语音信号;多媒体服务器接收该语音信号,提取该语音信号的音高序列,计算该音高序列与歌曲库中每个歌曲的音高序列之间的匹配度,根据该音高序列与每个歌曲的音高序列之间的匹配度,从歌曲库中选择匹配度最高的歌曲,向终端发送该选择的歌曲。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:由于一首歌曲的时长一般在4分钟左右,因此一首歌曲的音高序列包括一百多个音高,多媒体服务器计算该语音信号的音高序列与歌曲库中的每个歌曲的音高序列之间的匹配度比较耗时,从而导致终端获取歌曲的效率低。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种获取多媒体文件的方法、装置及计算机可读存储介质。技术方案如下:一方面,本专利技术提供了一种获取多媒体文件的方法,所述方法包括:提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;对于多媒体文件库中的任一多媒体文件,当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。在一种可能的实现方式中,所述获取所述任一多媒体文件的基准音符子序列之前,所述方法还包括:将所述任一多媒体文件的音符序列划分为多个音符子序列,每个音符子序列包括至少一个音符;基于预设重复度算法,确定所述每个音符子序列之间的重复度;如果所述每个音符子序列之间的重复度大于预设重复度,确定所述任一多媒体文件的音符序列具有重复结构。在一种可能的实现方式中,所述基于预设重复度算法,确定所述每个音符子序列之间的重复度,包括:基于相似矩阵算法,确定所述每个音符子序列之间的至少一个相似矩阵,根据每个相似矩阵,确定所述每个相似矩阵的特征值,根据所述每个相似矩阵的特征值,确定所述每个音符子序列之间的重复度;或者,基于互相关算法,确定所述每个音符子序列之间的至少一个互相关度,根据每个互相关度,确定所述每个音符子序列之间的重复度;或者,基于编辑距离算法,确定所述每个音符子序列之间的至少一个编辑距离,根每个编辑距离,确定所述每个音符子序列之间的重复度;或者,基于EMD距离算法,确定所述每个音符子序列之间的至少一个EMD距离,根据每个EMD距离,确定所述每个音符子序列之间的重复度。在一种可能的实现方式中,所述获取所述任一多媒体文件的基准音符子序列,包括:从所述多个音符子序列中随机选择一个音符子序列作为所述任一多媒体文件的基准音符子序列;或者,从所述多个音符子序列中选择一个包括音符数最多的音符子序列作为所述任一多媒体文件的基准音符子序列;或者,从所述多个音符子序列中选择一个包括音符数最少的音符子序列作为所述任一多媒体文件的基准音符子序列。在一种可能的实现方式中,相邻两个音符子序列之间的交集包括预设数目个音符,所述预设数目为大于或者等于0,且小于指定数值的整数,所述指定数值为所述任一多媒体文件包括音符的数目与划分的音符子序列的数目之商。在一种可能的实现方式中,所述音符包括音高和/或音长,所述音高为所述音符的绝对音高或者相邻两个音符之间的相对音高。另一方面,本专利技术提供了一种获取多媒体文件的装置,所述装置包括:提取模块,用于提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;第一获取模块,用于对于多媒体文件库中的任一多媒体文件,当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;确定模块,用于根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;第二获取模块,用于根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。在一种可能的实现方式中,所述装置还包括:划分模块,用于将所述任一多媒体文件的音符序列划分为多个音符子序列,每个音符子序列包括至少一个音符;所述确定模块,还用于基于预设重复度算法,确定所述每个音符子序列之间的重复度;所述确定模块,还用于如果所述每个音符子序列之间的重复度大于预设重复度,确定所述任一多媒体文件的音符序列具有重复结构。在一种可能的实现方式中,所述确定模块,还用于基于相似矩阵算法,确定所述每个音符子序列之间的至少一个相似矩阵,根据每个相似矩阵,确定所述每个相似矩阵的特征值,根据所述每个相似矩阵的特征值,确定所述每个音符子序列之间的重复度;或者,所述确定模块,还用于基于互相关算法,确定所述每个音符子序列之间的至少一个互相关度,根据每个互相关度,确定所述每个音符子序列之间的重复度;或者,所述确定模块,还用于基于编辑距离算法,确定所述每个音符子序列之间的至少一个编辑距离,根每个编辑距离,确定所述每个音符子序列之间的重复度;或者,所述确定模块,还用于基于EMD距离算法,确定所述每个音符子序列之间的至少一个EMD距离,根据每个EMD距离,确定所述每个音符子序列之间的重复度。在一种可能的实现方式中,所述第一获取模块,还用于从所述多个音符子序列中随机选择一个音符子序列作为所述任一多媒体文件的基准音符子序列;或者,所述第一获取模块,还用于从所述多个音符子序列中选择一个包括音符数最多的音符子序列作为所述任一多媒体文件的基准音符子序列;或者,所述第一获取模块,还用于从所述多个音符子序列中选择一个包括音符数最少的音符子序列作为所述任一多媒体文件的基准音符子序列。在一种可能的实现方式中,相邻两个音符子序列之间的交集包括预设数目个音符,所述预设数目为大于或者等于0,且小于指定数值的整数,所述指定数值为所述任一多媒体文件包括音符的数目与划分的音符子序列的数目之商。在一种可能的实现方式中,所述音符包括音高和/或音长,所述音高为所述音符的绝对音高或者相邻两个音符之间的相对音高。另一方面,本专利技术提供了一种获取多媒体文件的装置,所述装置包括:处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现第一方面任一项所述的方法。另一方面,本专利技术提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现第一方面任一项所述的方法。本专利技术实施例提供的技术方案带来的有益效果是:对于音符序列具有重复结构的多媒体文件,获取该多媒体文件的本文档来自技高网...
获取多媒体文件的方法、装置及计算机可读存储介质

【技术保护点】
一种获取多媒体文件的方法,其特征在于,所述方法包括:提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;对于多媒体文件库中的任一多媒体文件,当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。

【技术特征摘要】
1.一种获取多媒体文件的方法,其特征在于,所述方法包括:提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;对于多媒体文件库中的任一多媒体文件,当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。2.根据权利要求1所述的方法,其特征在于,所述获取所述任一多媒体文件的基准音符子序列之前,所述方法还包括:将所述任一多媒体文件的音符序列划分为多个音符子序列,每个音符子序列包括至少一个音符;基于预设重复度算法,确定所述每个音符子序列之间的重复度;如果所述每个音符子序列之间的重复度大于预设重复度,确定所述任一多媒体文件的音符序列具有重复结构。3.根据权利要求2所述的方法,其特征在于,所述基于预设重复度算法,确定所述每个音符子序列之间的重复度,包括:基于相似矩阵算法,确定所述每个音符子序列之间的至少一个相似矩阵,根据每个相似矩阵,确定所述每个相似矩阵的特征值,根据所述每个相似矩阵的特征值,确定所述每个音符子序列之间的重复度;或者,基于互相关算法,确定所述每个音符子序列之间的至少一个互相关度,根据每个互相关度,确定所述每个音符子序列之间的重复度;或者,基于编辑距离算法,确定所述每个音符子序列之间的至少一个编辑距离,根每个编辑距离,确定所述每个音符子序列之间的重复度;或者,基于EMD距离算法,确定所述每个音符子序列之间的至少一个EMD距离,根据每个EMD距离,确定所述每个音符子序列之间的重复度。4.根据权利要求2所述的方法,其特征在于,所述获取所述任一多媒体文件的基准音符子序列,包括:从所述多个音符子序列中随机选择一个音符子序列作为所述任一多媒体文件的基准音符子序列;或者,从所述多个音符子序列中选择一个包括音符数最多的音符子序列作为所述任一多媒体文件的基准音符子序列;或者,从所述多个音符子序列中选择一个包括音符数最少的音符子序列作为所述任一多媒体文件的基准音符子序列。5.根据权利要求2任一所述的方法,其特征在于,相邻两个音符子序列之间的交集包括预设数目个音符,所述预设数目为大于或者等于0,且小于指定数值的整数,所述指定数值为所述任一多媒体文件包括音符的数目与划分的音符子序列的数目之商。6.根据权利要求1-5任一所述的方法,其特征在于,所述音符包括音高和/或音长,所述音高为所述音符的绝对音高或者相邻两个音符之间的相对音高。7.一种获取多媒体文件的装置,其特征在于,所述装置包括:提取模块,用于提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;第一获取模块,用于对于多媒体文件库中的任一多媒体文件,当所述任一多媒体文件的音符序列具有重复结构...

【专利技术属性】
技术研发人员:张超钢黄美红陈文锋
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1