【技术实现步骤摘要】
多媒体文件的试播方法及装置
本专利技术涉及网络
,特别涉及一种多媒体文件的试播方法及装置。
技术介绍
随着网络技术的发展,人们可以应用网络实现多种基于多媒体文件的娱乐活动,如上网听歌、上网看视频等等。然而,随着网络信息量越来越大,面对海量信息,用户很难高效率的获取到自己感兴趣的多媒体文件。为了提高效率,现有的网站一般会从多媒体文件中截取开头部分或是高潮部分作为试播文件,并将试播文件提供给用户,当用户对网站进行浏览时,可以通过观看多媒体文件的试播文件,判断自己是否对该多媒体文件感兴趣,如果感兴趣,可以通过下载等方式获取该多媒体文件。然而,由于试播文件仅是网站对多媒体文件开头部分或高潮部分的截取得到的,因此,其对多媒体文件整体的表征性较差,除非用户进行整体下载,才能够对多媒体文件的其他部分有所了解,因此,不能够真实体现多媒体文件的特征,因此,亟需一种多媒体文件的试播方法,以提高获取多媒体文件过程中的命中率,从而提高多媒体文件的获取效率。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种多媒体文件的试播方法及装置。所述技术方案如下:一方面,本专利技术实施例提供了一种多媒体文件的试播方法,所述方法包括:接收试播请求,所述试播请求携带待试播的多媒体文件标识;根据所述多媒体文件标识,获取多媒体文件;根据所述多媒体文件的结构信息,为用户提供所述多媒体文件的多个试播时间点;以用户所选择的试播时间点为播放起点,播放所述多媒体文件。另一方面,本专利技术实施例提供了一种多媒体文件的试播装置,所述装置包括:接收模块,用于接收试播请求,所述试播请求携带待试播的多媒 ...
【技术保护点】
一种多媒体文件的试播方法,其特征在于,所述方法包括:接收试播请求,所述试播请求携带待试播的多媒体文件标识;根据所述多媒体文件标识,获取多媒体文件;根据所述多媒体文件的结构信息,为用户提供所述多媒体文件的多个试播时间点;以用户所选择的试播时间点为播放起点,为所述用户播放所述多媒体文件。
【技术特征摘要】
1.一种多媒体文件的试播方法,其特征在于,所述方法包括:对多媒体文件进行人声和伴奏分离处理,得到所述多媒体文件的人声音频和伴奏音频;基于所述多媒体文件的人声音频,得到所述多媒体文件的人声起始位置和人声结束位置;基于所述多媒体文件的伴奏音频,得到所述多媒体文件的副歌起始位置和副歌结束位置;接收试播请求,所述试播请求携带待试播的多媒体文件标识;根据所述多媒体文件标识,获取所述多媒体文件;根据所述多媒体文件的结构信息,为用户提供所述多媒体文件的多个试播时间点,所述多媒体文件的结构信息包括所述人声起始位置、所述副歌起始位置、所述副歌结束位置和所述人声结束位置;以用户所选择的试播时间点为播放起点,为所述用户播放所述多媒体文件。2.根据权利要求1所述的方法,其特征在于,根据所述多媒体文件的结构信息,为用户提供所述多媒体文件的多个试播时间点包括:根据所述多媒体文件的结构信息以及所述多媒体文件的进度条总长度,确定所述结构信息中不同信息所对应的进度条位置;根据所述结构信息中不同信息所对应的进度条位置,在所述多媒体文件的进度条上显示所述结构信息中不同信息对应的试播时间点。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:当检测到通过外设设备对所述多个试播时间点中任一个试播时间点的选择操作时,获取被选择的试播时间点;或,当检测到用户对指定按键或指定按键组合的点击操作,获取指定按键或指定按键组合对应的试播时间点;或,当检测到指定摇晃操作时,获取所述指定摇晃操作对应的试播时间点;或,当检测到指定触屏操作时,获取所述指定触屏操作对应的试播时间点;或,当接收到指定音频指令时,获取所述指定音频指令对应的试播时间点;或,当接收到指定传感器的指定传感信号时,获取所述定传感信号对应的试播时间点。4.根据权利要求1所述的方法,其特征在于,基于所述多媒体文件的人声音频,得到所述多媒体文件的人声起始位置和人声结束位置包括:对所述人声音频进行时间分帧处理,形成多个音频帧;基于所述多个音频帧,获取每一帧音频帧的频谱;基于所述每一帧音频帧的频谱和第一分块时长,获取第一数目的样本;基于第二分块时长和所述第一数目的样本,获取所述人声音频中的人声起始位置和人声结束位置。5.根据权利要求4所述的方法,其特征在于,基于所述每一帧音频帧的频谱和第一分块时长,获取第一数目的样本包括:以第一分块时长对所述多个音频帧进行分块,计算分块后的频谱统计特征,得到第二数目的频谱统计特征;对所述第二数目的频谱统计特征进行人声和伴奏分类;根据当前分类所确定的人声所在分块,从分块所得到的多个音频块中提取与所述人声所在分块对应的第一数目的样本。6.根据权利要求4所述的方法,其特征在于,基于第二分块时长和所述第一数目的样本,获取所述人声音频中的人声起始位置和人声结束位置包括:以第二分块时长对所述第一数目的样本进行分块,计算分块后的频谱统计特征,得到第三数目的频谱统计特征;对所述第三数目的频谱统计特征进行人声和伴奏分类;根据当前分类所确定的人声所在分块,确定人声起始位置和人声结束位置。7.根据权利要求1所述的方法,其特征在于,基于所述伴奏音频,得到所述多媒体文件的副歌起始位置和副歌结束位置包括:将所述伴奏音频分解成第四数目的频段,将每个频段对应于所述第四数目的音符中的一个音符,得到频段和音符之间的对应关系;对所述伴奏音频进行时间分帧处理,形成多个音频帧;基于所述多个音频帧,获取每一帧音频帧的频谱;根据所述每一帧音频帧的频谱、所述频段和音符之间的对应关系以及音符和色度之间的映射关系,获取所述每一帧音频帧所对应的色度向量;基于所述每一帧音频帧所对应的色度向量,获取所述多媒体文件的副歌起始位置和副歌结束位置。8.根据权利要求7所述的方法,其特征在于,基于所述每一帧音频帧所对应的色度向量,获取所述多媒体文件的副歌起始位置和副歌结束位置包括:对所述每一帧音频帧所对应的色度向量进行幅度归一化,得到所述每一帧音频帧的归一化向量;基于所述每一帧音频帧的归一化向量,获取所述每一帧音频帧的相似矩阵;将所述每一帧音频帧的相似矩阵中与主对角线重复...
【专利技术属性】
技术研发人员:张超钢,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。