The invention discloses a method and a device for constructing a music score library, which belongs to the technical field of network communication. The method includes: crawling music, as well as from the target site, the climbing multimedia file corresponding to the score from the target site identification; according to the multimedia file identification, access the multimedia file; according to the music and the multimedia file, verify the music and the multimedia file whether the match; if the music and the multimedia file, and add the corresponding relation between the music and the multimedia file identification to music in the library. The device comprises a first crawling module, a second climbing module, a first acquisition module, a verification module and a first adding module. The present invention through the verification of music and multimedia files, add the corresponding relationship between the matching scores and the identification of the multimedia file to the music library, improve the accuracy of the multimedia server construction template.
【技术实现步骤摘要】
本专利技术涉及网络通信
,特别涉及一种构建乐谱库的方法和装置。
技术介绍
随着网络通信技术的发展,多媒体服务器的功能越来越强大;多媒体服务器向终端从发送歌曲时,不仅可以向终端发送歌曲,还能够向终端发送歌曲的乐谱,以使终端在播放歌曲的同时,在当前播放界面上显示歌曲的乐谱。因此,多媒体服务器向终端发送歌曲的乐谱之前,需要构建乐谱库。目前,多媒体服务器在构建乐谱库时,多媒体服务器先获取提供乐谱的目标网站的网址,根据该目标网站的网址,从目标网站中爬取包含乐谱的图像。该图像中往往包含该乐谱的歌曲的名称;然后人工从该图像中识别出该乐谱的歌曲的名称。多媒体服务器将该歌曲的名称和包含该乐谱的图像对应关系添加到乐谱库中。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:由于目标网站中包含乐谱的图像往往为用户上传的,该图像中可能包含错误的乐谱,从而导致多媒体服务器构建乐谱库中包含错误的乐谱,也即上述方法构建乐谱库的准确性差。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种构建乐谱库的方法和装置。技术方案如下:第一方面,本专利技术实施例提供了一种构建乐谱库的方法,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。可选的,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:根据 ...
【技术保护点】
一种构建乐谱库的方法,其特征在于,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。
【技术特征摘要】
1.一种构建乐谱库的方法,其特征在于,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。2.根据权利要求1所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。3.根据权利要求2所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度之前,所述方法还包括:获取预设数目的样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。4.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前,所述方法还包括:将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。5.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后,所述方法还包括:接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。6.根据权利要求5所述的方法,其特征在于,所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符之前,所述方法还包括:统计接收所述反馈信息的接收次数;如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。7.根据权利要求1所述的方法,其特征在于,所述从目标网站中爬取乐谱,包括:获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;从所述爬取区域中爬取所述乐谱。8.根据权利要求7所述的方法,其特征在于,所述从所述爬取区域中爬取所述乐谱,包括:从所述爬取区域中爬取包含所述乐谱的图像;从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。9.根据权利要求1所述的方法,其特征在于,所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识,包括:从所述目标网站中的指定区域爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。10.根据权利要求1所述的方法,其特征在于,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述方法还包括:根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。11.根据权利要求10所述的方法,其特征在于,所述根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件,包括:获取所述多媒体文件库中的每个多媒体文件;根据所述乐谱和所述每个多媒体文件,通过预设相似度算法,确定所述乐谱与所述每个多媒体文件之间的相似度;根据所述乐谱与所述每个多媒体文件之间的相似度,从所述多媒体文件库中选择相似度满足预设条件的多媒体文件;将选择的多媒体...
【专利技术属性】
技术研发人员:刘卓,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。