本发明专利技术提供了一种现有图像与卡拉OK旋律实时匹配的方法。其一首歌在每次点播时会对应不同的图片,内容丰富,趣味性强,且卡拉OK运营者的成本得到降低。其技术方案是这样的:其特征在于:收集大量的卡拉OK的歌曲及其MTV,同时建立场景图片库,通过机器学习算法学习不同旋律类型的卡拉OK歌曲具有的旋律特征,并区分出不同旋律特征所对应的MTV的视频图像库,将所述场景图片库中的图片与所述MTV的视频图像库对比关联度,从而建立与旋律类型对应的需要播放的图片库,在播放歌曲的过程中,根据播放歌曲所具有的旋律特征,实时随机播放对应旋律特征的所述需要播放的图片库中的图片。
【技术实现步骤摘要】
本专利技术涉及卡拉0K视听播放
,具体为一种现有图像与卡拉0K旋律实 时匹配的方法。
技术介绍
卡拉0K已经普及到现代人们的娱乐领域。现有技术的卡拉0K所播放的歌曲,一 首歌只有一个MTV,内容较为单一,易让人产生乏味感,其趣味性低;同时由于一首歌对应 一支MTV,卡拉0K经营者需同时购买歌曲和MTV,其成本高。
技术实现思路
针对上述问题,本专利技术提供了一种现有图像与卡拉0K旋律实时匹配的方法,其一 首歌在每次点播时会对应不同的图片,内容丰富,趣味性强,且卡拉0K运营者的成本得到 降低。一种现有图像与卡拉0K旋律实时匹配的方法,其技术方案是这样的其特征在于收集大量的卡拉0K的歌曲及其MTV,同时建立场景图片库,通过机器学习 算法学习不同旋律类型的卡拉0K歌曲具有的旋律特征,并区分出不同旋律特征所对应的 MTV的视频图像库,将所述场景图片库中的图片与所述MTV的视频图像库对比关联度,从而 建立与旋律类型对应的需要播放的图片库,在播放歌曲的过程中,根据播放歌曲所具有的 旋律特征,实时随机播放对应旋律特征的所述需要播放的图片库中的图片。其进一步特征在于 其实施步骤如下a、建立样本库,收集大量的歌曲及其MTV,与此同时建立特定的场景图片库;b、以句子为单位分析歌曲的音频语气,根据歌曲音频的基频特征将歌曲的每句语气按 照情绪分类;c、建立与各音频语气相对应的视频图像库,以句子为单位划分与其对应的MTV视频图 片,根据步骤b所确定的情绪分类分别链接其对应的MTV视频图片,形成样本图片库;d、确定歌曲中的句子语气所对应情绪的样本图片库与特定的场景图片库中的图片间 的关联度,使用典型相关性分析算法(CCA),计算得到各种音频语气所对应情绪的样本图片 库中的视频图片与特定的场景图片库中的图片的相关性系数值;e、确定需要播放的图片库,在歌曲播放的过程中,获取到的歌曲的当前句子音频,通 过当前句子音频的语气得到其对应的情绪,然后匹配到对应的样本图片库,人工设定相关 性系数阈值,将相关性系数值高于人工设定的相关性系数阈值的图片放入需要播放的图片 库;f、从需要播放的图片库中随机抽取图片,实时播放。其更进一步特征在于所述根据歌曲音频的基频特征将歌曲的每句语气按照情绪分类具体为利用基频特征的情绪语音识别技术,从语音的基频特征出发,统计不同情绪下语音基频的变化规律,确定 了基于基频的情绪语音特征,建立高斯混合模型(GMM)进行识别,获得当前句子的情绪分 类。采用本专利技术的方法后,图片与卡拉0K歌曲的旋律的实时匹配,随机播放符合匹配 结果的图片,图片库越大,可播放的内容越丰富,极大地提高了卡拉0K的娱乐性与趣味性; 此外,卡拉0K经营者只需购买歌曲,该方法会自动捕捉歌曲中的旋律,对应播放符合旋律 的图片,使得其成本得到降低。附图说明图1为本专利技术的工作原理示意框图。具体实施例方式见图1 a、建立样本库,收集大量的歌曲及其MTV,与此同时采集建立特定的场景图片库,图中 场景库中的图片;b、以句子为单位分析歌曲的音频语气,利用基频特征的情绪语音识别技术,从语音的 基频特征出发,统计不同情绪下语音基频的变化规律,确定了基于基频的情绪语音特征,建 立高斯混合模型(GMM)进行识别,获得当前句子的情绪分类高兴、中性、生气、悲伤;c、建立与各音频语气相对应的视频图像库,以句子为单位划分与其对应的MTV视频图 片,根据高兴、中性、生气、悲伤这四种情绪分别链接其对应的MTV视频图片,形成样本图片 库;d、确定歌曲中的句子语气所对应情绪的样本图片库与特定的场景图片库中的图片间 的关联性,使用典型相关性分析算法(CCA),计算得到各种音频语气所对应情绪的样本图片 库中的视频图片与特定的场景图片库中的图片的相关性系数值;e、确定需要播放的图片库,在歌曲播放的过程中,获取到的歌曲的当前句子音频,通 过当前句子音频的语气得到其相关性参数,然后匹配到对应的样本图片库,人工设定相关 性系数阈值,将相关性系数值高于人工设定的相关性系数阈值的图片放入需要播放的图片 库;f、从需要播放的图片库中随机抽取图片,实时播放。权利要求一种现有图像与卡拉OK旋律实时匹配的方法,其特征在于收集大量的卡拉OK的歌曲及其MTV,同时建立场景图片库,通过机器学习算法学习不同旋律类型的卡拉OK歌曲具有的旋律特征,并区分出不同旋律特征所对应的MTV的视频图像库,将所述场景图片库中的图片与所述MTV的视频图像库对比关联度,从而建立与旋律类型对应的需要播放的图片库,在播放歌曲的过程中,根据播放歌曲所具有的旋律特征,实时随机播放对应旋律特征的所述需要播放的图片库中的图片。2.根据权利要求1所述的一种现有图像与卡拉0K旋律实时匹配的方法,其特征在于其实施步骤如下a、建立样本库,收集大量的歌曲及其MTV,与此同时建立特定的场景图片库;b、以句子为单位分析歌曲的音频语气,根据歌曲音频的基频特征将歌曲的每句语气按 照情绪分类;c、建立与各音频语气相对应的视频图像库,以句子为单位划分与其对应的MTV视频图 片,根据步骤b所确定的情绪分类分别链接其对应的MTV视频图片,形成样本图片库;d、确定歌曲中的句子语气所对应情绪的样本图片库与特定的场景图片库中的图片间 的关联度,使用典型相关性分析算法(CCA),计算得到各种音频语气所对应情绪的样本图片 库中的视频图片与特定的场景图片库中的图片的相关性系数值;e、确定需要播放的图片库,在歌曲播放的过程中,获取到的歌曲的当前句子音频,通 过当前句子音频的语气得到其对应的情绪,然后匹配到对应的样本图片库,人工设定相关 性系数阈值,将相关性系数值高于人工设定的相关性系数阈值的图片放入需要播放的图片 库;f、从需要播放的图片库中随机抽取图片,实时播放。3.根据权利要求2所述的一种现有图像与卡拉0K旋律实时匹配的方法,其特征在于 所述根据歌曲音频的基频特征将歌曲的每句语气按照情绪分类具体为利用基频特征的情 绪语音识别技术,从语音的基频特征出发,统计不同情绪下语音基频的变化规律,确定了基 于基频的情绪语音特征,建立高斯混合模型(GMM)进行识别,获得当前句子的情绪分类。全文摘要本专利技术提供了一种现有图像与卡拉OK旋律实时匹配的方法。其一首歌在每次点播时会对应不同的图片,内容丰富,趣味性强,且卡拉OK运营者的成本得到降低。其技术方案是这样的其特征在于收集大量的卡拉OK的歌曲及其MTV,同时建立场景图片库,通过机器学习算法学习不同旋律类型的卡拉OK歌曲具有的旋律特征,并区分出不同旋律特征所对应的MTV的视频图像库,将所述场景图片库中的图片与所述MTV的视频图像库对比关联度,从而建立与旋律类型对应的需要播放的图片库,在播放歌曲的过程中,根据播放歌曲所具有的旋律特征,实时随机播放对应旋律特征的所述需要播放的图片库中的图片。文档编号G10H1/36GK101859562SQ20101021411公开日2010年10月13日 申请日期2010年7月1日 优先权日2010年7月1日专利技术者袁存鼎, 马勇 申请人:无锡骏聿科技有限公司本文档来自技高网...
【技术保护点】
一种现有图像与卡拉OK旋律实时匹配的方法,其特征在于:收集大量的卡拉OK的歌曲及其MTV,同时建立场景图片库,通过机器学习算法学习不同旋律类型的卡拉OK歌曲具有的旋律特征,并区分出不同旋律特征所对应的MTV的视频图像库,将所述场景图片库中的图片与所述MTV的视频图像库对比关联度,从而建立与旋律类型对应的需要播放的图片库,在播放歌曲的过程中,根据播放歌曲所具有的旋律特征,实时随机播放对应旋律特征的所述需要播放的图片库中的图片。
【技术特征摘要】
【专利技术属性】
技术研发人员:马勇,袁存鼎,
申请(专利权)人:无锡骏聿科技有限公司,
类型:发明
国别省市:32[中国|江苏]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。