本发明专利技术实施例提供的一种视频中语音关键词广告的更换方法和装置。该方法包括:获得预先从原目标视频中确定出的原语音关键词广告所对应的原语音波形和原文本内容;基于原语音波形,确定原文本内容中各个字符的发音速率和语调特征;基于目标人物的发音特征和语调特征,确定各个字符的语调特征变化量;基于目标人物的发音特征,确定具有预定文本内容的待植入关键词广告的待植入语音关键词广告所对应的初始语音波形;利用原文本内容中各个字符的发音速率和语调特征变化量,对初始语音波形进行波形调整;将调整后的初始语音波形的语音作为待植入语音关键词广告;利用待植入语音关键词广告替换原语音关键词广告。本方案可更换视频中语音关键词广告。
【技术实现步骤摘要】
本专利技术涉及视频处理
,特别是涉及一种视频中语音关键词广告的更换方法及装置。
技术介绍
植入式广告越来越多的被电影和电视剧所采用。其中,关键词广告的植入方式通常为:在视频拍摄过程中由某些人物用语言来提及关键词广告,从而在所拍摄视频中形成该关键词广告所对应的语音关键词广告。其中,关键词广告所包含的文本内容可以为商品品牌名、商品广告语等与商品相关的词语。但是,随着植入广告业务的发展,衍生出植入的广告内容在合作期满之后被更换的需求,或者,同一视频在不同渠道播放时须植入不同广告的新需求。举例而言:有一个视频节目中,主持人口播说到“本节目由加多宝赞助”,但是,在某些情况下存在这样的需求:将视频节目中的“加多宝”的发音替换为“王老吉”;其中,“加多宝”和“王老吉”为关键词广告,而提及“加多宝”和“王老吉”的语音为语音关键词广告。那么,如何在不影响用户体验的前提下,更换视频中语音关键词广告是一个亟待解决的问题。
技术实现思路
本专利技术实施例的目的在于提供一种视频中语音关键词广告的更换方法及装置,以实现在不影响用户体验的前提下,更换视频中语音关键词广告的目的。具体技术方案如下:第一方面,本专利技术实施例提供了一种视频中语音关键词广告的更换方法,包括:获得预先从原目标视频中确定出的原语音关键词广告所对应的原语音波形和原文本内容;其中,所述原语音关键词广告为所述原目标视频中目标人物所提及的关于原关键词广告的语音;基于所述原语音波形,确定所述原文本内容中各个字符的发音速率和语调特征;其中,任一字符的语调特征通过该字符所包括音素的频谱特征表征;基于预先确定出的所述目标人物的发音特征和所述语调特征,确定所述各个字符的语调特征变化量;其中,所述发音特征通过所统计出的预定的音素的频谱特征来表征;基于所述目标人物的发音特征,确定具有预定文本内容的待植入关键词广告的待植入语音关键词广告所对应的初始语音波形;利用所述原文本内容中所述各个字符的发音速率和所述语调特征变化量,对所述初始语音波形进行波形调整;将波形调整后的初始语音波形所对应的语音作为所述待植入关键词广告所对应的待植入语音关键词广告;利用所述待植入语音关键词广告替换所述原目标视频中的所述原语音关键词广生口 O可选的,所述目标人物的发音特征的预先确定过程,包括:获得预先采集的目标人物的语料,其中,所述语料包括语音样本和所述语音样本所对应的文本样本;获得所述语音样本所对应的语音波形样本;利用所述语音波形样本和相应的文本样本,训练所述目标人物所对应的语音声学丰旲型;基于所述语音声学模型,确定针对于所述目标人物的预定的音素的频谱特征;将所确定出的针对于所述目标人物的预定的音素的频谱特征作为所述目标人物的发音特征。可选的,所述目标人物的语料,包括:从所述原目标视频中所提取到的关于所述目标人物的语料;或者,从所述原目标视频中和所述原目标视频以外的所述目标人物的语音文件中所提取到的关于所述目标人物的语料。可选的,确定所述原文本内容中各个字符的发音速率的方式,包括:从所述原语音波形中获得所述原文本内容的各个字符的单一发音持续时间以及所述原文本内容的总发音持续时间;利用所述单一发音持续时间和所述总发音持续时间,确定所述原文本内容中各个字符的发音速率。第二方面,本专利技术实施例还提供了一种视频中语音关键词广告的更换装置,包括:原语音波形获得模块,用于获得预先从原目标视频中确定出的原语音关键词广告所对应的原语音波形和原文本内容;其中,所述原语音关键词广告为所述原目标视频中目标人物所提及的关于原关键词广告的语音;原字符特征获得模块,用于基于所述原语音波形,确定所述原文本内容中各个字符的发音速率和语调特征;其中,任一字符的语调特征通过该字符所包括音素的频谱特征表征;语调特征变化量获得模块,用于基于预先确定出的所述目标人物的发音特征和所述语调特征,确定所述各个字符的语调特征变化量;其中,所述发音特征通过所统计出的预定的音素的频谱特征来表征;初始语音波形确定模块,用于基于所述目标人物的发音特征,确定具有预定文本内容的待植入关键词广告的待植入语音关键词广告所对应的初始语音波形;初始语音波形调整模块,用于利用所述原文本内容中所述各个字符的发音速率和所述语调特征变化量,对所述初始语音波形进行波形调整;待植入语音广告关键词确定模块,用于将波形调整后的初始语音波形所对应的语音作为所述待植入关键词广告所对应的待植入语音关键词广告;语音关键词广告替换模块,用于利用所述待植入语音关键词广告替换所述原目标视频中的所述原语音关键词广告。可选的,所述目标人物的发音特征通过发音特征确定模块来确定,所述发音特征确定t吴块,包括:语料获得单元,用于获得预先采集的目标人物的语料,其中,所述语料包括语音样本和所述语音样本所对应的文本样本;语音波形样本获得单元,用于获得所述语音样本所对应的语音波形样本;语音声学模型训练单元,用于利用所述语音波形样本和相应的文本样本,训练所述目标人物所对应的语音声学模型;音素特征确定单元,用于基于所述语音声学模型,确定针对于所述目标人物的预定的音素的频谱特征;发音特征确定单元,用于将所确定出的针对于所述目标人物的预定的音素的频谱特征作为所述目标人物的发音特征。可选的,所述语料获得单元所获得的所述目标人物的语料,包括:从所述原目标视频中所提取到的关于所述目标人物的语料;或者,从所述原目标视频中和所述原目标视频以外的所述目标人物的语音文件中所提取到的关于所述目标人物的语料。可选的,所述原字符特征获得模块确定所述原文本内容中各个字符的发音速率的方式,包括:从所述原语音波形中获得所述原文本内容的各个字符的单一发音持续时间以及所述原文本内容的总发音持续时间;利用所述单一发音持续时间和所述总发音持续当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种视频中语音关键词广告的更换方法,其特征在于,包括:获得预先从原目标视频中确定出的原语音关键词广告所对应的原语音波形和原文本内容;其中,所述原语音关键词广告为所述原目标视频中目标人物所提及的关于原关键词广告的语音;基于所述原语音波形,确定所述原文本内容中各个字符的发音速率和语调特征;其中,任一字符的语调特征通过该字符所包括音素的频谱特征表征;基于预先确定出的所述目标人物的发音特征和所述语调特征,确定所述各个字符的语调特征变化量;其中,所述发音特征通过所统计出的预定的音素的频谱特征来表征;基于所述目标人物的发音特征,确定具有预定文本内容的待植入关键词广告的待植入语音关键词广告所对应的初始语音波形;利用所述原文本内容中所述各个字符的发音速率和所述语调特征变化量,对所述初始语音波形进行波形调整;将波形调整后的初始语音波形所对应的语音作为所述待植入关键词广告所对应的待植入语音关键词广告;利用所述待植入语音关键词广告替换所述原目标视频中的所述原语音关键词广告。
【技术特征摘要】
【专利技术属性】
技术研发人员:李典,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。