本发明专利技术公开了一种采用视频语音分析进行广告投放评估的方法,包括以下步骤:步骤一、获取视频数据,并从视频数据中提取人声音频;步骤二、将人声音频进行降噪处理,得到主题音频;步骤三、将主题音频进行语音识别并提取关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估;从视频数据中提取人声音频的方法为:先从视频数据中提取音频数据,再从音频数据中提取人声音频,人声音频降噪处理的方法为:将人声音频中位于人类发声音频外的频率减弱,得到主题音频。本发明专利技术通过从视频数据中分离出人声音频,并从人声音频中提取出关键字,再根据关键字进行广告投放评估,实现广告的精准投放。
The method of advertising evaluation by video voice analysis
【技术实现步骤摘要】
采用视频语音分析进行广告投放评估的方法
本专利技术涉及广告投放评估
更具体地说,本专利技术涉及一种采用视频语音分析进行广告投放评估的方法。
技术介绍
随着互联网技术的快速发展,多种短视频APP应运而生,比说快手、抖音、微视等,在短视频中投放广告成为众多商家宣传产品的重要途径,目前,现有技术多通过主播的粉丝量及视频播放量进行广告投放评估,最后决定是否投放广告,这种广告投放方式并不能结合短视频中主播的语音信息(语音中常出现的物品名称、品牌等)进行评估,影响广告投放的精准度。
技术实现思路
本专利技术的一个目的是解决至少上述问题,并提供至少后面将说明的优点。本专利技术还有一个目的是提供一种采用视频语音分析进行广告投放评估的方法,其通过从视频数据中分离出人声音频,并从人声音频中提取出关键字,再根据关键字进行广告投放评估,实现广告的精准投放。为了实现根据本专利技术的这些目的和其它优点,提供了一种采用视频语音分析进行广告投放评估的方法,包括以下步骤:步骤一、获取视频数据,并从视频数据中提取人声音频;步骤二、将人声音频进行降噪处理,得到主题音频;步骤三、将主题音频进行语音识别并提取关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估。优选的是,从视频数据中提取人声音频的方法为:先从视频数据中提取音频数据,再从音频数据中提取人声音频。优选的是,人声音频降噪处理的方法为:将人声音频中位于人类发声音频外的频率减弱,得到主题音频。优选的是,将人声音频中位于人类发声音频外的频率减弱后再进行强化处理,强化处理的方法为:B1、采集大量语音训练数据,训练得到男声特征模型、女声特征模型;B2、将人声音频中位于人类发声音频外的频率减弱后依据男声特征模型、女声特征模型判断出人声音频的性别;B3、根据人声音频的性别和该性别所对应的特征模型,减弱人声音频中位于特征模型外的频率,即得到主题音频。优选的是,从音频数据中提取背景音乐,将背景音乐进行歌名识别,并根据歌名进行版权确认。优选的是,将识别出歌名的背景音乐进行节奏分离,并根据分离出的节奏确认歌曲类型;步骤三具体为:将主题音频进行语音识别并提取出关键字,关键字和歌曲类型形成对主题音频的特征描述,依据特征描述进行广告投放评估。优选的是,语音识别后形成识别文本,将识别文本进行预处理,预处理的方法为:A1、通过中文分词算法从识别文本中分出多个词语,然后将词语转换成基准拼音;A2、将每个基准拼音均进行如下处理:b1、判断基准拼音中是否含有声母模糊音,若不含声母模糊音则判断基准拼音中是否含有前后鼻模糊音,若含有声母模糊音则将声母模糊音依据声母替换规则进行替换生成多个第一替换拼音,多个第一替换拼音、基准拼音形成新的基准拼音,再判断基准拼音中是否含有前后鼻模糊音,b2、若基准拼音中不含前后鼻模糊音,则生成校正拼音,若含有前后鼻模糊音,则将前后鼻模糊音依据前后鼻音替换规则进行替换生成多个第二替换拼音,多个第二替换拼音与基准拼音形成校正拼音,b3、将校正拼音转换成中文词,其中,声母模糊音包括zh、ch、sh、z、c、s、l、f,声母替换规则为:zh替换成ch、sh、z、c、s,ch替换成zh、sh、z、c、s,sh替换成zh、ch、z、c、s,z替换成zh、ch、sh、c、s,c替换成zh、ch、sh、z、s,s替换成zh、ch、sh、z、c,l替换成f,f替换成l,前后鼻模糊音包括an、ang、in、ing、en、eng,前后鼻音替换规则为:an替换为ang,ang替换为an,in替换为jing,jing替换为jin,en替换为eng,eng替换为en;A3、将识别文本中的每个词语依次进行如下处理:将词语所生成的中文词分别替换识别文本中的该词语,形成多个目标文本,将多个目标文本分别采用Word2Vec技术计算每个中文词与其所在目标文本中邻近词的共现频率,将多个中文词所对应的共现频率进行排名,选取共现频率处于第一位的中文词作为有效词;A4、将识别文本中的多个词语分别使用相对应的有效词进行替换,得到校正文本;步骤三具体为将主题音频进行语音识别,然后语音识别后进行预处理,得到校正文本,从校正文本中提取关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估。本专利技术至少包括以下有益效果:第一、本专利技术通过从视频数据中分离出人声音频,并从人声音频中提取出关键字,再根据关键字进行广告投放评估,实现广告的精准投放。第二、本专利技术通过采集大量纯语音训练数据,得到男声特征模型、女声特征模型并基于男声特征模型、女声特征模型将人声音频进行降噪处理,该处理方法可明显降低噪音的影响,提高语音识别的准确性;本通过确认歌曲类型,可进一步提高广告投放评估的精准性。第三、本专利技术通过将识别文本进行预处理获取校正文本,可提高关键字提取的准确性,同时,本专利技术的识别方法可以减少平舌翘舌音、前后鼻音对语音识别结果的影响。附图说明图1为本专利技术其中一个技术方案所述的采用视频语音分析进行广告投放评估的流程图;图2为本专利技术其中一个技术方案所述的识别文本预处理的流程图。本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。具体实施方式下面结合实施例对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。<实施例1>如图1所示,采用视频语音分析进行广告投放评估的方法,包括以下步骤:步骤一、获取视频数据,并从视频数据中提取人声音频;步骤二、将人声音频进行降噪处理,得到主题音频;步骤三、将主题音频先创建时间轴,然后采用ASR引擎进行语音识别,生成识别文本,并提采用NLP引擎计算关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估,具体可分析同一主播的多个短视频进行综合性评估,例如提取的关键字为鞋子、舒服,那么可选择投放鞋子类广告,例如提取的关键字为衣服、穿搭,那么可选择投放服饰品牌的广告。从视频数据中提取人声音频的方法为:先从视频数据中提取音频数据,再从音频数据中提取人声音频。<实施例2>采用视频语音分析进行广告投放评估的方法,包括以下步骤:步骤一、获取视频数据,并从视频数据中提取人声音频;步骤二、将人声音频进行降噪处理,得到主题音频;步骤三、将主题音频先创建时间轴,然后采用ASR引擎进行语音识别,生成识别文本,并提采用NLP引擎计算关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估,具体可分析同一主播的多个短视频进行综合性评估,例如提取的关键字为鞋子、舒服,那么可选择投放鞋子类广告,例如提取的关键字为衣服、穿搭,那么可选择投放服饰品牌的广告。从视频数据中提取人声音频的方法为:先从视频数据中提取音频数据,再从音频数据中提取人声音频。<本文档来自技高网...
【技术保护点】
1.采用视频语音分析进行广告投放评估的方法,其特征在于,包括以下步骤:/n步骤一、获取视频数据,并从视频数据中提取人声音频;/n步骤二、将人声音频进行降噪处理,得到主题音频;/n步骤三、将主题音频进行语音识别并提取关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估。/n
【技术特征摘要】
1.采用视频语音分析进行广告投放评估的方法,其特征在于,包括以下步骤:
步骤一、获取视频数据,并从视频数据中提取人声音频;
步骤二、将人声音频进行降噪处理,得到主题音频;
步骤三、将主题音频进行语音识别并提取关键字形成对主题音频的特征描述,依据特征描述进行广告投放评估。
2.如权利要求1所述的采用视频语音分析进行广告投放评估的方法,其特征在于,从视频数据中提取人声音频的方法为:先从视频数据中提取音频数据,再从音频数据中提取人声音频。
3.如权利要求2所述的采用视频logo分析进行广告投放评估的方法,其特征在于,人声音频降噪处理的方法为:将人声音频中位于人类发声音频外的频率减弱,得到主题音频。
4.如权利要求3所述的采用视频logo分析进行广告投放评估的方法,其特征在于,将人声音频中位于人类发声音频外的频率减弱后再进行强化处理,强化处理的方法为:
B1、采集大量语音训练数据,训练得到男声特征模型、女声特征模型;
B2、将人声音频中位于人类发声音频外的频率减弱后依据男声特征模型、女声特征模型判断出人声音频的性别;
B3、根据人声音频的性别和该性别所对应的特征模型,减弱人声音频中位于特征模型外的频率,即得到主题音频。
5.如权利要求2所述的采用视频语音分析进行广告投放评估的方法,其特征在于,从音频数据中提取背景音乐,将背景音乐进行歌名识别,并根据歌名进行版权确认。
6.如权利要求5所述的采用视频语音分析进行广告投放评估的方法,其特征在于,将识别出歌名的背景音乐进行节奏分离,并根据分离出的节奏确认歌曲类型;
步骤三具体为:将主题音频进行语音识别并提取出关键字,关键字和歌曲类型形成对主题音频的特征描述,依据特征描述进行广告投放评估。
7.如权利要求1所述的采用视频语音分析进行广告投放评估的方法,其...
【专利技术属性】
技术研发人员:夏振宇,
申请(专利权)人:夏振宇,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。