【技术实现步骤摘要】
201610345908
【技术保护点】
一种英语有声影像资料自动加注英语字幕的方法,其特征在于,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间,其中n为采样点标号;步骤二、对原始信号x(n)进行预加重,得到加重后信号y(n)=x(n)‑0.95x(n‑1),加汉明窗sw(n)=y(n)*w(n)其中,w(n)=0.54‑0.46cos(2nπ/N‑1),n=0,1,Κ,N‑1,sw(n)为加窗后的信号,N为最后一个采样点的标号;步骤三、对sw(n)进行离散傅里叶变换得到频谱:F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中,j为虚数单位;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量:Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中,M为滤波器的个数;步骤五、进行离散余弦变换,得到MFCC参数:Cn=Σi=0M-1Xicos(πn(i+0.5)/M),0≤n≤M;]]>步骤六、将对数能量和C1,C2,Κ,C12组成一个13维特征向量C,并将C连续进行两次 ...
【技术特征摘要】
1.一种英语有声影像资料自动加注英语字幕的方法,其特征在于,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间,其中n为采样点标号;步骤二、对原始信号x(n)进行预加重,得到加重后信号y(n)=x(n)-0.95x(n-1),加汉明窗sw(n)=y(n)*w(n)其中,w(n)=0.54-0.46cos(2nπ/N-1),n=0,1,Κ,N-1,sw(n)为加窗后的信号,N为最后一个采样点的标号;步骤三、对sw(n)进行离散傅里叶变换得到频谱:F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中,j为虚数单位;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量:Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中,M为滤波...
【专利技术属性】
技术研发人员:姜华,顾艳,胡帅,丛岩,周健敏,杜连艳,李一飞,姚大伟,
申请(专利权)人:渤海大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。