当前位置: 首页 > 专利查询>渤海大学专利>正文

一种英语有声影像资料自动加注英语字幕的方法技术

技术编号:13515145 阅读:72 留言:0更新日期:2016-08-12 01:10
本发明专利技术公开了一种英语有声影像资料自动加注英语字幕的方法,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间;步骤二、对原始信号x(n)进行预加重和加汉明窗;步骤三、进行离散傅里叶变换得到频谱;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量;步骤五、进行离散余弦变换,得到MFCC参数;步骤六、提取MFCC特征向量;步骤七、将MFCC特征向量与数据库中存储的单词的特征向量进行匹配,以得到相匹配的单词文字;步骤八、将相匹配的单词文字在所对应的时间上显示到声影像资料中。

【技术实现步骤摘要】
201610345908

【技术保护点】
一种英语有声影像资料自动加注英语字幕的方法,其特征在于,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间,其中n为采样点标号;步骤二、对原始信号x(n)进行预加重,得到加重后信号y(n)=x(n)‑0.95x(n‑1),加汉明窗sw(n)=y(n)*w(n)其中,w(n)=0.54‑0.46cos(2nπ/N‑1),n=0,1,Κ,N‑1,sw(n)为加窗后的信号,N为最后一个采样点的标号;步骤三、对sw(n)进行离散傅里叶变换得到频谱:F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中,j为虚数单位;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量:Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中,M为滤波器的个数;步骤五、进行离散余弦变换,得到MFCC参数:Cn=Σi=0M-1Xicos(πn(i+0.5)/M),0≤n≤M;]]>步骤六、将对数能量和C1,C2,Κ,C12组成一个13维特征向量C,并将C连续进行两次差分,得到ΔC和ΔΔC,将C、ΔC、ΔΔC组成的39维特征向量作为MFCC特征向量;步骤七、将MFCC特征向量与数据库中存储的单词的特征向量进行匹配,以得到相匹配的单词文字;步骤八、将相匹配的单词文字在所对应的时间上显示到声影像资料中。...

【技术特征摘要】
1.一种英语有声影像资料自动加注英语字幕的方法,其特征在于,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间,其中n为采样点标号;步骤二、对原始信号x(n)进行预加重,得到加重后信号y(n)=x(n)-0.95x(n-1),加汉明窗sw(n)=y(n)*w(n)其中,w(n)=0.54-0.46cos(2nπ/N-1),n=0,1,Κ,N-1,sw(n)为加窗后的信号,N为最后一个采样点的标号;步骤三、对sw(n)进行离散傅里叶变换得到频谱:F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中,j为虚数单位;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量:Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中,M为滤波...

【专利技术属性】
技术研发人员:姜华顾艳胡帅丛岩周健敏杜连艳李一飞姚大伟
申请(专利权)人:渤海大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1