一种英语有声影像资料自动加注英语字幕的方法技术

技术编号：13515145 阅读：79 留言：0更新日期：2016-08-12 01:10

本发明专利技术公开了一种英语有声影像资料自动加注英语字幕的方法，包括如下步骤：步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间；步骤二、对原始信号x(n)进行预加重和加汉明窗；步骤三、进行离散傅里叶变换得到频谱；步骤四、将频谱系数用三角滤波器进行滤波处理，得到每个滤波器输出的对数能量；步骤五、进行离散余弦变换，得到MFCC参数；步骤六、提取MFCC特征向量；步骤七、将MFCC特征向量与数据库中存储的单词的特征向量进行匹配，以得到相匹配的单词文字；步骤八、将相匹配的单词文字在所对应的时间上显示到声影像资料中。

全部详细技术资料下载

【技术实现步骤摘要】
201610345908

【技术保护点】
一种英语有声影像资料自动加注英语字幕的方法，其特征在于，包括如下步骤：步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间，其中n为采样点标号；步骤二、对原始信号x(n)进行预加重，得到加重后信号y(n)＝x(n)‑0.95x(n‑1)，加汉明窗sw(n)＝y(n)*w(n)其中，w(n)＝0.54‑0.46cos(2nπ/N‑1)，n＝0,1,Κ,N‑1，sw(n)为加窗后的信号，N为最后一个采样点的标号；步骤三、对sw(n)进行离散傅里叶变换得到频谱：F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中，j为虚数单位；步骤四、将频谱系数用三角滤波器进行滤波处理，得到每个滤波器输出的对数能量：Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中，M为滤波器的个数；步骤五、进行离散余弦变换，得到MFCC参数：Cn=Σi=0M-1Xicos(πn(i+0.5)/M),0≤n≤M;]]>步骤六、将对数能量和C1,C2,Κ,C12组成一个13维特征向量C，并将C连续进行两次...

【技术特征摘要】
1.一种英语有声影像资料自动加注英语字幕的方法，其特征在于，包括如下步骤：步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间，其中n为采样点标号；步骤二、对原始信号x(n)进行预加重，得到加重后信号y(n)＝x(n)-0.95x(n-1)，加汉明窗sw(n)＝y(n)*w(n)其中，w(n)＝0.54-0.46cos(2nπ/N-1)，n＝0,1,Κ,N-1，sw(n)为加窗后的信号，N为最后一个采样点的标号；步骤三、对sw(n)进行离散傅里叶变换得到频谱：F(k)=Σn=0N-1sw(n)-j2πnk/N;]]>其中，j为虚数单位；步骤四、将频谱系数用三角滤波器进行滤波处理，得到每个滤波器输出的对数能量：Xi=ln(Σk=0N-1F(k)*Hi(k)),0≤i≤M;]]>其中，M为滤波...

【专利技术属性】
技术研发人员：姜华，顾艳，胡帅，丛岩，周健敏，杜连艳，李一飞，姚大伟，
申请(专利权)人：渤海大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人