【技术实现步骤摘要】
本专利技术是关于数字音频信号处理。更特别地,它关于使用经改进同步化重叠及增加(SOLA)算法(synchronized overlap-and-add algorithm)来不改变音调地改进音频信号的输出率的方法。
技术介绍
多种应用需要改进音频信号的播放率。落于时间标度改变(TSM)的范围内的技术包括压缩(即,加速)和解压(即,减缓)两者。音频压缩应用包括加速无线电脱口秀来允许较多广告,允许使用者或碟片操作员来针对舞曲而选择节拍,加速口述材料的播放率,加速音频信息的播放率,且把音频和视频播放率同步化。不管输入信号(语言、音乐、或经组合语言和音乐)的类型,TSM的目标是保留输入信号的音调,同时改变其节拍。明显地,增加或减少播放率需要改变音调。同步化重叠及增加技术于1985年由S.Roucos和A.M.Wilgus在IEEE国际论集ASSP的“针对语言的高品质时间标度改变”第493-496页中被介绍,且仍是许多新近发展技术的基础。该方法被示出在图1A中。通过数字采样模拟音频信号来获得一系列时域样本x(t)而获得数字输入信号10。输入信号10被分成重叠的窗口、块、或帧12,各包括N个样本且彼此以Sa个样本(“a”是用于分析)来偏离。经缩放输出14包括相同重叠窗口的样本y(t),且彼此以不同数目的样本Ss(“s”是用于合成化)来偏移。通过以与在输入10中不同的时间滞后(lag)来对输入窗口12进行连续地重叠来产生输出14。时间标度比率α被界定为Sa/Ss;针对压缩α>1,且针对解压α<1。说明于图1B中如线性交叉隐现的加权函数被用来组合经重叠窗口。为了把输入 ...
【技术保护点】
一种是针对包括输入样本的数字音频输入信号的时间标度改变方法,以可形成包括输出样本的数字音频输出信号,该方法包括下列步骤:a)选择N/2个输入样本的输入块;b)选择N/2个输出样本的输出块;c)决定用来把该输入块的起头与该输出块的 起头重叠的最优偏移量T;其中-N/2≤T≤N/2,其中该偏移量决定包括计算在该N/2个输入样本的离散频率变换和该N/2个输出样本的离散频率变换间的相关函数,其中该相关函数的离散频率反变换的最大值发生于该最优偏移量T;和d)把该输入块 与该输出块重叠来形成该输出信号,其中该输入块起头与该输出块起头偏移T个样本。
【技术特征摘要】
US 2000-7-26 09/626,0461.一种是针对包括输入样本的数字音频输入信号的时间标度改变方法,以可形成包括输出样本的数字音频输出信号,该方法包括下列步骤a)选择N/2个输入样本的输入块;b)选择N/2个输出样本的输出块;c)决定用来把该输入块的起头与该输出块的起头重叠的最优偏移量T;其中-N/2≤T≤N/2,其中该偏移量决定包括计算在该N/2个输入样本的离散频率变换和该N/2个输出样本的离散频率变换间的相关函数,其中该相关函数的离散频率反变换的最大值发生于该最优偏移量T;和d)把该输入块与该输出块重叠来形成该输出信号,其中该输入块起头与该输出块起头偏移T个样本。2.依据权利要求1所述的方法,其中该偏移量决定步骤更包括在实施该输入频率变换前把N/2个零样本附于该N/2个输入样本,且在实施该输出频率变换前把N/2个零样本附于该N/2个输出样本。3.依据权利要求1所述的方法,其中该离散频率变换是离散傅立叶变换,且其中该离散频率反变换是离散傅立叶反变换。4.依据权利要求3所述的方法,其中该偏移量决定步骤包括i)对该输入样本进行离散傅立叶变换,以获得X(k),其中k=0,…,N/2-1;ii)对该输出样本进行离散傅立叶变换,以获得Y(k),其中k=0,…,N/2-1;iii)对X(k)取共轭复数,以获得X*(k),其中k=0,…,N/2-1;iv)对复数乘法乘积Z(k)=X*(k)·Y(k),其中k=0,…,N/2-1;v)对Z(k)进行离散傅立叶反变换,以获得z(t);和vi)决定z(T)为最大值时的T。5.依据权利要求1所述的方法,其中该离散频率变换是从由离散余弦变换、离散正弦变换、离散哈特雷变换、和根据维夫雷特式函数的离散变换组成的组中选出。6.依据权利要求1所述的方法,其中该相关函数是经标称化的相关函数。7.依据权利要求1所述的方法,其更包括以恒定速率输出该输出信号。8.依据权利要求7所述的方法,其中该恒定速率是实时速率。9.依据权利要求7所述的方法,其中该输出块的该起头的位置是依赖该恒定速率来选择。10.依据权利要求1所述的方法,其更包括以可变速率获得该输入信号。11.依据权利要求1所述的方法,其中步骤(a)是独立于该输入信号的音调周期。12.依据权利要求1所述的方法,其中该重叠步骤包括把加权函数应用于该输出块和该输入块。13.依据权利要求12所述的方法,其中该加权函数是线性函数。14.一种用于多声道数字音频输入信号的时间标度改变方法,各输入声道包括输入样本,来形成一个多声道数字音频输出信号,各输出声道包括输出样本,该方法包括下列步骤a)获得该输入声道;b)独立地针对各个该输入声道i)选择N/2个输入样本的输入块;ii)从该输出声道的对应声道选择N/2个输出样本的输出块;iii)确定用来把该输入块的起头与该输出块的起头重叠的最优偏移量T,其中-N/2≤T≤N/2,该偏移量的确定包括计算在该N/2个输入样本的离散频率变换和该N/2个输出样本的离散频率变换间的相关函数,其中该相关函数的离散频率反变换的最大值发生在该最优偏移量T;iv)把该输入块与该输出块重叠来形成该对应的输出声道,其中该输入块起头与该输出块起头偏移T个样本;和c)把该输出声道组合来形成该多声道数字音频输出信号。15.依据权利要求14所述的方法,其中步骤(a)包括把该多声道数字音频信号分离成该输入样本。16.依据权利要求14所述的方法,其中步骤(a)包括从单...
【专利技术属性】
技术研发人员:罗杰塞利,
申请(专利权)人:SSI株式会社,罗杰塞利,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。