数字音频信号的连续可变时间标度改变技术制造技术

技术编号：3046983 阅读：191 留言：0更新日期：2012-04-11 18:40

一种用于数字音频信号的时间标度改变的方法产生不同播放率的、而相同音调的输出信号作为输入数字音频信号。该方法使输入信号中的样本块与输出信号中的样本块重叠以压缩信号。针对各可能重叠来计算相关函数，且选择产生最大相关度的重叠。对于计算相关函数有效的计算方法计算输入和输出样本块的离散频率变换、计算相关、然后对于在最优重叠处具有最大值的相关函数进行频率变换反变换。一种针对多声道数字音频信号的时间缩放改变的方法独立地处理每个声道，听者合成不同的声道并感知高质量的多声道信号。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是关于数字音频信号处理。更特别地，它关于使用经改进同步化重叠及增加(SOLA)算法(synchronized overlap-and-add algorithm)来不改变音调地改进音频信号的输出率的方法。
技术介绍
多种应用需要改进音频信号的播放率。落于时间标度改变(TSM)的范围内的技术包括压缩(即，加速)和解压(即，减缓)两者。音频压缩应用包括加速无线电脱口秀来允许较多广告，允许使用者或碟片操作员来针对舞曲而选择节拍，加速口述材料的播放率，加速音频信息的播放率，且把音频和视频播放率同步化。不管输入信号(语言、音乐、或经组合语言和音乐)的类型，TSM的目标是保留输入信号的音调，同时改变其节拍。明显地，增加或减少播放率需要改变音调。同步化重叠及增加技术于1985年由S.Roucos和A.M.Wilgus在IEEE国际论集ASSP的“针对语言的高品质时间标度改变”第493-496页中被介绍，且仍是许多新近发展技术的基础。该方法被示出在图1A中。通过数字采样模拟音频信号来获得一系列时域样本x(t)而获得数字输入信号10。输入信号10被分成重叠的窗口、块、或帧12，各包括N个样本且彼此以Sa个样本(“a”是用于分析)来偏离。经缩放输出14包括相同重叠窗口的样本y(t)，且彼此以不同数目的样本Ss(“s”是用于合成化)来偏移。通过以与在输入10中不同的时间滞后(lag)来对输入窗口12进行连续地重叠来产生输出14。时间标度比率α被界定为Sa/Ss；针对压缩α＞1，且针对解压α＜1。说明于图1B中如线性交叉隐现的加权函数被用来组合经重叠窗口。为了把输入...

【技术保护点】
一种是针对包括输入样本的数字音频输入信号的时间标度改变方法，以可形成包括输出样本的数字音频输出信号，该方法包括下列步骤：ａ）选择Ｎ／２个输入样本的输入块；ｂ）选择Ｎ／２个输出样本的输出块；ｃ）决定用来把该输入块的起头与该输出块的起头重叠的最优偏移量Ｔ；其中－Ｎ／２≤Ｔ≤Ｎ／２，其中该偏移量决定包括计算在该Ｎ／２个输入样本的离散频率变换和该Ｎ／２个输出样本的离散频率变换间的相关函数，其中该相关函数的离散频率反变换的最大值发生于该最优偏移量Ｔ；和ｄ）把该输入块与该输出块重叠来形成该输出信号，其中该输入块起头与该输出块起头偏移Ｔ个样本。

【技术特征摘要】
US 2000-7-26 09/626,0461.一种是针对包括输入样本的数字音频输入信号的时间标度改变方法，以可形成包括输出样本的数字音频输出信号，该方法包括下列步骤a)选择N/2个输入样本的输入块；b)选择N/2个输出样本的输出块；c)决定用来把该输入块的起头与该输出块的起头重叠的最优偏移量T；其中-N/2≤T≤N/2，其中该偏移量决定包括计算在该N/2个输入样本的离散频率变换和该N/2个输出样本的离散频率变换间的相关函数，其中该相关函数的离散频率反变换的最大值发生于该最优偏移量T；和d)把该输入块与该输出块重叠来形成该输出信号，其中该输入块起头与该输出块起头偏移T个样本。2.依据权利要求1所述的方法，其中该偏移量决定步骤更包括在实施该输入频率变换前把N/2个零样本附于该N/2个输入样本，且在实施该输出频率变换前把N/2个零样本附于该N/2个输出样本。3.依据权利要求1所述的方法，其中该离散频率变换是离散傅立叶变换，且其中该离散频率反变换是离散傅立叶反变换。4.依据权利要求3所述的方法，其中该偏移量决定步骤包括i)对该输入样本进行离散傅立叶变换，以获得X(k)，其中k＝0，…，N/2-1；ii)对该输出样本进行离散傅立叶变换，以获得Y(k)，其中k＝0，…，N/2-1；iii)对X(k)取共轭复数，以获得X*(k)，其中k＝0，…，N/2-1；iv)对复数乘法乘积Z(k)＝X*(k)·Y(k)，其中k＝0，…，N/2-1；v)对Z(k)进行离散傅立叶反变换，以获得z(t)；和vi)决定z(T)为最大值时的T。5.依据权利要求1所述的方法，其中该离散频率变换是从由离散余弦变换、离散正弦变换、离散哈特雷变换、和根据维夫雷特式函数的离散变换组成的组中选出。6.依据权利要求1所述的方法，其中该相关函数是经标称化的相关函数。7.依据权利要求1所述的方法，其更包括以恒定速率输出该输出信号。8.依据权利要求7所述的方法，其中该恒定速率是实时速率。9.依据权利要求7所述的方法，其中该输出块的该起头的位置是依赖该恒定速率来选择。10.依据权利要求1所述的方法，其更包括以可变速率获得该输入信号。11.依据权利要求1所述的方法，其中步骤(a)是独立于该输入信号的音调周期。12.依据权利要求1所述的方法，其中该重叠步骤包括把加权函数应用于该输出块和该输入块。13.依据权利要求12所述的方法，其中该加权函数是线性函数。14.一种用于多声道数字音频输入信号的时间标度改变方法，各输入声道包括输入样本，来形成一个多声道数字音频输出信号，各输出声道包括输出样本，该方法包括下列步骤a)获得该输入声道；b)独立地针对各个该输入声道i)选择N/2个输入样本的输入块；ii)从该输出声道的对应声道选择N/2个输出样本的输出块；iii)确定用来把该输入块的起头与该输出块的起头重叠的最优偏移量T，其中-N/2≤T≤N/2，该偏移量的确定包括计算在该N/2个输入样本的离散频率变换和该N/2个输出样本的离散频率变换间的相关函数，其中该相关函数的离散频率反变换的最大值发生在该最优偏移量T；iv)把该输入块与该输出块重叠来形成该对应的输出声道，其中该输入块起头与该输出块起头偏移T个样本；和c)把该输出声道组合来形成该多声道数字音频输出信号。15.依据权利要求14所述的方法，其中步骤(a)包括把该多声道数字音频信号分离成该输入样本。16.依据权利要求14所述的方法，其中步骤(a)包括从单...

【专利技术属性】
技术研发人员：罗杰塞利，
申请(专利权)人：SSI株式会社，罗杰塞利，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人