一种彩铃音质优化的方法及装置制造方法及图纸

技术编号:5217637 阅读:275 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种彩铃音质优化的方法及装置。方法包括:计算铃音文件的平均能量以及其中每个语音帧的平均能量;分别计算每个语音帧的平均能量与铃音文件的平均能量的比值;统计比值小于第一门限或者大于第二门限的语音帧总数;当所述语音帧总数大于第三门限时,则确定该铃音文件会产生杂音;对确定的会产生杂音的铃音文件进行调制优化。依照本发明专利技术,能够有效提高彩铃的铃音质量。

【技术实现步骤摘要】

本专利技术涉及电信增值业务的实现,特别涉及一种彩铃音质优化的方法及装置
技术介绍
如今的通信市场竞争非常激烈,通信运营商的每用户平均收入(ARPU)值在呈现 下降的趋势,找寻新的利润增长点成为各大运营商的当务之急。彩铃业务自推出以来业务 量增长迅猛,成为继短信之后第二个“杀手级,,应用的增值业务,对提高通信运营商的ARPU 值具有非常重要的意义。彩铃业务的卖点就在于用动听的音乐铃声代替乏味的传统“嘟一嘟一”的回铃 音,而彩铃系统建成以来,通信运营商陆续收到用户投诉,反映其购买的彩铃铃音质量很 差,经常可以听到“嘶......啦......”的杂音,拨测结果也证实了杂音的存在。因此,如何定位杂音产生的原因,以提高彩铃质量,就成为亟待解决的技术问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种彩铃音质优化的方法及装置,以提高彩铃 的铃音质量。为解决上述技术问题,本专利技术提供技术方案如下—种彩铃音质优化的方法,包括计算铃音文件的平均能量以及其中每个语音帧的平均能量;分别计算每个语音帧的平均能量与铃音文件的平均能量的比值;统计比值小于第一门限或者大于第二门限的语音帧总数;当所述语音帧总数大于第三门限时,则确定该铃音文件会产生杂音;对确定的会产生杂音的铃音文件进行调制优化。上述的方法,其中通过对多个会产生杂音的铃音文件进行分析,来得到所述第一 门限和第二门限。上述的方法,其中,所述通过对多个会产生杂音的铃音文件进行分析,来得到所述 第一门限和第二门限,包括如下步骤A、选择一个会产生杂音的铃音文件,并定位出其中产生杂音的语音段;B、计算所选择的铃音文件的平均能量以及其中产生杂音的语音段的平均能量;C、分别计算各个产生杂音的语音段的平均能量与铃音文件的平均能量的比值,得 到多个比值,并获取其中的最小比值和最大比值;D、反复执行上述步骤A C,得到多个最小比值和多个最大比值;E、从所述多个最小比值中选取出现次数最多的最小比值,从所述多个最大比值中 选取出现次数最多的最大比值,并将所述出现次数最多的最小比值作为所述第一门限,将 所述出现次数最多的最大比值作为所述第二门限。上述的方法,其中,按照如下公式计算铃音文件中的采样点的瞬时能量P(i) = (l-a)*P(i-l)+a*|x(i) |,其中,P⑴为第i个采样点的瞬时能量,P(I)= X(I) I,x(i)为第i个采样点上的语音信号,i = 1,2,...,n,n为采样点数目,a是取值在0到1之间的常数。上述的方法,其中,按照如下公式计算铃音文件中的采样点的瞬时能量P⑴=(l-a)*P(i-l)+a*x⑴*x(i),其中,P⑴为第i个采样点的瞬时能量,P(I) =I χ (1) I,χ (i)为第i个采样点上的语音信号,i = 1,2,. . .,η,η为采样点数目,a是取值 在0到1之间的常数上述的方法,其中,按照如下公式计算铃音文件中的采样点的瞬时能量P⑴=|x⑴I,其中,P⑴为第i个采样点的瞬时能量,x(i)为第i个采样点上 的语音信号,i = l,2,...,n,n为采样点数目上述的方法,其中,所述对确定的会产生杂音的铃音文件进行调制优化为对铃音文件进行增益控制,以提高整个铃音文件的平均能量,或者,提高铃音文件 中产生杂音的语音段的平均能量。一种彩铃音质优化的装置,包括能量计算单元,用于计算铃音文件的平均能量以及其中每个语音帧的平均能量;比值计算单元,用于分别计算每个语音帧的平均能量与铃音文件的平均能量的比值;统计单元,用于统计比值小于第一门限或者大于第二门限的语音帧总数;杂音判断单元,用于当所述语音帧总数大于第三门限时,确定该铃音文件会产生 杂音;调制优化单元,用于对确定的会产生杂音的铃音文件进行调制优化。上述的装置,其中,还包括门限获取单元,用于通过对多个会产生杂音的铃音文件进行分析,来得到所述第 一门限和第二门限。上述的装置,其中,所述调制优化单元进一步用于对铃音文件进行增益控制,以提高整个铃音文件的平均能量,或者,提高铃音文件 中产生杂音的语音段的平均能量。本专利技术实施例通过对大量的产生杂音的铃音文件样本进行分析,得到杂音能量特 征值;然后,根据所述杂音能量特征值对彩铃数据库中的彩铃文件进行分析,确定哪些彩铃 文件会产生杂音;对于确定的会产生杂音的彩铃文件进行调制优化,使得经过调制优化后 的彩铃文件经过彩铃平台后,不再产生杂音,或者,产生杂音的概率降低,从而提高了彩铃 的铃音质量,进而提升了客户满意度。附图说明图1为本专利技术实施例中杂音能量特征值检测的方法流程图;图2为本专利技术实施例的彩铃音质优化的方法流程图;图3为本专利技术实施例的彩铃音质优化的装置结构图。具体实施例方式通过对大量产生杂音的铃音文件样本进行分析,发现放音时产生杂音的彩铃具备以下特征(1)每次产生杂音的地方在语音低谷(语音信号幅度较小的位置)或者在语音高 谷(语音信号幅度较大的位置),但却不是每个语音低谷或者语音高谷都产生杂音;(2)同一个铃音文件产生杂音的位置相同;(3)同一个铃音文件,有时候产生杂音,有时候却无杂音,经过统计,产生杂音的概 率为95% ;(4)分别用手机和固定电话播听彩铃,前者产生杂音机率大,后者产生杂音几率通过以上的分析可知,铃音文件本身的某些特征值是触发彩铃平台播放彩铃时产 生杂音的主要原因,而这些特征值与语音信号的能量密切相关;同时,系统本身外的其他环 节也会影响杂音的产生。基于此,本专利技术实施例提出了一种从彩铃源入手的杂音解决方案通过对大量的 产生杂音的铃音文件样本进行分析,得到杂音能量特征值;然后,根据所述杂音能量特征值 对彩铃数据库中的彩铃文件进行分析,确定哪些彩铃文件会产生杂音;对于确定的会产生 杂音的彩铃文件进行调制优化,使得经过调制优化后的彩铃文件经过彩铃平台后,不再产 生杂音,或者,产生杂音的概率降低。参照图1,本专利技术实施例的杂音能量特征值检测的方法,包括如下步骤步骤101 选择一个会产生杂音的铃音文件,并定位出其中产生杂音的语音段;从彩铃数据库中选择铃音文件,并通过彩铃平台进行播放,然后,选中产生杂音的 铃音文件,并记录该铃音文件中产生杂音的语音段。步骤102 计算所选择的铃音文件的平均能量以及其中产生杂音的语音段的平均能量;先计算出铃音文件中每个采样点的瞬时能量,根据所述每个采样点的瞬时能量便 可计算所述平均能量。具体地,各采样点瞬时能量之和除以采样点数即为平均能量。瞬时能量的计算方法有多种,示例性地,本专利技术实施例提供如下三种优选的能量 估计模型(1)绝对值回归模型瞬时能量计算方法=P⑴=(1-a) *P (i_l) +a* | χ (i)其中,P⑴为第i个采样点的瞬时能量,P(I) = x(l) I,x(i)为第i个采样点上 的语音信号,i = 1,2,...,η,η为采样点数目,a是取值在0到1之间的常数,其反映了相 邻采样点的瞬时能量之间的相关性。(2)平法回归模型瞬时能量计算方法=P⑴=(1-a) *P (i_l) +a*x (i) *x (i)其中,P(i)为第i个采样点的瞬时能量,P(I) = x(l) I,x(i)为第i个采样点上 的语音信号,i = 1,2,...,η,η为采样点数目,a是取值在0到1之间的常数,其反映了本文档来自技高网...

【技术保护点】
一种彩铃音质优化的方法,其特征在于,包括:计算铃音文件的平均能量以及其中每个语音帧的平均能量;分别计算每个语音帧的平均能量与铃音文件的平均能量的比值;统计比值小于第一门限或者大于第二门限的语音帧总数;当所述语音帧总数大于第三门限时,则确定该铃音文件会产生杂音;对确定的会产生杂音的铃音文件进行调制优化。

【技术特征摘要】
1.一种彩铃音质优化的方法,其特征在于,包括计算铃音文件的平均能量以及其中每个语音帧的平均能量;分别计算每个语音帧的平均能量与铃音文件的平均能量的比值;统计比值小于第一门限或者大于第二门限的语音帧总数;当所述语音帧总数大于第三门限时,则确定该铃音文件会产生杂音;对确定的会产生杂音的铃音文件进行调制优化。2.如权利要求1所述的方法,其特征在于通过对多个会产生杂音的铃音文件进行分析,来得到所述第一门限和第二门限。3.如权利要求2所述的方法,其特征在于,所述通过对多个会产生杂音的铃音文件进 行分析,来得到所述第一门限和第二门限,包括如下步骤A、选择一个会产生杂音的铃音文件,并定位出其中产生杂音的语音段;B、计算所选择的铃音文件的平均能量以及其中产生杂音的语音段的平均能量;C、分别计算各个产生杂音的语音段的平均能量与铃音文件的平均能量的比值,得到多 个比值,并获取其中的最小比值和最大比值;D、反复执行上述步骤A C,得到多个最小比值和多个最大比值;E、从所述多个最小比值中选取出现次数最多的最小比值,从所述多个最大比值中选取 出现次数最多的最大比值,并将所述出现次数最多的最小比值作为所述第一门限,将所述 出现次数最多的最大比值作为所述第二门限。4.如权利要求1或3所述的方法,其特征在于,按照如下公式计算铃音文件中的采样点 的瞬时能量P⑴=(l-a)*P(i-l)+a*|X⑴|,其中,P(i)为第i个采样点的瞬时能量,P(1)= X (1) I,X (i)为第i个采样点上的语音信号,i = 1,2,. . .,η,η为采样点数目,a是取值在 0到1之间的常数。5.如权利要求1或3所述的方法,其特征在于...

【专利技术属性】
技术研发人员:陈毓锋冯伟辛晓泳吴伟刚肖鑫
申请(专利权)人:中国移动通信集团广东有限公司
类型:发明
国别省市:81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1