本发明专利技术涉及一种改进用户对输入声音感知的方法。进一步涉及一种音频处理设备及其应用。本申请的目标在于提高用户感知的声音信号的音质,例如听力损伤的用户。所述方法包括:a)定义低频范围和高频范围之间的临界频率fcrit;b)分析在低于和高于所述临界频率的多个频带中的输入声音;c)定义低于所述临界频率fcrit的截止频率fcut;d)识别高于所述截止频率fcut的源频带;e)提取所述源频带的包络;f)识别低于所述临界频率fcrit的相应目标频带;g)提取所述目标频带的相位;h)将所述源频带的包络于所述目标频带的相位组合。这具有以下优点:提高音质,并能潜在地进一步提高频率变换中的清晰度,例如频率降低系统。本发明专利技术能够,例如用于通信设备中,例如电话或听力设备中,例如助听器,头戴式受话器、头戴耳机、主动听力保护设备或其组合。
【技术实现步骤摘要】
本专利技术涉及声音感知的改进,例如语音清晰度,特别地涉及对人对声音的感知的改进,例如听觉受损的人。本专利技术特别地涉及改进用户感知输入声音的方法。本申请还涉及一种音频处理设备及其使用。本申请进一步涉及一种包括处理器的数据处理系统以及用于使处理器执行至少方法的部分步骤的程序编码方式,还涉及一种存储程序编码的计算机可读介质。本专利技术在一些应用中是有用的,例如在诸如电话的通信设备、或诸如助听器、头戴式受话器、头戴式耳机、主动防声设备的听力设备,或其组合中。
技术介绍
下述现有技术涉及本申请的一个应用领域,助听器。频率压缩或频率变换的基本思想通常是通过变换使用传统放大对于某人无法听到的频率使其可被听到。事实是这是不可能的——通过传统助听器——在某些频率补偿听觉损伤可能有多种原因。两个最可能的原因是1)由于反馈振荡问题放大不可能变得很高; 或者幻病人有“死区”,此处听力能力严重下降或不存在。死区理论上指其中感觉细胞(内毛细胞)不工作的基底膜区域。然后极强的方法不能帮助该基底膜位置。频率降低或变换在这些情况下可能是一种解决方式,其中在不可听频率的信息被变换到可听的范围。非线性频率压缩(NFC)目前在不同频率降低技术中给出了最好的结果(参见 不同信号处理方法的综述)。NFC在一些情况下示出对听力受损用户的语音清晰度的提升。在NFC中,将频率轴分成线性部分和压缩部分(例如图Ia示出了分别在低于和高于预定截止频率f。ut的非压缩部分(线性fin = fout)和压缩部分(fin > f。ut))。W02005/015952(Vast Audio)描述了一种旨在改进听力受损对象的空间听力能力的系统。提出的系统丢弃了每第η个频率分析带并将剩下的部分推到一起,从而应用频率压缩。由此,假设空间凸出高频线索在较低频率再现。ΕΡ1686566Α2 (Phonak)涉及一种信号处理设备,其包括将至少部分输入信号的频谱表达变换成变换的输出频率的装置,频率变换装置被配置为处理部分输入信号频谱表达使得存在于输入信号的频谱表达中的相位关系在频谱表达的变换部分中基本上保持不变。ΕΡ2091266Α1 (Oticon)涉及一种将临时精细的基于结构的信息变换为临时基于包络的信息的变换,其中以将(低频)临时精细的结构线索移动到较高频率范围的方式将低频源频带变换到高频目标频带。因此提高了听力受损用户获得临时精细的基于结构线索的能力。
技术实现思路
本专利技术的概念能够,例如用于具有如图Ia所示的压缩机制的系统,或者压缩整个频率范围、或者一些其他频率变换原理的系统(参见图3中压缩/扩展机制的例子)。在本专利技术中使用术语“频率变换”、“频率降低”、“频率压缩”以及“频率扩展”。术语“频率变换”意指改变信号频谱的多种不同方法,例如“频率降低”或“频率压缩”或甚至 “频率扩展”。术语“频率压缩”指的是将相对较宽的源频率范围压缩到相对较窄的目标频率范围的过程,例如通过丢弃每第η个频率分析频带并在频域中将剩余的频带“推”到一起。 相应地,术语“频率扩展”指的是将相对较窄的源频率范围扩展到相对较宽的目标频率范围的过程,例如通过在变换到目标频带时使源频带变宽和/或创建多个合成目标频带以填充额外的频率范围。术语“频率降低”指的是将高频源范围移动到较低频目标范围的过程。在某些现有技术应用中,其出现而无需丢弃任何包含在变换高频频带中的频谱信息(即变换的较高频率或者以较低频率完全替代或者与较低频率混合)。然而,这并非本专利技术的情况。 本专利技术典型地通过频率降低应用频率压缩,其中(较高频率)源频带的包络与(较低频率) 源频带的相位相混合。通常,一个或多个相对较高频率源频带向下变换到一个或多个较低频率目标频带。通常,一个或多个甚至更低的频带保持不受该变换影响。进一步,一个或多个甚至更高的频带可能不被认为是源频带。在现有技术的频率降低设备或机制中,包络和精细结构(相位)信息都被移动。这导致声音质量劣化并严重限制系统的灵活性。例如,人听觉系统对低频相位信息十分敏感 (例如,低于1. 5kHz的频率),并且当前在低频处不采用频率降低。本申请的目标在于增加用户、例如听力受损用户感知的声音信号的声音质量。进一步的目标在于提高清晰度,例如在频率降低系统中。进一步的目标在于增加提供用于不同类型听力损伤的适配的可能性。进一步的目标在于改进通过传输信道发送和接收的音频信号的声音清晰度。本专利技术的目标通过所附权利要求描述并如下描述的专利技术来实现。本专利技术的主要元素是变换输入声音信号的包络信息,而不变换其相位信息。提高输入声音的用户感知的方法本专利技术的一个目标通过提高输入声音的用户感知的方法来实现。该方法包括,a)定义低频范围和高频范围之间的临界频率fCTit ;b)在多个低于和高于所述临界频带的频带中分析输入声音;c)定义低于所述临界频率fCTit的截止频率f。ut ;d)识别高于所述截止频率f。ut的源频带;e)提取所述源频带的包络;f)识别低于所述临界频率fCTit的相应目标频带;g)提取所述目标频带的相位h)将所述源频带的包络和所述目标频带的相位组合。这具有提高声音质量的优点,并具有进一步提高频率变换,例如频率降低系统中语音清晰度的可能。该术语“输入声音的感知”用来包括听觉和语音清晰度。在一个实施例中,临界频率小于8kHz,例如小于5kHz,例如小于3kHz,例如小于 2. 5kHz,例如小于2kHz,例如小于1. 5kHz。在一个实施例中,目标频带位于所述截止频率f。ut和临界频率fCTit之间。在一个实施例中,截止频率位于从0. OlkHz到5kHz的范围中,例如小于4kHz,例如小于2. 5kHz,例如小于2kHz,例如小于1. 5kHz,例如小于IkHz,例如小于0. 5kHz,例如小于 0.02kHz ο在一个实施例中,源频带位于所述截止频率f。ut和最大源频带频率fmax_s之间。在一个实施例中,最大源频带频率fmax_s小于12kHz,例如小于1 OkHz,例如小于 8kHz,例如小于6kHz,例如小于3kHz,例如小于2kHz,例如小于1. 5kHz。在一个实施例中,最大源频带频率fmax_s小于输入声音信号的最大输入频率f^—。在一个实施例中,临界频率f。Ht定义为与用户的听力能力相关,例如作为用户具有退化听力能力之上的频率。给定频率范围中的退化听力能力在本文中指的是比在该频率范围内平均普通听觉听众的听力阈值低多于IOdB SPL(SPL =声音压力等级(Sound Pressure Level))(例如低多于 20dB)。在一个实施例中,临界频率f。Ht定义为依赖于用户的听觉能力和可用增益。可用增益依赖于给定的听觉设备(例如,专用助听器),专门适用于用户,声反馈条件等。在一个实施例中,临界频率f。Ht定义为依赖于将要在传输信道中传输的带宽的上限频率,fcrit例如等于该上限频率。在一个实施例中,(输出)频率范围低于截止频率f。ut(fin = f。ut)不被压缩或扩展(参见例如图北)。在一个实施例中,输出频率范围在低于截止频率f。ut的频率处被压缩 (参见例如图3c,标记为&(fin)的曲线)。替代地,输出频率范围可在低于截止频率f-的频率处被扩展(参见例如图北,标记为1 本文档来自技高网...
【技术保护点】
cut的源频带;e)提取所述源频带的包络;f)识别低于所述临界频率fcrit的相应目标频带;g)提取所述目标频带的相位;h)将所述源频带的包络于所述目标频带的相位组合。1.一种提高输入声音的用户感知的方法,所述方法包括:a)定义低频范围和高频范围之间的临界频率fcrit;b)分析在低于和高于所述临界频率的多个频带中的输入声音;c)定义低于所述临界频率fcrit的截止频率fcut;d)识别高于所述截止频率f
【技术特征摘要】
...
【专利技术属性】
技术研发人员:马克斯·霍姆伯格,托马斯·考尔伯格,扬马克·德哈恩,
申请(专利权)人:奥迪康有限公司,
类型:发明
国别省市:DK
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。