用于听力植入物的神经网络音频场景分类器制造技术

技术编号:27756234 阅读:55 留言:0更新日期:2021-03-19 13:53
音频场景分类器对来自音频场景的音频输入信号进行分类,并且包括:预处理神经网络,其被配置成用于基于初始分类参数预处理音频输入信号以产生初始信号分类;以及场景分类器神经网络,其被配置成用于基于场景分类参数处理初始场景分类以产生音频场景分类输出。初始分类参数反映基于第一初始音频训练数据集的神经网络训练,并且场景分类参数反映基于第二分类音频训练数据集的神经网络训练,该第二分类音频训练数据集与第一初始音频训练数据集分离并且与其不同。听力植入物信号处理器被配置成用于处理音频输入信号和音频场景分类输出,以向听力植入物生成刺激信号,以便由患者感知为声音。

【技术实现步骤摘要】
【国外来华专利技术】用于听力植入物的神经网络音频场景分类器相关申请的交叉引用本申请要求来自于2018年7月26日提交的美国临时专利申请62/703,490的优先权,其全部内容通过引用结合于此。
本专利技术涉及诸如耳蜗植入物的听力植入系统,并且具体地说,涉及其中使用的与音频场景分类相关联的信号处理。
技术介绍
正常耳朵如图1所示通过外耳101将声音传输到鼓膜102,该鼓膜移动中耳103的骨骼(锤骨、砧骨和镫骨),这些骨骼使耳蜗104的卵圆窗和圆窗开口振动。耳蜗104是围绕其轴线螺旋缠绕大约两圈半的长窄导管。它包括被已知为前庭阶的上通道和被已知为鼓阶的下通道,该上通道和下通道由蜗管连接。耳蜗104形成直立的螺旋锥体,该螺旋锥体具有被称为蜗轴的中心,听神经113的螺旋神经节细胞驻留于该蜗轴中。响应于由中耳103传输的所接收的声音,填充流体的耳蜗104起到换能器的作用,以生成电脉冲,这些电脉冲被传输到耳蜗神经113,并且最终传输到大脑。当沿耳蜗104的神经基质将外部声音转换成有意义的动作电势的能力方面存在问题时,听力受到损坏。为了改善受损的听力,已经开发了听觉假体。例如,当损伤与中耳103的操作有关时,可以使用常规的助听器以放大的声音的形式向听觉系统提供机械刺激。或者当损伤与耳蜗104相关联时,具有植入的刺激电极的耳蜗植入物可以用由沿着电极分布的多个电极触点递送的小电流电刺激听觉神经组织。图1还示出了典型耳蜗植入物系统的一些部件,包括向外部信号处理器111提供音频信号输入的外部麦克风,在该外部信号处理器中可以实施各种信号处理方案。经处理的信号然后被转换成数字数据格式(诸如数据帧序列)以便传输到植入物108中。除了接收经处理的音频信息之外,植入物108还执行附加的信号处理,诸如纠错、脉冲形成等,并且产生刺激模式(基于所提取的音频信息),该刺激模式通过电极引线109发送到所植入的电极阵列110。通常,该电极阵列110包括在其表面上的多个电极触点112,这些刺激触点提供耳蜗104的选择性刺激。根据上下文,电极触点112也被称为电极通道。在当今的耳蜗植入物中,相对较少数量的电极通道各自与相对较宽的频带相关联,其中每个电极触点112利用具有根据该频带内的信号包络的瞬时幅值导出的电荷的电刺激脉冲寻址一组神经元。在本领域中众所周知的是,耳蜗内的不同位置处的电刺激产生不同频率感知。正常听觉倾听中的潜在机制被称为音质分布原理。在耳蜗植入体使用者中,耳蜗的音质分布组织得到了广泛研究;例如参见Vermeire等人的Neuraltonotopyincochlearimplants:Anevaluationinunilateralcochlearimplantpatientswithunilateraldeafnessandtinnitus,HearRes,245(1-2),2008Sep12p.98-106;以及Electric-acousticpitchcomparisonsinsingle-sided-deafcochlearimplantusers:Frequency-placefunctionsandratepitch,HearRes,309,2014Mar,p.26-35(两者均通过引用整体结合于此)。在一些激励信号编码策略中,跨越所有电极通道以恒定速率施加激励脉冲,而在其他编码策略中,以通道特定的速率施加激励脉冲。可以实施各种特定的信号处理方案来产生电激励信号。在耳蜗植入物领域中公知的信号处理方法包括连续交错采样(continuousinterleavedsampling,CIS)、通道特定采样序列(CSSS)(如美国专利6,348,070中所述,其通过引用结合于此)、谱峰(spectralpeak,SPEAK)、以及压缩模拟(compressedanalog,CA)处理。在CIS策略中,信号处理器仅使用带通信号包络进行进一步处理,即它们包含整个刺激信息。对于每个电极通道,信号包络被表示为恒定重复速率下的双相脉冲序列。CIS的特性特征是对于所有电极通道而言激励速率相等,并且与各个通道的中心频率没有关系。预期的是,脉冲重复速率不是针对患者的时间提示(即,它应该足够高,使得患者不能感知其频率等于脉冲重复速率的音调)。脉冲重复速率通常以大于包络信号的带宽的两倍进行选择(基于奈奎斯特定理)。在CIS系统中,以严格不重叠的序列施加激励脉冲。因此,作为典型的CIS特征,一次只有一个电极通道式激活的,并且整体激励速率相当高。例如,假定18kpps的整体激励速率以及12个滤波器的通道滤波器组,那么每个通道的激励速率为1.5kpps。每个通道的这种激励速率通常足以用于包络信号的充分时间表示。最大整体激励速率受每个脉冲的最小相位持续时间限制。相位持续时间不能任意短,因为脉冲越短,诱发神经元中的动作电位的电流幅值就必须越高,并且由于各种实际原因,电流幅值受到限制。对于18kpps的整体激励速率,相位持续时间为27μs,其接近下限。由Med-El进行的精细结构处理(FineStructureProcessing,FSP)策略在较高频率通道中使用CIS,并使用较低频率、更多顶端电极通道中的带通信号中存在的精细结构信息。在FSP电极通道中,跟踪带通滤波时间信号的过零,并在每个负到正过零处开始通道特定采样序列(CSSS)。通常,CSSS序列施加到多达最顶端的电极通道中的3个上,从而覆盖高达200或330Hz的频率范围。在HochmairI,NoppP,JollyC,SchmidtM,H,GarnhamC,AndersonI,MED-ELCochlearImplants:StateoftheArtandaGlimpseintotheFuture,TrendsinAmplification,vol.10,201-219,2006(其通过引用结合于此)中进一步描述了FSP装置。FS4编码策略与FSP的不同之处在于多达4个顶端通道可以使用其精细结构信息。在FS4-p中,可以在4个FSP电极通道中的任何2个上并行递送激励脉冲序列。利用FSP和FS4编码策略,精细结构信息是给定电极通道的瞬时频率信息,这可以为用户提供改进的听觉感受、更好的语音理解和提高的感知音频质量。例如参见美国专利7,561,709、Lorens等人的"FinestructureprocessingimprovesspeechperceptionaswellasobjectiveandsubjectivebenefitsinpediatricMED-ELCOMBI40+users."Internationaljournalofpediatricotorhinolaryngology74.12(2010):1372-1378、以及Vermeire等人的"Betterspeechrecognitioninnoisewiththefinestructureprocessingcodingstrategy."ORL72.6(2010):305-311,以上全部通过引用全部结合于此。本文档来自技高网...

【技术保护点】
1.一种用于为植入患者体内的听力植入物生成刺激信号的信号处理方法,所述方法包括:/n利用多层神经网络对来自音频场景的音频输入信号进行分类,所述分类包括:/na)使用初始分类参数利用预处理神经网络预处理所述音频输入信号,以产生初始信号分类,以及/nb)使用场景分类参数利用场景分类器神经网络处理所述初始场景分类,以产生音频场景分类输出,/n其中,所述初始分类参数反映基于第一初始音频训练数据集的神经网络训练,并且所述场景分类参数反映基于第二分类音频训练数据集的神经网络训练,所述第二分类音频训练数据集与所述第一初始音频训练数据集分离并且与所述第一初始音频训练数据集不同;/n利用用于生成所述刺激信号的听力植入物信号处理器处理所述音频输入信号和所述音频场景分类输出。/n

【技术特征摘要】
【国外来华专利技术】20180726 US 62/703,4901.一种用于为植入患者体内的听力植入物生成刺激信号的信号处理方法,所述方法包括:
利用多层神经网络对来自音频场景的音频输入信号进行分类,所述分类包括:
a)使用初始分类参数利用预处理神经网络预处理所述音频输入信号,以产生初始信号分类,以及
b)使用场景分类参数利用场景分类器神经网络处理所述初始场景分类,以产生音频场景分类输出,
其中,所述初始分类参数反映基于第一初始音频训练数据集的神经网络训练,并且所述场景分类参数反映基于第二分类音频训练数据集的神经网络训练,所述第二分类音频训练数据集与所述第一初始音频训练数据集分离并且与所述第一初始音频训练数据集不同;
利用用于生成所述刺激信号的听力植入物信号处理器处理所述音频输入信号和所述音频场景分类输出。


2.根据权利要求1的方法,其中,所述预处理神经网络包括连续的递归卷积层。


3.根据权利要求2的方法,其中,所述递归卷积层被实施为递归滤波器组。


4.根据权利要求1所述的方法,其中,所述预处理神经网络包括包络处理块,所述包络处理块被配置成用于计算所述音频输入信号的子带信号包络。


5.根据权利要求1所述的方法,其中,所述预处理神经网络包括池化层,所述池化层被配置成用于所述预处理神经网络内的信号抽取。


6.根据权利要求1所述的方法,其中,所述初始信号分类是多维特征向量。


7.根据权利要求1所述的方法,其中,所述场景分类器神经网络包括全连接神经网络层。


8.根据权利要求1所述的系统,其中,所述场景分类器神经网络包括线性判别分析(LDA)分类器。


9.一种用于为植入患者体内的...

【专利技术属性】
技术研发人员:赖纳·梅尔廷塞米赫·阿贾尔弗洛里安·弗吕奥夫恩斯特·埃施巴赫尔埃哈德·兰克
申请(专利权)人:MEDEL电气医疗器械有限公司
类型:发明
国别省市:奥地利;AT

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利