System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于对耳道声波反射信号处理实现的口型识别方法及系统技术方案_技高网

一种基于对耳道声波反射信号处理实现的口型识别方法及系统技术方案

技术编号:44069028 阅读:7 留言:0更新日期:2025-01-17 16:06
本发明专利技术属于耳道声波反射信号处理领域,公开了一种基于对耳道声波反射信号处理实现的口型识别方法及系统,消除信号中噪声和干扰成分,并声波信号进行切割、裁剪等预处理;得到两个时间序列之间的最佳规整路径;提取出有用的信息;对信号进行预处理和特征提取;利用傅里叶变换、频域能量计算和特征值计算等提取声波信号特征;KNN分类器分类。本发明专利技术为提高口型识别的精度和鲁棒性,探索耳道声波反射信号处理在口型识别中的应用潜力,以及推动对耳道声波反射信号处理实现的口型识别技术在实际应用中的发展提供了理论和技术支持。

【技术实现步骤摘要】

本专利技术属于但不限于耳道声波反射信号处理,尤其涉及一种基于对耳道声波反射信号处理实现的口型识别方法及系统


技术介绍

1、随着信息技术的快速发展,人机交互方式逐渐从传统的键盘、鼠标向更为自然、直观的方式转变。语音识别、手势识别等技术的广泛应用,使得人们可以更加便捷地与计算机进行交互。现有的人机交互技术主要如下:一、语音交互系统。此系统基于语音识别与合成技术,允许用户通过自然语言与机器进行交互。用户以口语形式发出指令或询问,系统则通过语音反馈进行回应。然而,这一系统面临着语音识别准确率的挑战,尤其在嘈杂环境或面对方言口音时,其识别效果大打折扣。此外,语音交互还涉及到自然语言理解的复杂性,如何准确理解用户的意图并作出恰当回应,也是当前技术需要攻克的一大难题。二、虚拟现实(vr)与增强现实(ar)交互技术。这两种技术通过模拟或增强现实环境,为用户提供一个沉浸式的交互体验。用户可以在虚拟世界中与机器进行交互,感受前所未有的沉浸感。然而,vr与ar技术的实现需要高性能的硬件支持,且设备成本较高。此外,长时间使用这些设备会对用户造成不适或健康风险,如视觉疲劳、头晕等。因此,如何在保证沉浸感的同时,降低设备成本并减少用户不适,是vr与ar技术需要解决的关键问题。这些技术仍存在一定的局限性,因此,探索一种新型的、更加精准的人机交互方式显得尤为重要。

2、基于耳道反射的声波信号实现的口型识别技术,作为一种新型的交互方式,具有重要的研究价值和应用前景。近年来,国外对人机接口开始高度关注和重视,成为了诸多学者关注的重点,取得了较多的研究成果。筑波大学的研究团队对耳道内气压进行监测并与面部相关动作进行匹配,进而设计了一个名为canalsense的下颌、面部与头部运动识别系统,利用嵌入耳机的气压计来识别与面部相关的动作。他们发现,与面部相关的运动改变了耳道内的气压,这种改变取决于运动的类型和程度。他们还发现,这种特征变化可以用来识别面部相关运动。并了一个实验来测量识别的准确性。结果显示,对于11个与面部相关的动作,每个用户的识别准确率为87.6%,对于4个张嘴级别,每个用户的识别准确率为87.5%。

3、格拉茨技术大学的研究团队从耳内压力信号中提取简单的时间特征并设计了一个识别舌头动作(向左、右、前)的系统barton。它是一款基于气压计的低功耗和鲁棒的舌运动传感系统,使用低于50hz的低采样率,并且仅从耳内压力信号中提取简单的时间特征,证明了在低功耗下区分重要的舌头动作是可行的。并且他们为barton设计了一个原型,其中集成了用于耳内压力感测的商用耳机和用于信号处理的arm微控制器。评估表明,barton的分类准确率为94%,功耗为8.4mw,达到了相当的准确率,但功耗比最先进的基于麦克风的解决方案低44倍。

4、马里兰大学的研究团队设计了一款名为tongue-n-cheek的新型非接触式传感器,使用微雷达阵列捕捉舌头的动作。微型雷达阵列充当接近传感器,并在参与者做出舌头动作时捕捉肌肉运动。tongue-n-cheek使用一种新颖的信号处理算法将这些动作转换成手势。我们演示了舌头-脸颊的功效,并表明我们的系统可以可靠地推断手势,准确率为95%,延迟低。

5、华盛顿大学的研究团队设计了一种名为tonguesee的非侵入式舌机接口,它可以使用来自皮肤表面的肌电图(emg)信号识别一组丰富的舌手势。他们通过对八名参与者的六种舌头姿势进行分类的实验研究,证明了tonguesee的可行性和鲁棒性。使用三突起前导码设计,tongue-see实现了94.17%的分类准确率和每秒0.000358的误报概率。

6、近年来国内也对人机接口高度重视与关注,并有诸多学者对于非侵入式的人机接口进行了深入的研究。北京理工大学团队设计了一款名为canalscan的非侵入式舌颌运动识别系统,使用扬声器和麦克发送声音信号,然后捕捉它的反射,并得出由舌颌运动引起的耳道变形的独特模式。采用支持向量域描述的动态分割方法对舌颌运动进行分割。为了克服多径反射中的传感器位置敏感缺陷和耳道形状敏感缺陷,他们首先设计算法来帮助用户将声学传感器调整到相同的有效区域。然后,他们提出了一种数据转换机制,以减少耳道形状和传感器与耳道之间的相对位置的差异的影响。canalscan探索了12个独特且一致的特征,并应用随机森林分类器来区分舌颌运动。对20名参与者的大量实验表明,canalscan实现了对6种舌颌运动的可靠的识别,并且对各种使用场景是鲁棒的,并且可以推广到新用户,而无需重新训练和适应。

7、山东大学团队一种名为tongible的交互技术,该技术使用舌头作为输入,而无需任何机械或电磁辅助设备。在tongible中,rgb摄像头捕捉六种舌头动作,并用作基本的控制动作。近年来,人们已经研究了使用舌头为没有上肢功能或上肢功能最少的人使用计算机。这些研究主要集中在利用机械或电磁设备。然而,这些设备必须与人们的口腔接触,并导致卫生问题或意外摄入。这项工作提出了初步的可用性测试表明,tongible在指向和文本输入方面对有灵巧障碍的人是有效的。

8、鉴于上述分析,现有技术存在的急需解决的技术问题为:

9、国内外针对人机接口的研究已经十分深入,大量研究已经说明了耳道内气压、反射的声波以及面部的肌肉电流等信号与舌头、上下颌、面部、头部的运动有关,但是缺少对于口型变化与耳道的声波反射信号进行的深入的分析和研究。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了一种基于对耳道声波反射信号处理实现的口型识别方法及系统。

2、本专利技术是这样实现的,一种基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,基于对耳道声波反射信号处理实现的口型识别方法,该方法具体包括:

3、s1:信号预处理,消除信号中的噪声和干扰成分,并声波信号进行切割、裁剪等预处理;

4、s2:动态时间规整,得到两个时间序列之间的最佳规整路径;

5、s3:卷积变换,提取出有用的信息;

6、s4:小波变换,对信号进行预处理和特征提取;

7、s5:特征提取,利用傅里叶变换、频域能量计算和特征值计算等提取声波信号特征;

8、s6:knn分类器分类。

9、进一步,所述s1,预处理操作包括滤波、降噪、归一化等步骤,对于采集到的声波信号进行切割、裁剪等预处理,区分口型运动阶段与静止阶段。

10、进一步,所述s2,动态时间规整算法的实现主要包括以下几个步骤:

11、(1)初始化规整路径:算法开始时,需要确定规整路径的起点和终点,通常情况下,规整路径的起点为两个时间序列的第一个点,终点为最后一个点;

12、(2)计算累积距离:从规整路径的起点开始,逐步计算两个时间序列对应点之间的距离,并累加到当前位置的累积距离中,这里的距离计算可以采用欧氏距离、曼哈顿距离等不同的度量方式;

13、(3)寻找最佳路径:在每个位置上,本文档来自技高网...

【技术保护点】

1.一种基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,该方法具体包括:

2.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S1,预处理操作包括滤波、降噪、归一化等步骤,对于采集到的声波信号进行切割、裁剪等预处理,区分口型运动阶段与静止阶段。

3.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S2,动态时间规整算法的实现主要包括以下几个步骤:

4.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S3,声波信号卷积变换的算法步骤主要包括以下几个方面:

5.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S4,小波变换算法主要包括以下几个步骤:

6.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S5,声波信号特征提取的算法流程主要包括:

7.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述S6,利用KNN分类器进行分类,步骤如下:

8.一种基于如权利要求1-7所述基于对耳道声波反射信号处理实现的口型识别系统,其特征在于,该系统具体包括:

...

【技术特征摘要】

1.一种基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,该方法具体包括:

2.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述s1,预处理操作包括滤波、降噪、归一化等步骤,对于采集到的声波信号进行切割、裁剪等预处理,区分口型运动阶段与静止阶段。

3.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述s2,动态时间规整算法的实现主要包括以下几个步骤:

4.如权利要求1所述基于对耳道声波反射信号处理实现的口型识别方法,其特征在于,所述s3,声波信号卷积变换的...

【专利技术属性】
技术研发人员:孙凤佑王璟琪李明禄
申请(专利权)人:浙江师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1