唇部图像采集装置、唇语识别系统及在线唇语交互系统制造方法及图纸

技术编号：31700638 阅读：69 留言：0更新日期：2022-01-01 11:01

本发明专利技术公开了一种唇部图像采集装置，包括头戴式面罩、摄像头和信号传输系统；摄像头和信号传输系统嵌入在面罩内；面罩内设有使摄像头与佩戴者唇部之间存在间隙的支撑架；摄像头拍摄采集佩戴者唇部视频图像数据，并将采集的唇部视频图像数据通过信号传输系统向外部设备发送。本发明专利技术还公开了一种唇语识别系统及在线唇语交互系统。本发明专利技术的唇部图像采集装置利用嵌入式摄像头对唇部及附近区域进行摄像采集，相比目前普遍使用的远距离固定位置采集方式，这种面罩具有稳定性高，抗干扰能力强等优点。本发明专利技术的唇语识别系统，可解决现有的时序特征提取结构往往具有结构复杂易产生过拟合、位置信息学习效果较差等缺陷。位置信息学习效果较差等缺陷。位置信息学习效果较差等缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
唇部图像采集装置、唇语识别系统及在线唇语交互系统

[0001]本专利技术涉及一种涉及人机交互、深度学习、语音通信、自然语言等领域，特别涉及一种唇部图像采集装置、唇语识别系统及在线唇语交互系统。

技术介绍

[0002]目前，人与人、人与物之间的交流、交互几乎都是通过发声系统来完成的，而在一些特定场景下，人们无法直接通过空气等介质进行信息交互，因此如何让机器具备人体器官功能识别出人所想表达的意图成为了机器学习、计算机技术等领域的重要研究课题之一。近年来，这一领域采用的方法主要是利用图像和肌电等模态信号进行说话识别，虽然在部分场景下精准度不如音频信号，但是得益于其不发声、不易察觉的特点，缄默通信相关技术被广泛用于医疗康复、助残养老、特种作战等领域，其应用价值非常广阔。而缄默通信技术中最为重要的组成部分就是唇语识别技术，也叫唇读技术。唇语识别是一种利用人嘴唇动作的变化来判断说话人意图的方法，唇语识别技术从早期的手动提取特征并局限于小部分的文本集，逐渐发展成为一个拥有大规模数据集、广泛应用深度学习框架、多模态交叉融合识别的成熟系统。
[0003]一个成熟稳定的识别系统离不开大规模的数据，而对大规模数据的拟合则需要一个合理高效的模型，由于近年来深度学习在诸多任务中都展现出良好性能，因此如何在现有的深度学习模型框架下对部分结构进行了改进，从而让唇语识别技术可以有更高效的性能，是本专利技术要解决的技术问题。

技术实现思路

[0004]本专利技术为解决公知技术中存在的技术问题而提供一种唇部图像采集装置、唇语识别...

【技术保护点】

【技术特征摘要】
1.一种唇部图像采集装置，其特征在于，包括头戴式面罩、摄像头和信号传输系统；摄像头和信号传输系统嵌入在面罩内；面罩内设有使摄像头与佩戴者唇部之间存在间隙的支撑架；摄像头拍摄采集佩戴者唇部视频图像数据，并将采集的唇部视频图像数据通过信号传输系统向外部设备发送。2.根据权利要求1所述的唇部图像采集装置，其特征在于，面罩采用遮光材料制作。3.根据权利要求1所述的唇部图像采集装置，其特征在于，信号传输系统为无线信号传输系统。4.根据权利要求1所述的唇部图像采集装置，其特征在于，支撑架为弧形支撑架。5.一种唇语识别系统，其特征在于，该唇语识别系统包括权利要求1至4任一所述的唇部图像采集装置。6.根据权利要求5所述的唇语识别系统，其特征在于，该唇语识别系统还包括采用python编程语言、多进程实现库及前端界面框架Tkinter搭建的数据处理系统；数据处理系统，其包括用于识别唇语的深度学习模型，其将唇部图像采集装置采集的唇部视频图像数据，通过深度学习模型进行唇语识别。7.根据权利要求6所述的唇语识别系统，其特征在于，深度学习模型包括前端网络和后端网络；前端网络包括残差网络；后端网络包括依次连接的双向GRU和Transformer...

【专利技术属性】
技术研发人员：罗韬，杨恒，史再峰，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人