一种离线盲人视觉辅助方法及装置制造方法及图纸

技术编号：32328390 阅读：23 留言：0更新日期：2022-02-16 18:35

本发明专利技术提供一种离线盲人视觉辅助方法及装置，属于计算机视觉领域。所述方法包括：获取图像，其中，获取的图像为盲人在日常生活中拍摄的图像；提取图像的特征点，利用提取的特征点对信息不完整的图像进行拼接；将拼接后的图像输入基于模型压缩与加速算法处理的图像描述模型，得到图像描述信息。采用本发明专利技术，能够降低图像处理所消耗的时间和能耗。低图像处理所消耗的时间和能耗。低图像处理所消耗的时间和能耗。

全部详细技术资料下载

【技术实现步骤摘要】
一种离线盲人视觉辅助方法及装置

[0001]本专利技术涉及计算机视觉领域，特别是指一种离线盲人视觉辅助方法及装置。

技术介绍

[0002]视觉障碍群体是残疾人群中容易被忽略的庞大人群，眼睛的缺陷让他们无法通过视觉系统来感知外界的信息，从而给日常生活和出行带来极大不便。随着深度学习的发展，图像和语言处理的相关研究发展取得了很大的进步，为如何给盲人提供视觉帮助这一课题带来了新的思路。采用计算机视觉技术，设计一款能够搭载在低成本便携设备的视觉辅助系统成为帮助盲人的迫切需求。
[0003]由于神经网络模型的不断发展，带来了运算量巨大、相关技术难以实际应用等问题。深度神经网络层数的加深使得精度有较大提升，但导致运算量大幅度增加同时还伴随着大量的冗余。造成了实现深度学习网络模型要么需要借助具备强大计算能力的设备、要么需要借助能够传输大量数据的网络，对于实现能够随身携带、帮助视觉障碍人群提供日常服务的小型移动设备带来了巨大的挑战。由于上述原因，当前视觉辅助设备存在价格昂贵、交互性差、无法离线等缺点。
[0004]基于此，在保证模型准确率的同时，尽可能的降低模型的复杂度，成为了一个热门的研究课题。近几年提出的模型压缩方法主要包括：模型剪枝、低秩分解、参数量化、知识蒸馏、重新训练一个紧凑的神经网络等。
[0005]Emily Denton等人提出了一种基于低秩分解调整网络权重的方法[Denton E,Zaremba W,Bruna J,et al.Exploiting Linear Structure With...

【技术保护点】

【技术特征摘要】
1.一种离线盲人视觉辅助方法，其特征在于，包括：获取图像，其中，获取的图像为盲人在日常生活中拍摄的图像；提取图像的特征点，利用提取的特征点对信息不完整的图像进行拼接；将拼接后的图像输入基于模型压缩与加速算法处理的图像描述模型，得到图像描述信息。2.根据权利要求1所述的离线盲人视觉辅助方法，其特征在于，所述提取图像的特征点，利用提取的特征点对信息不完整的图像进行拼接包括：A1，对多张信息不完整的图像进行预处理并提取特征点，其中，特征点提取是在图像中提取出可供比较的特征；A2，筛选出已提取的特征点中的相同或相似特征并进行特征点匹配；A3，优化提纯已匹配的特征点；A4，根据匹配的特征点间的匹配关系，得到变换矩阵，并利用变换矩阵将图像进行相应的变换；A5，将变换后的多张信息不完整的图像拼接在一起，并消除接缝和光线差异，得到具有完整图像信息的图像。3.根据权利要求1所述的离线盲人视觉辅助方法，其特征在于，所述模型压缩与加速算法包括以下步骤：B1，使用Oracle剪枝算法多次评估神经元的重要程度，使被剪枝的图像描述模型代价损失最小；B2，在多次评估神经元重要程度这一操作后，移除最不重要的神经元；B3，对剪枝后的图像描述模型进行微调；B4，返回步骤B1继续执行，直至剪枝完成。4.根据权利要求3所述的离线盲人视觉辅助方法，其特征在于，多次评估神经元重要程度这一操作后，被剪枝的图像描述模型的代价函数表示为：其中，i为执行的评估次数，N表示执行评估神经元重要程度的总次数，M为每次评估后选取的特征图的个数，W表示图像描述模型的参数集合，W'表示剪枝后的图像描述模型参数集合，C(D|W')表示剪枝后的图像描述模型的损...

【专利技术属性】
技术研发人员：郭宇，陈悦，谢圆琰，
申请(专利权)人：北京科技大学顺德研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人