一种基于口型执行预设操作的方法及装置制造方法及图纸

技术编号：10733826 阅读：106 留言：0更新日期：2014-12-10 10:47

本发明专利技术实施例提供了一种基于口型执行预设操作的方法及装置，涉及数据处理领域，用来在预设操作较少的情况下，根据唇动图像序列执行相应操作时，降低计算复杂度，一定程度上减少计算资源的浪费。所述方法包括：获取唇动图像序列；对唇动图像序列进行波形数据提取，获得口型波形数据；从波形数据库中查找出与口型波形数据相似度最大的标准波形数据，并确定为匹配波形数据；执行匹配波形数据对应的操作指令。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术实施例提供了一种基于口型执行预设操作的方法及装置，涉及数据处理领域，用来在预设操作较少的情况下，根据唇动图像序列执行相应操作时，降低计算复杂度，一定程度上减少计算资源的浪费。所述方法包括：获取唇动图像序列；对唇动图像序列进行波形数据提取，获得口型波形数据；从波形数据库中查找出与口型波形数据相似度最大的标准波形数据，并确定为匹配波形数据；执行匹配波形数据对应的操作指令。【专利说明】一种基于口型执行预设操作的方法及装置
本专利技术涉及数据处理领域，尤其涉及一种基于口型执行预设操作的方法及装置。
技术介绍
随着计算机技术以及数据处理技术的发展，语音识别技术应运而生。语音识别技术就是一种让机器把语音信号转变为相应的文字的方法，它已经应用到日常生活的方方面面，比如基于语音识别的车载导航系统、Siri (苹果智能语音助手)等。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。首先通过麦克风采集包含用户声音的音频信号，接着对该音频信号进行降噪处理和模数转换获得数字信号，然后提取数字信号中的特征参数，将数字信号中的特征参数与文字特征参数库中的信息进行匹配，查找出该音频信号对应的文字，最后根据文字代表的内容执行相应的操作。语音识别技术应用到移动终端时，由于移动终端所处的环境复杂，获取的音频信号中可能包含大量的噪声信号，使得经过降噪处理和模数转换后的数字信号中仍然携带有噪声信号的特征，那么对数字信号进行特征提取后的特征参数并不能代表用户声音原本代表的信息的特征，最终根据该特征参数匹配出的文字与用户声音代...

【技术保护点】
一种基于口型执行预设操作的方法，其特征在于，包括：获取唇动图像序列；对所述唇动图像序列进行波形数据提取，获得口型波形数据；从波形数据库中查找出与所述口型波形数据相似度最大的标准波形数据，并确定为匹配波形数据；所述波形数据库预先存储有至少一个标准波形数据，以及与所述至少一个标准波形数据中每一标准波形数据对应的操作指令；执行所述匹配波形数据对应的操作指令。

【技术特征摘要】

【专利技术属性】
技术研发人员：张强，
申请(专利权)人：青岛海信移动通信技术股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人