一种可自定义指令识别的语音拍照系统技术方案

技术编号：13672321 阅读：132 留言：0更新日期：2016-09-07 20:32

本发明专利技术公开了一种可自定义指令识别的语音拍照系统，所述系统包括语音指令采集模块、音频信号预处理模块、音频信号特征提取模块、语音定义训练模块和语言识别控制模块，所述语音指令采集模块采集语音指令的音频信号；采集到的音频信号依次经过音频信号预处理模块和音频信号特征提取模块进行预处理和特征提取；语音定义训练模块建立语音特征模式库，将经过预处理和特征提取的音频信号所对应的语音指令均录入所述特征模式库；语言识别控制模块通过搜索最小匹配误差得到识别结果，执行相应的语音指令。本发明专利技术所公开的技术方案一方面可以提升语音拍照功能的实用性，另一方面也实现了用户个性化的定制，增强了用户与设备之间的交互性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术公开了一种可自定义指令识别的语音拍照系统，涉及音频信号处理

技术介绍
随着信息产业的飞速发展，智能化的产品已广泛受到人们的青睐。语音识别作为人机交互的一项关键技术，其应用已经涉及我们生活的诸多方面，例如车载语音导航、手机声控拨号、家电控制及语音数据库检索服务等等。在智能化产品市场中，手机因其轻便、灵巧及其丰富的APP功能占有重要一席，其中，各种各样的拍照软件得到了广大用户的青睐，其功能也不在不断地演变和完善。不难发现，在众多拍照软件中基本都有语音拍照的功能，其主要通过语音命令的识别来控制相机拍照程序的执行，这一设计给手机用户带来了更多的方便和交互体验。但是，这些语音命令一般都由系统指定，也就是说用户只能通过固定的语音指令来实现语音拍照。这必然会造成一定的局限，首先，每个人的说话方式不同、发音不同以及方言的存在都有可能导致采用的指定语音命令识别不成功。其次，当用户希望通过语音来实现自拍的时候，考虑到每个人的笑容也不是千篇一律的，因此，使用同一个语音指令实现的自拍效果可能不能同时满足每个用户的要求，例如：有的人用“茄子”这个语音指令时可以达到最美的微笑，而有的人则喜欢用“番茄”、“Cheese”或“Kimci”(韩语中“泡菜”的发音)等等。现有技术中还比较少见用户可自定义语音指令进行识别和控制相机拍照的方法或系统。
技术实现思路
本专利技术所要解决的技术问题是：针对现有技术的缺陷，提供一种可自定义指令识别的语音拍照系统。本专利技术为解决上述技术问题采用以下技术方案：一种可自定义指令识别的语音拍照系统，所述系统包括语音指令采集模块、音频信号预处...

【技术保护点】
一种可自定义指令识别的语音拍照系统，其特征在于：所述系统包括语音指令采集模块、音频信号预处理模块、音频信号特征提取模块、语音定义训练模块和语言识别控制模块，所述语音指令采集模块采集语音指令的音频信号；采集到的音频信号依次经过音频信号预处理模块和音频信号特征提取模块进行预处理和特征提取；语音定义训练模块建立语音特征模式库，将经过预处理和特征提取的音频信号所对应的语音指令均录入所述特征模式库；语言识别控制模块将经过预处理和特征提取的音频信号所对应的语音指令与特征模式库中存储的语音指令进行失真度测量，通过搜索最小匹配误差得到识别结果，执行相应的语音指令。

【技术特征摘要】
1.一种可自定义指令识别的语音拍照系统，其特征在于：所述系统包括语音指令采集模块、音频信号预处理模块、音频信号特征提取模块、语音定义训练模块和语言识别控制模块，所述语音指令采集模块采集语音指令的音频信号；采集到的音频信号依次经过音频信号预处理模块和音频信号特征提取模块进行预处理和特征提取；语音定义训练模块建立语音特征模式库，将经过预处理和特征提取的音频信号所对应的语音指令均录入所述特征模式库；语言识别控制模块将经过预处理和特征提取的音频信号所对应的语音指令与特征模式库中存储的语音指令进行失真度测量，通过搜索最小匹配误差得到识别结果，执行相应的语音指令。2.如权利要求1所述的一种可自定义指令识别的语音拍照系统，其...

【专利技术属性】
技术研发人员：王丹丹，臧娴，
申请(专利权)人：金陵科技学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人