一种可见即可说的车载终端语音识别方法及系统技术方案

技术编号：39513949 阅读：9 留言：0更新日期：2023-11-25 18:50

本发明专利技术公开了一种可见即可说的车载终端语音识别方法及系统，其中方法，包括：判断车载终端中的每个页面控件是否有对应的文本标识，如果没有，则为页面控件设置文本标识；如果有，则判断已有的文本标识是否存在冲突或信息不全的现象，如果存在，则对冲突或信息不全的现象进行文本标识修正；获取待识别的语音信号，将待识别的语音信号进行噪声去除，将去噪后的语音信号转换为文本数据；对所有的页面控件，按照从左到右，从上到下的顺序采用正整数进行标号；对文本数据进行识别，按照识别的结果对相应标号的页面控件进行控制

全部详细技术资料下载

【技术实现步骤摘要】
一种可见即可说的车载终端语音识别方法及系统

[0001]本专利技术涉及语音识别
，特别是涉及一种可见即可说的车载终端语音识别方法及系统
。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术
。
[0003]语音交流是人与人之间最直接有效的交流沟通方式，语音识别技术就是让人与机器之间也能达到简单高效的信息传递
。
目前语音识别技术已经深入我们生活的方方面面，比如手机语音输入法
、
语音助手
、
语音检索等应用
。
[0004]在智能出行方面，语音技术也有很大的用处，而且在车载领域是刚需
。
从最早的语音导航，都如今的车载语音控制系统，语音系统提供了包括车辆控制
、
社交和娱乐等多种全新的交互方式，让驾驶员的注意力不再集中在各种繁杂的设置以及按钮上，在提升驾驶体验的同时能够在一定程度上增强行车的安全性
。
与传统车载系统通过按键或者屏幕操控不同，多模态融合检测，智能语音交互，多屏互动手势操作等一系列技术，将成为下一代智能座舱的标配，由于车内环境相对稳定，语料不至于太发散，语音识别率高，因此座舱内是部署语音交互的极佳落地场景
。
[0005]可见可说是指，在系统内可手动点击的控件，基于安卓系统无障碍服务的能力，并结合识别语义热词搭建，可以达到通过语音说法对控件做模拟点击的效果，不影响原本应用
APP
的实现...

【技术保护点】

【技术特征摘要】
1.
一种可见即可说的车载终端语音识别方法，其特征是，包括：判断车载终端中的每个页面控件是否有对应的文本标识，如果没有，则为页面控件设置文本标识；如果有，则判断已有的文本标识是否存在冲突或信息不全的现象，如果存在，则对冲突或信息不全的现象进行文本标识修正；获取待识别的语音信号，将待识别的语音信号进行噪声去除，将去噪后的语音信号转换为文本数据；对所有的页面控件，按照从左到右，从上到下的顺序采用正整数进行标号；对文本数据进行识别，按照识别的结果对相应标号的页面控件进行控制；其中，在对文本数据进行识别的过程中，判断文本数据是否超过设定长度，如果超过，则采用字符串模糊匹配算法对文本进行匹配，将文本数据与文本标识进行相似度计算，将相似度最大值所对应的文本标识作为筛选的文本标识；按照筛选的文本标识控制相应的页面控件进行动作
。2.
如权利要求1所述的一种可见即可说的车载终端语音识别方法，其特征是，所述判断已有的文本标识是否存在冲突或信息不全的现象，其中，冲突，是指：同一页面下，对两个不同作用的控件做了相同的标注；信息不全，是指，对控件没有做文本标识，或文本标识不正确
。3.
如权利要求1所述的一种可见即可说的车载终端语音识别方法，其特征是，所述对冲突或信息不全的现象进行文本标识修正，具体包括：修改冲突的标识，确保页面每个开关按钮都有唯一的标识
。4.
如权利要求1所述的一种可见即可说的车载终端语音识别方法，其特征是，获取待识别的语音信号，将待识别的语音信号进行噪声去除，具体包括：通过回声消除算法，将待识别的语音信号进行噪声去除
。5.
如权利要求1所述的一种可见即可说的车载终端语音识别方法，其特征是，判断文本数据是否超过设定长度，如果是，则采用字符串模糊匹配算法对文本进行匹配，具体包括：
CPU
将文本数据与预先标注的文本标识进行比对，如果比对匹配率达到设定阈值，...

【专利技术属性】
技术研发人员：唐燕祥，韦彩霞，程志恒，
申请(专利权)人：奇瑞汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人