一种可见即可说的车载终端语音识别方法及系统技术方案

技术编号:39513949 阅读:9 留言:0更新日期:2023-11-25 18:50
本发明专利技术公开了一种可见即可说的车载终端语音识别方法及系统,其中方法,包括:判断车载终端中的每个页面控件是否有对应的文本标识,如果没有,则为页面控件设置文本标识;如果有,则判断已有的文本标识是否存在冲突或信息不全的现象,如果存在,则对冲突或信息不全的现象进行文本标识修正;获取待识别的语音信号,将待识别的语音信号进行噪声去除,将去噪后的语音信号转换为文本数据;对所有的页面控件,按照从左到右,从上到下的顺序采用正整数进行标号;对文本数据进行识别,按照识别的结果对相应标号的页面控件进行控制

【技术实现步骤摘要】
一种可见即可说的车载终端语音识别方法及系统


[0001]本专利技术涉及语音识别
,特别是涉及一种可见即可说的车载终端语音识别方法及系统


技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术

[0003]语音交流是人与人之间最直接有效的交流沟通方式,语音识别技术就是让人与机器之间也能达到简单高效的信息传递

目前语音识别技术已经深入我们生活的方方面面,比如手机语音输入法

语音助手

语音检索等应用

[0004]在智能出行方面,语音技术也有很大的用处,而且在车载领域是刚需

从最早的语音导航,都如今的车载语音控制系统,语音系统提供了包括车辆控制

社交和娱乐等多种全新的交互方式,让驾驶员的注意力不再集中在各种繁杂的设置以及按钮上,在提升驾驶体验的同时能够在一定程度上增强行车的安全性

与传统车载系统通过按键或者屏幕操控不同,多模态融合检测,智能语音交互,多屏互动手势操作等一系列技术,将成为下一代智能座舱的标配,由于车内环境相对稳定,语料不至于太发散,语音识别率高,因此座舱内是部署语音交互的极佳落地场景

[0005]可见可说是指,在系统内可手动点击的控件,基于安卓系统无障碍服务的能力,并结合识别语义热词搭建,可以达到通过语音说法对控件做模拟点击的效果,不影响原本应用
APP
的实现逻辑

[0006]可见可说的语音链路与传统的语音交互方式不同,不支持复杂的对话管理,意图识别等能力,语义理解的范围与页面中定义的词汇,通过热词关联,可以理解为一种端到端的对接方式,优势在于可以快速搭建语音通道,通过语音操控到页面中的更多元素,相应的缺陷也在于只能操纵页面上已有的元素,且不支持复杂的语义理解能力

[0007]专利技术人发现,现有技术存在的技术缺陷是:如果没有提前对车机中出现的文本

图片

开关

按钮

滑块等控件进行标注

定制,则驾驶员无法用语音控制页面播放内容


技术实现思路

[0008]为了解决现有技术的不足,本专利技术提供了一种可见即可说的车载终端语音识别方法及系统;在原语音识别方案基础上,针对车机中出现的文本

图片

开关

按钮

滑块等控件进行定制和扩展,实现屏幕可见即可通过语音控制的功能

[0009]一方面,提供了一种可见即可说的车载终端语音识别方法,包括:
[0010]判断车载终端中的每个页面控件是否有对应的文本标识,如果没有,则为页面控件设置文本标识;如果有,则判断已有的文本标识是否存在冲突或信息不全的现象,如果存在,则对冲突或信息不全的现象进行文本标识修正;
[0011]获取待识别的语音信号,将待识别的语音信号进行噪声去除,将去噪后的语音信号转换为文本数据;
[0012]对所有的页面控件,按照从左到右,从上到下的顺序采用正整数进行标号;对文本数据进行识别,按照识别的结果对相应标号的页面控件进行控制;
[0013]其中,在对文本数据进行识别的过程中,判断文本数据是否超过设定长度,如果超过,则采用字符串模糊匹配算法对文本进行匹配,将文本数据与文本标识进行相似度计算,将相似度最大值所对应的文本标识作为筛选的文本标识;按照筛选的文本标识控制相应的页面控件进行动作

[0014]另一方面,提供了一种可见即可说的车载终端语音识别系统,包括:
[0015]判断模块,其被配置为:判断车载终端中的每个页面控件是否有对应的文本标识,如果没有,则为页面控件设置文本标识;如果有,则判断已有的文本标识是否存在冲突或信息不全的现象,如果存在,则对冲突或信息不全的现象进行文本标识修正;
[0016]获取模块,其被配置为:获取待识别的语音信号,将待识别的语音信号进行噪声去除,将去噪后的语音信号转换为文本数据;
[0017]识别控制模块,其被配置为:对所有的页面控件,按照从左到右,从上到下的顺序采用正整数进行标号;对文本数据进行识别,按照识别的结果对相应标号的页面控件进行控制;
[0018]其中,在对文本数据进行识别的过程中,判断文本数据是否超过设定长度,如果超过,则采用字符串模糊匹配算法对文本进行匹配,将文本数据与文本标识进行相似度计算,将相似度最大值所对应的文本标识作为筛选的文本标识;按照筛选的文本标识控制相应的页面控件进行动作

[0019]再一方面,还提供了一种电子设备,包括:
[0020]存储器,用于非暂时性存储计算机可读指令;以及
[0021]处理器,用于运行所述计算机可读指令,
[0022]其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法

[0023]再一方面,还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令

[0024]再一方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法

[0025]上述技术方案中的一个技术方案具有如下优点或有益效果:
[0026]通过对车机各
APP
显示界面进行标注定位,可实现各页面下,通过语音控制,播放界面,选择上一首歌曲

下一首歌曲,进入下级界面或返回主页面

无需手动操作,提高便利性,提升用户使用体验

[0027]通过语音识别控制车机,实现人眼可见功能设置

多媒体开启关闭

按钮点击

上下左右滑动等功能,提升座舱控制便利性,提高用户体验,提高客户满意度

附图说明
[0028]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定

[0029]图1为实施例一的方法流程图

具体实施方式
[0030]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明

除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义

[0031]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合

[0032]本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用

[0033]语音识别技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种可见即可说的车载终端语音识别方法,其特征是,包括:判断车载终端中的每个页面控件是否有对应的文本标识,如果没有,则为页面控件设置文本标识;如果有,则判断已有的文本标识是否存在冲突或信息不全的现象,如果存在,则对冲突或信息不全的现象进行文本标识修正;获取待识别的语音信号,将待识别的语音信号进行噪声去除,将去噪后的语音信号转换为文本数据;对所有的页面控件,按照从左到右,从上到下的顺序采用正整数进行标号;对文本数据进行识别,按照识别的结果对相应标号的页面控件进行控制;其中,在对文本数据进行识别的过程中,判断文本数据是否超过设定长度,如果超过,则采用字符串模糊匹配算法对文本进行匹配,将文本数据与文本标识进行相似度计算,将相似度最大值所对应的文本标识作为筛选的文本标识;按照筛选的文本标识控制相应的页面控件进行动作
。2.
如权利要求1所述的一种可见即可说的车载终端语音识别方法,其特征是,所述判断已有的文本标识是否存在冲突或信息不全的现象,其中,冲突,是指:同一页面下,对两个不同作用的控件做了相同的标注;信息不全,是指,对控件没有做文本标识,或文本标识不正确
。3.
如权利要求1所述的一种可见即可说的车载终端语音识别方法,其特征是,所述对冲突或信息不全的现象进行文本标识修正,具体包括:修改冲突的标识,确保页面每个开关按钮都有唯一的标识
。4.
如权利要求1所述的一种可见即可说的车载终端语音识别方法,其特征是,获取待识别的语音信号,将待识别的语音信号进行噪声去除,具体包括:通过回声消除算法,将待识别的语音信号进行噪声去除
。5.
如权利要求1所述的一种可见即可说的车载终端语音识别方法,其特征是,判断文本数据是否超过设定长度,如果是,则采用字符串模糊匹配算法对文本进行匹配,具体包括:
CPU
将文本数据与预先标注的文本标识进行比对,如果比对匹配率达到设定阈值,...

【专利技术属性】
技术研发人员:唐燕祥韦彩霞程志恒
申请(专利权)人:奇瑞汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1