System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及语音识别,尤其涉及一种语音识别智能抢救车以及语音识别方法。
技术介绍
1、语音识别是一种将人类语音中的内容转换为计算机可读输入的技术。简单来说,就是让机器能够“听懂”人说的话,并将其转化为文字或其他形式的数据。一种常见的语音识别方法是基于深度学习的自动语音识别(asr, automatic speech recognition)系统。通过麦克风等设备捕捉人的语音信号,对捕捉到的声音信号进行降噪、标准化等处理,以提高后续步骤的准确性,使用如梅尔频率倒谱系数(mfcc)等技术从语音信号中提取特征,这些特征能够有效地表示语音的重要信息,利用大量的语音数据和对应的文本标签,通过深度学习算法(如循环神经网络rnn、长短期记忆网络lstm或卷积神经网络cnn等)训练模型,使模型能够学会如何将语音特征映射到相应的文字输出。语音信号通常集中在低频段(20hz到8khz之间),而许多常见的噪音源也占据这一频段,噪音的存在可能导致特征向量的值发生偏移,使得原本清晰的语音特征变得模糊不清,导致模型进行文字转化时无法得到准确的文字输出。
技术实现思路
1、为了解决上述技术问题,本专利技术提供了一种语音识别方法,包括:
2、步骤1,通过麦克风捕捉实时语音信号;
3、步骤2,对实时语音信号进行预处理,得到预处理后的实时语音信号;
4、步骤3,从预处理后的实时语音信号中提取特征,得到特征向量实时序列;
5、步骤4,为特征向量实时序列构建调整因子,基于
6、步骤5,将特征向量调整序列输入预训练深度学习模型,输出识别结果。
7、进一步地,特征向量实时序列包括一个或若干实时特征向量,所述实时特征向量包括若干帧实时特征。
8、进一步地,为特征向量实时序列构建调整因子,基于调整因子对特征向量实时序列进行调整,得到特征向量调整序列,具体包括:
9、步骤41,预设若干预估标签;
10、步骤42,根据历史语音数据计算历史特征向量序列的每帧历史特征在每个预估标签下的条件概率;
11、步骤43,根据历史语音识别数据计算每个预估标签的先验概率;
12、步骤44,计算每个实时特征向量中相邻帧实时特征之间的距离系数;
13、步骤45,根据每帧历史特征在每个预估标签下的条件概率、每个预估标签的先验概率、每个实时特征向量中相邻帧实时特征之间的距离系数,计算每个实时特征向量的调整因子;
14、步骤46,根据调整因子以及实时特征向量,得到调整特征向量,根据调整特征向量得到特征向量调整序列。
15、进一步地,预估标签包括单词、短语、音素、字符、音素状态、子词单元。
16、进一步地,根据历史语音识别数据计算特征向量序列中每帧历史特征在每个预估标签下的条件概率,包括以下步骤:
17、步骤421,历史语音识别数据包括历史语音信号经过特征提取后得到历史特征向量序列,历史特征向量序列通过深度学习模型识别后得到预估标签;
18、步骤422,对历史特征向量序列中每个历史特征标定预估标签,计算每帧历史特征在每个预估标签下的条件概率;
19、根据历史语音识别数据计算每个预估标签的先验概率,包括:统计所有预估标签的数量,统计被标定为当前预估标签的历史特征数量,根据所有预估标签的数量和被标定为当前预估标签的历史特征数量,计算得到当前预估标签的先验概率。
20、进一步地,计算每个实时特征向量中相邻帧实时特征之间的距离系数,包括以下步骤:
21、步骤441,从每个实时特征向量中获取当前帧实时特征,根据当前帧实时特征得到前一帧实时特征,根据当前帧实时特征和前一帧实时特征计算得到第一相邻相似度;
22、步骤442,根据当前帧实时特征获得后一帧实时特征,根据当前帧实时特征和后一帧实时特征计算得到第二相邻相似度;
23、步骤443,根据第一相邻相似度、第二相邻相似度计算得到调整系数;
24、步骤444,根据第一相邻相似度、第二相邻相似度、调整系数,计算得到每个特征向量的距离系数。
25、进一步地,调整因子的计算公式为:
26、;
27、式中,代表第i个实时特征向量的调整因子,代表第i个实时特征向量中第l帧实时特征在第j个预估标签下的条件概率,代表第i个实时特征向量中第l帧实时特征被标定为第j个预估标签的先验概率,代表第i个实时特征向量中第l帧实时特征与相邻帧实时特征之间的距离系数,n代表实时特征向量总数,m代表预估标签总数,q代表特征总帧数,代表调整系数。
28、进一步地,距离系数的计算公式为:
29、;
30、式中,代表第一相邻相似度,代表第二相邻相似度,代表第l帧实时特征的特征值,代表第l帧实时特征的前一帧l-1实时特征的特征值,代表第l帧实时特征的后一帧l+1实时特征的特征值。
31、进一步地,特征向量调整序列的计算公式为:
32、;
33、式中,代表特征向量调整序列,代表第i个实时特征向量的调整因子,代表特征向量实时序列。
34、一种语音识别智能抢救车,包括抢救车本体和安装在抢救车本体上的语音控制装置,用于执行上述权利要求1-9任一项所述的一种语音识别方法,其特征在于:所述抢救车本体的上表面开设有安装腔,所述安装腔的侧壁固定连接有连接端子,所述连接端子与语音控制装置匹配对齐,所述安装腔远离连接端子一端的底面开设有限位口,所述限位口的底面开设有弹簧腔,所述弹簧腔的一侧贯穿开设有升降腔,所述弹簧腔的内部连接有限位组件,所述限位组件的上端贯穿限位口至安装腔的内部并与语音控制装置的侧壁相抵,所述限位组件的侧端连接有按压组件,所述按压组件的另一端贯穿升降腔至抢救车本体的外部,所述安装腔的内壁连接有遮挡组件,所述遮挡组件的另一端与语音控制装置远离连接端子的一侧相抵。
35、本专利技术实施例具有以下技术效果:
36、本专利技术通过历史数据计算先验概率和条件概率,并结合实时特征向量中相邻帧之间的距离系数,动态计算调整因子以优化特征向量序列,从而显著提升语音识别系统的准确性和鲁棒性。具体而言,先验概率提供了全局标签分布信息,帮助模型在缺乏明确特征支持的情况下做出合理预测;条件概率则反映了每个特征向量与特定标签之间的局部关联,增强了模型对不同标签的区分能力。与此同时,实时计算相邻帧的距离系数引入了上下文信息,使得当前帧不仅依赖于自身的特征值,还考虑了前后帧的相关性,进一步提升了特征表示的有效性。将这些统计信息与上下文信息相结合,生成的调整因子能够对原始特征向量进行加权,突出重要特征并抑制噪声影响,从而生成更加精确的特征向量调整序列。最终,将优化后的特征向量调整序列输入预训练的深度学习模型,显著提高了识别结果的准确性和可靠性。这种综合方法不仅有效提升了语本文档来自技高网...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的一种语音识别方法,其特征在于,特征向量实时序列包括一个或若干实时特征向量,所述实时特征向量包括若干帧实时特征。
3.根据权利要求1所述的一种语音识别方法,其特征在于,为特征向量实时序列构建调整因子,基于调整因子对特征向量实时序列进行调整,得到特征向量调整序列,具体包括:
4.根据权利要求3所述的一种语音识别方法,其特征在于,预估标签包括单词、短语、音素、字符、音素状态、子词单元。
5.根据权利要求3所述的一种语音识别方法,其特征在于,根据历史语音识别数据计算特征向量序列中每帧历史特征在每个预估标签下的条件概率,包括以下步骤:
6.根据权利要求5所述的一种语音识别方法,其特征在于,计算每个实时特征向量中相邻帧实时特征之间的距离系数,包括以下步骤:
7.根据权利要求3所述的一种语音识别方法,其特征在于,调整因子的计算公式为:
8.根据权利要求7所述的一种语音识别方法,其特征在于,距离系数的计算公式为:
9.根据权利要求1所述
10.一种语音识别智能抢救车,包括抢救车本体和安装在抢救车本体上的语音控制装置,用于执行权利要求1-9任一项所述的一种语音识别方法,其特征在于:所述抢救车本体的上表面开设有安装腔,所述安装腔的侧壁固定连接有连接端子,所述连接端子与语音控制装置匹配对齐,所述安装腔远离连接端子一端的底面开设有限位口,所述限位口的底面开设有弹簧腔,所述弹簧腔的一侧贯穿开设有升降腔,所述弹簧腔的内部连接有限位组件,所述限位组件的上端贯穿限位口至安装腔的内部并与语音控制装置的侧壁相抵,所述限位组件的侧端连接有按压组件,所述按压组件的另一端贯穿升降腔至抢救车本体的外部,所述安装腔的内壁连接有遮挡组件,所述遮挡组件的另一端与语音控制装置远离连接端子的一侧相抵。
...【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的一种语音识别方法,其特征在于,特征向量实时序列包括一个或若干实时特征向量,所述实时特征向量包括若干帧实时特征。
3.根据权利要求1所述的一种语音识别方法,其特征在于,为特征向量实时序列构建调整因子,基于调整因子对特征向量实时序列进行调整,得到特征向量调整序列,具体包括:
4.根据权利要求3所述的一种语音识别方法,其特征在于,预估标签包括单词、短语、音素、字符、音素状态、子词单元。
5.根据权利要求3所述的一种语音识别方法,其特征在于,根据历史语音识别数据计算特征向量序列中每帧历史特征在每个预估标签下的条件概率,包括以下步骤:
6.根据权利要求5所述的一种语音识别方法,其特征在于,计算每个实时特征向量中相邻帧实时特征之间的距离系数,包括以下步骤:
7.根据权利要求3所述的一种语音识别方法,其特征在于,调整因子...
【专利技术属性】
技术研发人员:申鑫,齐魏佳,王文鲜,王晶雪,马张芳,李功靖,
申请(专利权)人:首都医科大学附属北京同仁医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。