一种语音识别系统技术方案

技术编号：28678437 阅读：27 留言：0更新日期：2021-06-02 02:55

本发明专利技术公开了一种语音识别系统，包括：多个音频获取模块同时获取环境中多个音频信息；获取环境中的多个视频信息；接收所述多个音频信息，根据所述多个音频信息中的声纹特征分离出个体声音，将所述个体声音分组并记录时间信息，将各分组中的个体声音进行融合得到个体增强音频信息；根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频对个体定位；根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组，所述讨论分组中的语音采用所述个体增强音频信息；可以显示以及播放各个讨论分组语音。能够满足课堂多点监测和评估要求。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别系统
本专利技术涉及语音识别
，具体是涉及一种语音识别系统。
技术介绍
随着远程课堂和智能课堂的发展，对教学和学生的评估方式也在发生改变。同时，对学生的素质教育如团队协作以及沟通能力的培养也有了新的要求。现有的基于语音识别的技术有以下几种：专利CN201911342652.2公开了一种数据处理方法、装置、电子设备及存储介质，具体的方法如下：获取待处理数据；所述待处理数据为与用户在至少一种场景中产生的行为相关的数据；利用多融合模型对所述待处理数据进行处理，得到至少两个第一参数；所述多融合模型至少包含用于语音识别的第一模型、用于图像识别的第二模型、用于说话人识别的第三模型；所述第一参数表征对用户在至少一种场景中产生的相应行为进行评估得到的分数值；根据所述至少两个第一参数，确定第二参数；所述第二参数表征对用户的至少两种行为进行评估得到的总分数值；所述第二参数用于进行教学评估。实际上也就是结合语音识别、说话人识别、图像识别等多种识别模型，对用户的品德、智力、体质等行为进行全面、准确的评估，评估得到的总分数值进行教学评估。然而，该现有技术的应用范围仅限于课堂后的事后评估，要分别获取语音、图像后再行分析得出结果，并不能得出实时结果以供实时分析。而且，多融合模型的三个模型在处理数据时无法做到多线程实时处理多个音频信号。专利CN201911418872.9公开了一种音频信号处理方法、装置以及电子设备，涉及语音处理领域。具体实现方案为：利用多个线程处理音频信号，得到各线程对应的音频信息，每个线程对应一...

【技术保护点】
1.一种语音识别系统，其特征在于，该系统包括：/n多个音频获取模块，多个音频获取模块同时获取环境中多个音频信息；/n多个视频获取模块，获取环境中的多个视频信息；/n音频处理模块，接收所述多个音频信息，根据所述多个音频信息中的声纹特征分离出个体声音，将所述个体声音分组并记录时间信息，将各分组中的个体声音进行融合得到个体增强音频信息；/n定位模块，根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频对个体定位；/n分组模块，根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组，所述讨论分组中的语音采用所述个体增强音频信息；/n教学交互模块，用于显示以及播放各个讨论分组语音。/n

【技术特征摘要】
1.一种语音识别系统，其特征在于，该系统包括：
多个音频获取模块，多个音频获取模块同时获取环境中多个音频信息；
多个视频获取模块，获取环境中的多个视频信息；
音频处理模块，接收所述多个音频信息，根据所述多个音频信息中的声纹特征分离出个体声音，将所述个体声音分组并记录时间信息，将各分组中的个体声音进行融合得到个体增强音频信息；
定位模块，根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频对个体定位；
分组模块，根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组，所述讨论分组中的语音采用所述个体增强音频信息；
教学交互模块，用于显示以及播放各个讨论分组语音。

2.根据权利要求1所述的系统，其特征在于，所述音频获取模块设置在不同位置。

3.根据权利要求1和2所述的系统，其特征在于，所述音频处理模块包括：分布式音频接收模块、分布式声纹识别模块以及声音融合模块，所述分布式音频接收模块能够并行接收多个音频获取模块中...

【专利技术属性】
技术研发人员：张喜云，李振新，闫晶，赵雷，韩娟娟，霍霄艳，李世伟，王康，
申请(专利权)人：焦作大学，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人