一种机器辅助的会议记录系统及方法技术方案

技术编号：29297867 阅读：15 留言：0更新日期：2021-07-17 01:05

本发明专利技术涉及一种机器辅助的会议记录系统，包括：麦克风收音阵列：用以实时拾取会议的音频数据；音频预处理模块：对录入的音频数据进行分割和预处理，并且将预处理过的音频数据分别送入声纹识别模块以及语音处理系统模块中；声纹识别模块：用以判断音频数据中每句话所属说话人身份信息，并且为每句话匹配说话人身份标签；语音识别模块：用以将音频数据转换为文字信息；综合处理模块：用以组合声纹识别模块与语音识别模块的输出内容，并发送给终端界面；可实时交互处理的终端界面：用以实时进行操作处理，显示会议记录信息，依据机器生成的内容，实时进行纠错改正。与现有技术相比，本发明专利技术实时检错、自动生成，避免二次审查造成时间浪费。浪费。浪费。

A machine aided conference recording system and method

全部详细技术资料下载

【技术实现步骤摘要】
attention、feed
‑
forward network和ResNet connection，所述的feed
‑
forward network由多层全连接串联而成，其激活函数为ReLU，所述的ResNet connection用于深度提取特征信息；
[0017]预测网络：除multi
‑
head attention使用特定的掩码外，在结构上与编码器相同；
[0018]联合网络：接收编码器网络和预测网络输出的线性组合，由多层全连接层组成，其中，最后一层为softmax层，输出概率分布，根据概率分布生成相应的文字。
[0019]所述的语音识别模块中的网采用的Loss函数为标签序列所有对齐的概率和，则有：
[0020][0021]其中，loss为损失，p(y
i
|x
i
)为第i个样本的标签序列对应的所有可能对齐的概率和，α(T
i
,U
i
)为采用前向算法计算得到的对齐路径的概率和，T
i
表示时间，U
i
表示状态。
[0022]所述的终端界面包括：
[0023]说话人管理组件：用以实时标注说话人的身份标签，替换临时生成的说话人身份标签；
[0024]文字操作组件：用以实时修改根据语音自动生成的文字；
[0025]导出模块：依据选定的保存格式，将会议记录进行导出存档。
[0026]一种机器辅助的会议记录方法，包括以下步骤：
...

【技术保护点】

【技术特征摘要】
1.一种机器辅助的会议记录系统，其特征在于，该系统包括：麦克风收音阵列：用以实时拾取会议的音频数据；音频预处理模块：对录入的音频数据进行分割和预处理，并且将预处理过的音频数据分别送入声纹识别模块以及语音处理系统模块中；声纹识别模块：用以判断音频数据中每句话所属说话人身份信息，并且为每句话匹配说话人身份标签；语音识别模块：用以将音频数据转换为文字信息；综合处理模块：用以组合声纹识别模块与语音识别模块的输出内容，并发送给终端界面；可实时交互处理的终端界面：用以实时进行操作处理，显示会议记录信息，依据机器生成的内容，实时进行纠错改正。2.根据权利要求1所述的一种机器辅助的会议记录系统，其特征在于，所述的声纹识别模块包括依次连接的帧级特征提取器、注意力统计池化层和话语级别特征提取器，所述的帧级特征提取器用以提取分为多帧后的音频数据的帧级特征，注意力统计池化层用以根据帧级特征输出帧级特征的权重平均值和权重标准差，所述的话语级别特征提取器将帧级特征权重平均值作为话语级特征并输入，生成表示说话人身份的数值向量。3.根据权利要求2所述的一种机器辅助的会议记录系统，其特征在于，所述的帧级特征提取器和话语级特征处理器采用基于CNN、LSTM或Transformer结构的深度神经网络模型。4.根据权利要求1所述的一种机器辅助的会议记录系统，其特征在于，所述的语音识别模块包括：编码器网络：由多个块堆叠形成，每个块依次包含layer norm、multi
‑
head attention、feed
‑
forward network和ResNet connection，所述的feed
‑
forward network由多层全连接串联而成，其激活函数为ReLU，所述的ResNet connection用于深度提取特征信息；预测网络：除multi
‑
head attention使用特定的掩码外，在结构上与编码器相同；联合网络：接收编码器网络和预测网络输出的线性组合，由多层全连接层组成，其中，最后一层为softmax层，输出概率分布，根据概率分布生成相应的文字。5.根据权利要求4所述的一种机器辅助的会议记录系统，其特征在于，所述的语音识别模块中的网采用的Loss函数为标签序列所有对齐的概率和，则有：其中，loss为损失，p(y
i
...

【专利技术属性】
技术研发人员：田金钊，程帆，符鸿飞，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人