一种会议记录生成方法、装置、设备及存储介质制造方法及图纸

技术编号：35468164 阅读：39 留言：0更新日期：2022-11-05 16:12

本申请实施例提供了一种会议记录生成方法、装置、设备及存储介质，涉及人工智能技术领域及语音处理技术领域，方法包括：获取目标会议的会议音频；获取目标会议的至少一个与会对象中每个与会对象的语音特征，根据每个与会对象的语音特征对会议音频中每个与会对象的音频进行增强处理，得到每个与会对象的增强后的音频；对增强后的音频进行语音识别，得到增强后的音频对应的目标文本，并根据目标文本生成目标会议对应的会议记录。采用本申请，可以自动化智能化的生成会议记录。本申请涉及区块链技术，会议音频可从区块链获取。会议音频可从区块链获取。会议音频可从区块链获取。

全部详细技术资料下载

【技术实现步骤摘要】
一种会议记录生成方法、装置、设备及存储介质

[0001]本申请涉及语音处理
，尤其涉及一种会议记录生成方法、装置、设备及存储介质。

技术介绍

[0002]在现代各种办公会议中，完整的会议记录是十分必要的，会后回顾记录往往是以录制的音频形式保存的，但是音频文件占用存储容量较大，而且查看起来十分不方便，使用率不高。如果将音频转为文字的话，可以大大减少存储空间，方便传送。因此，如何自动化智能化生成会议记录成为研究的热点。

技术实现思路

[0003]本申请实施例提供了一种会议记录生成方法、装置、设备及存储介质，可以自动化智能化生成会议记录。
[0004]一方面，本申请实施例提供了一种会议记录生成方法，包括：
[0005]获取目标会议的会议音频，所述目标会议存在多个与会对象；
[0006]获取所述多个与会对象中的至少一个与会对象中每个与会对象的语音特征；
[0007]根据所述每个与会对象的语音特征对所述会议音频中所述每个与会对象的音频进行增强处理，得到所述每个与会对象的增强后的音频；
[0008]对所述增强后的音频进行语音识别，得到所述增强后的音频对应的目标文本，并根据所述目标文本生成所述目标会议对应的会议记录。
[0009]第二方面，本申请实施例提供了一种会议记录生成装置，包括：
[0010]获取模块，用于获取目标会议的会议音频，所述目标会议存在多个与会对象；
[0011]所述获取模块，还用于获取所述多个与会对象中的至少一个与会对象中每个与...

【技术保护点】

【技术特征摘要】
1.一种会议记录生成方法，其特征在于，包括：获取目标会议的会议音频，所述目标会议存在多个与会对象；获取所述多个与会对象中的至少一个与会对象中每个与会对象的语音特征；根据所述每个与会对象的语音特征对所述会议音频中所述每个与会对象的音频进行增强处理，得到所述每个与会对象的增强后的音频；对所述增强后的音频进行语音识别，得到所述增强后的音频对应的目标文本，并根据所述目标文本生成所述目标会议对应的会议记录。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取多个对象中每个对象的语音，所述多个对象包括所述至少一个与会对象；根据所述每个对象的语音提取所述每个对象对应的多组梅尔滤波器对数能量；根据所述每个对象对应的多组梅尔滤波器对数能量确定所述每个对象的语音特征信息；对所述每个对象的语音特征信息进行编码处理，得到所述每个对象的语音特征。3.根据权利要求2所述的方法，其特征在于，所述根据所述每个对象对应的多组梅尔滤波器对数能量确定所述每个对象的语音特征信息，包括：分别对所述每个对象对应的多组梅尔滤波器对数能量进行L2正则化处理，得到所述每个对象对应的多组正则化处理结果；分别对所述每个对象对应的多组正则化处理结果进行均值计算，得到所述每个对象对应的多个正则化处理结果均值；将所述每个对象对应的多个正则处理结果均值确定为所述每个对象的语音特征信息。4.根据权利要求1所述的方法，其特征在于，所述根据所述每个与会对象的语音特征对所述会议音频中所述每个与会对象的音频进行增强处理，得到所述每个与会对象的增强后的音频，包括：获取所述会议音频的声音特征；对所述会议音频的声音特征进行短时傅里叶变换，得到第一幅度频谱；调用语音过滤器以根据所述至少一个与会对象中的与会对象O
i
的语音特征以及所述第一幅度频谱进行处理，得到软掩码P
i
，i为小于或等于M的正整数，M为所述至少一个与会对象的数量；利用所述软掩码P
i
对所述第一幅度频谱进行掩码处理，得到掩码后的幅度频谱Q
i
；对所述掩码后的幅度频谱Q
i
进行短时逆傅里叶变换，得到所述与会对象O
i
的增强后的音频。5.根据权利要求4所述的方法，其特征在于，所述获取所述会议音频的声音特征，包括：根据所述会议音频提取所述会议音频对应的多组梅尔滤波器对数能量；根据所述会议音频对应的多组梅尔滤波器对数能量确定所述会议音频的声音特征信息；对所述会议音频的声音特征信息进行编码处理，得到所述会议音频的声音特征。6.根据权利要求4或5所述的方法，其特征在于，所述方法还包括：获取样本会议音频，所述样本会议音频对应的会议存在多个样本与会对象；获取所述多个样本与会对象中...

【专利技术属性】
技术研发人员：胡立云，
申请(专利权)人：未鲲上海科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人