一种可实现智能会议纪要的在线会议转写方法及系统技术方案

技术编号：44972099 阅读：3 留言：0更新日期：2025-04-12 01:46

本发明专利技术涉及语音通信技术领域，提供一种可实现智能会议纪要的在线会议转写方法，包括通过麦克风阵列实时采集会议过程中各个发言者的音频数据，并对采集到的音频信号进行初步处理；对音频信号进行声源定位并根据声源定位结果确定音频信号的来源方向；对音频信号进行声纹识别提取发言者的语音频谱特征，并根据声纹识别结果对发言人的声纹进行标记；将加权后的所述音频信号用于文字转写，定位所述发言者来生成完整的会议纪要。有效解决传统音频转写系统中无法精准识别多个发言者、区分发言内容和减少人工校对工作的问题，提高会议记录的准确性和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音通信，尤其涉及一种可实现智能会议纪要的在线会议转写方法及系统。

技术介绍

1、随着全球化和信息技术的迅速发展，远程工作和混合型办公推动了企业通信和协作市场的快速增长。云计算、人工智能等先进技术的应用不仅使得云会议、云软件平台和视频会议解决方案的需求激增，促进相关硬件设备的开发和普及。在这种背景下，中小型会议室和开放式会议空间等协作空间的增长，推动了音频会议终端的需求不断增加。会议音箱以及低成本和使用便捷性的即插即用解决方案实现快速增长。

2、在会议内容的处理方面，有效率且高质量的整理视频、音频和文字信息变得越来越重要。会议转写，即实时将会议中的语音转换为文字记录，已成为行业的基本需求。这项技术的应用涵盖了会议、培训、采访等多种场景，要求生成的文字材料不仅完整，还需配有相应的字幕。市场对视频会议的需求激增同时也带来了竞争加剧，各类企业包括视频会议硬件厂商、音频品牌、解决方案供应商、信号或语音传输系统厂商、dsp厂商、显示屏和安防厂商以及ai语音识别厂商等纷纷进入这一市场。这些企业的加入促使原本由音频和视频会议vc提供商主导的市场向多元化厂商共同推进产业发展模式转变。

3、然而，尽管技术在不断进步，现有的会议音频系统仍面临多个挑战：

4、（1）环境噪音抑制的局限性：对于阵列麦克风会议音箱，由于应用场景及成本限制，基于算法可实现一定效果的环境噪音抑制，但依然无法满足文字转写要求。

5、（2）长语音识别的不准确性以及语音识别后导出的文字是没有时间戳，没有分段的。

<...

【技术特征摘要】

1.一种可实现智能会议纪要的在线会议转写方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的在线会议转写方法，其特征在于，所述步骤s100包括：

3.根据权利要求1所述的在线会议转写方法，其特征在于，所述步骤s200包括：

4.根据权利要求1所述的在线会议转写方法，其特征在于，所述步骤s300包括：

5.根据权利要求3或4所述的在线会议转写方法，其特征在于，在步骤s400中，针对每帧所述音频信号，加权处理中加权子项公式为，

6....

【专利技术属性】
技术研发人员：王淞，
申请(专利权)人：深聪半导体江苏有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人