会议录音转写方法、系统、计算机设备和可读存储介质技术方案

技术编号:30226791 阅读:15 留言:0更新日期:2021-09-29 09:52
本申请涉及一种会议录音转写方法、系统、计算机和存储介质,其中,该方法包括:热词语料集合构建步骤,获取待转写的会议录音信息,根据会议录音信息通过网络和/或内部知识库获取热词扩展数据并构建热词语料集合;识别解码网络构建步骤,构建识别解码网络;语音信号解码步骤,获取待转写的会议录音,利用所述识别解码网络解码所述会议录音的每帧语音信号,并在完成最后一帧语音信号解码后,选择最大累计概率的活跃节点作为最优节点,通过最优节点获取其对应的单词序列;热词解码增强步骤,在语音信号解码步骤中根据热词语料集合对所述活跃节点的历史路径进行增强。通过本申请,实现对热词识别的有效增强,提高会议录音转写对热词的识别效果。的识别效果。的识别效果。

【技术实现步骤摘要】
会议录音转写方法、系统、计算机设备和可读存储介质


[0001]本申请涉及互联网
,特别是涉及会议录音转写方法、系统、计算机设备和计算机可读存储介质。

技术介绍

[0002]越来越多的会议录音亟待发掘其中的价值,这就需要从录音转换成文字。语音识别作为如今普遍的处理上述问题的技术,已经广泛运用于手机助手、智能音箱和智能客服等场景。然而随着各行各业大量会议录音的产生,通用语音识别已经难以处理各种专业性较高甚至生涩难懂的词汇,导致会议录音转写的质量往往无法令人满意。
[0003]通用语音识别技术预先基于海量数据训练的系统能满足常用语音输入撰写的需要,特别当语音输入内容符合原语言模型概率分布时识别准确率往往较高。然而在实际应用中,移动互联网和社交网络快速发展不断产生着新的热点话题及相应的热点词汇,不同用户也存在不同个性化词汇的识别需求,如联络人名等,这些热点词汇或个性化词汇由于时效性和特异性在原始采集的语料中往往出现频度较低,因而原语言模型对该类词汇往往覆盖不足,进而导致相应识别系统不能准确识别该类热词。
[0004]会议录音转写的质量依赖于关键词和关键语句的正确识别,而这些专业的,需要重点关注的词汇一般称之为热词,即热门词汇。热词既包括上述的专业领域词汇,也包括最近比较热门的新颖词汇,对于热词的识别一直是语音识别领域的一大难题,也是使会议录音转写更好满足用户需求的一大契合点。
[0005]现有语音识别技术一般缺乏对于专业热词和实时热词的支持,考虑到专业热词的搜集和整理有比较高的门槛,无法比较全面正确的获取;实时热词由于对时效性以及整合进系统的速度要求较高,也存在无法及时更新的困难。为了保证会议录音转写的用户体验,必须有一个比较好的方案去解决如何提高热词识别的难题。
[0006]为此,目前会议录音转写或者语音识别过程中对于热词识别主要通过加强语言模型,采用系统参数重估的方法,在将新收集的热词语料加入原语料库后,重新训练新的语言模型以提高对新增热词的识别准确率。然而,在实际应用中,热词更新频度往往较高,而所需热词考虑其专业性和复杂性,获取足质足量的语料有相当大的难度,现有技术无法及时收集足够语料参与系统参数重估,进而影响对热词的识别效果。另一方面,语言模型的重新训练以及识别系统资源,如基于WFST(Weighted Finite

State Transducers,加权有限状态转换器)的解码识别网络,的构建往往费时较多,代价较大,无法实现对热词识别的快速响应。
[0007]目前针对上述热词识别及时更新困难、无法实现对热词识别的快速响应的问题,尚未提出有效的解决方案。

技术实现思路

[0008]本申请实施例提供了一种会议录音转写方法、系统、计算机设备和计算机可读存
Level识别解码网络的某些弧上的输入标签为“#nonterm:contact_list”,该标签用户表示联系人类别。
[0024]Sub解码网络构建步骤,构建Sub Level识别解码网络并配置Sub Level识别解码网络的自定义标签扩展信息;具体的,所述Sub Level识别解码网络(简称为Sub解码网络)为Top Level识别解码网络在自定义标签的扩展,举例而非限制,如前述输入标签“#nonterm:contact_list”在Sub Level识别解码网络中为小明、小李等具体姓名。
[0025]其中,当所述Top Level识别解码网络识别到所述自定义标签时,自动动态加载对应的Sub Level识别解码网络,进入到Sub Level识别解码网络中解码对应内容,以便于实现热词增强的作用。
[0026]在其中一些实施例中,所述Top解码网络、Sub解码网络配置为根据热词语料集合进行匹配解码对应内容。
[0027]第二方面,本申请实施例提供了一种会议录音转写系统,包括:
[0028]热词语料集合构建模块,用于获取用户提交的待转写的会议录音信息,根据所述会议录音信息通过网络和/或内部知识库获取热词扩展数据并构建热词语料集合;
[0029]识别解码网络构建模块,用于构建识别解码网络;具体的,所述识别解码网络为基于WFST的识别解码网络。
[0030]语音信号解码模块,用于获取待转写的会议录音,利用所述识别解码网络解码所述会议录音的每帧语音信号,并在完成最后一帧语音信号解码后,选择最大累计概率的活跃节点作为最优节点,通过最优节点获取其对应的单词序列;
[0031]热词解码增强模块,用于在语音信号解码模块解码过程中根据所述热词语料集合对所述活跃节点的历史路径进行增强,提高热词所在路径的累积历史路径概率,使热词路径能在解码过程中被选出。
[0032]在其中一些实施例中,所述热词语料集合构建模块进一步包括:
[0033]会议录音信息获取模块,用于获取用户提交的待转写的会议录音信息,所述会议录音信息包括会议录音的文件名和用户填写的附带信息,所述附带信息包括行业、领域、会议主题及会议关键字其一或其任意组合;
[0034]关键词获取模块,用于对所述会议录音信息进行文本预处理,并利用命名实体识别方法获取所述会议录音信息的关键词;所述文本预处理通常包括获取原始文本、分词、文本清洗、标准化;所述命名实体识别方法包括关系抽取、实体属性值抽取。
[0035]热词扩展数据获取模块,用于根据所述关键词通过网络公开数据爬虫及内部知识库获取热词扩展数据并保存到热词语料集合。其中,所述内部知识库中用于存储各领域经过清洗的大量干净数据,具有结构化、层次化优点。
[0036]在其中一些实施例中,所述热词扩展数据获取模块进一步包括:
[0037]热词扩展数据外部获取模块,用于通过网络爬虫搜集公开知识图谱数据和/ 或网络百科中所述关键词的同义词和/或近义词,并通过搜索引擎搜索所述关键词获取其平行语料,对所述平行语料进行同义词和/或近义词映射和扩展查询,得到热词数据A;其中,所述网络百科包括维基百科和/或百度百科。
[0038]热词扩展数据内部获取模块,用于根据所述关键词在所述内部知识库中的通过相关性计算得到热词数据B;具体的,所述相关性计算可以是基于TF

IDF 计算或语义近似度
计算。
[0039]热词扩展数据处理模块,用于对所述热词数据A、B通过文本合并、去重及分词处理后保存到热词语料集合。其中,所述热词数据B配置为权重高于所述热词数据A。
[0040]基于上述模块,本申请采用内、外部搜索结合的方式,可以既满足热词的时效性也借助内部丰富的垂类知识库获取更广泛的热词覆盖,达到尽可能多的识别录音中的各种热词。
[0041]在其中一些实施例中,所述识别解码网络构建模块进一步包括:
[0042]Top解码网络构建模块,用于构建Top Level识别解码网络并配置Top Level 识别解码网络采用的自定义标签;具体的,所述Top Level识别解码网络(简称为Top解码网络)与传本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会议录音转写方法,其特征在于,包括:热词语料集合构建步骤,获取待转写的会议录音信息,根据所述会议录音信息通过网络和/或内部知识库获取热词扩展数据并构建热词语料集合;识别解码网络构建步骤,构建识别解码网络;语音信号解码步骤,获取待转写的会议录音,利用所述识别解码网络解码所述会议录音的每帧语音信号,并在完成最后一帧语音信号解码后,选择最大累计概率的活跃节点作为最优节点,通过最优节点获取其对应的单词序列;热词解码增强步骤,在语音信号解码步骤中根据所述热词语料集合对所述活跃节点的历史路径进行增强,提高热词所在路径的累积历史路径概率。2.根据权利要求1所述的会议录音转写方法,其特征在于,所述热词语料集合构建步骤进一步包括:会议录音信息获取步骤,获取待转写的会议录音信息,所述会议录音信息包括会议录音的文件名和用户填写的附带信息,所述附带信息包括行业、领域、会议主题及会议关键字其一或其任意组合;关键词获取步骤,对所述会议录音信息进行文本预处理,并利用命名实体识别方法获取所述会议录音信息的关键词;热词扩展数据获取步骤,根据所述关键词通过网络公开数据爬虫及内部知识库获取热词扩展数据并保存到热词语料集合。3.根据权利要求2所述的会议录音转写方法,其特征在于,所述热词扩展数据获取步骤进一步包括:热词扩展数据外部获取步骤,通过网络爬虫搜集公开知识图谱数据和/或网络百科中所述关键词的同义词和/或近义词,并通过搜索引擎搜索所述关键词获取其平行语料,对所述平行语料进行同义词和/或近义词映射和扩展查询,得到热词数据A;热词扩展数据内部获取步骤,根据所述关键词在所述内部知识库中的通过相关性计算得到热词数据B;热词扩展数据处理步骤,对所述热词数据A、B通过文本合并、去重及分词处理后保存到热词语料集合,其中,所述热词数据B配置为权重高于所述热词数据A。4.根据权利要求1

3中任一项所述的会议录音转写方法,其特征在于,所述识别解码网络构建步骤进一步包括:Top解码网络构建步骤,构建Top Level识别解码网络并配置Top Level识别解码网络采用的自定义标签;Sub解码网络构建步骤,构建Sub Level识别解码网络并配置Sub Level识别解码网络的自定义标签扩展信息;其中,当所述Top Level识别解码网络识别到所述自定义标签时,自动动态加载对应的Sub Level识别解码网络,进入到Sub Level识别解码网络中解码对应内容。5.一种会议录音转写系统,其特征在于,包括:热词语料集合构建模块,用于获取待转写的会议录音信息,根据所述会议录音信息通过网络和/或内部知识库获取热词扩展数据并构建热词语料集合;识别解码网络构建模块,用于构建...

【专利技术属性】
技术研发人员:刘晨
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1