一种录音文本角色识别方法、装置、设备及介质制造方法及图纸

技术编号:36948479 阅读:12 留言:0更新日期:2023-03-22 19:09
本申请公开了一种录音文本角色识别方法、装置、设备及介质,涉及自然语言处理领域,包括:获取录音内容,并基于录音内容确定出各录音文本信息和录音总时长;确定出录音总时长与预设阈值之间的大小关系,若大于,则利用第一训练模型对各录音文本信息进行角色识别,以得到角色识别结果;若小于,则利用第二训练模型对各录音文本信息进行角色序列标注,以得到标注后的各录音文本信息,判断标注后的录音文本信息的信息长度是否小于预设的处理长度,若小于,则基于标注后的录音文本信息确定出角色识别结果。通过本申请的上述技术方案,能够提高录音文本角色识别的效率,增加录音文本角色识别的准确性,提高录音文本角色识别的多样性。提高录音文本角色识别的多样性。提高录音文本角色识别的多样性。

【技术实现步骤摘要】
一种录音文本角色识别方法、装置、设备及介质


[0001]本专利技术涉及自然语言处理领域,特别涉及一种录音文本角色识别方法、装置、设备及介质。

技术介绍

[0002]现有技术中,销售、客服人员会通过呼叫中心与客户进行电话沟通,平台每天会产生大量的录音,这些录音中往往蕴含着众多有价值的信息。将语音转化成文本,并对文本进行挖掘分析,说话人角色识别是挖掘分析的一个重要组成部分,用来判断通话双方的身份(坐席或者客户),然后再进行下游任务的处理,对于单声道的录音,将语音转文字,输出不同通道的信息代表不同的人,但不知道具体坐席或者客户是哪个通道,目前常用的文本角色识别技术有两种,从关键词和语义两个角度判断该单句的角色,提取关键词采用的是坐席和客户所说话的不同,通常坐席说的话具有一定规律性来判断角色,句子语义采用的是二分类模型,进行角色分类,如果模型以大于某阈值的概率预测为某个角色(坐席或者客户),则将模型的预测角色确定为该单句的最终角色。但是效果依赖于语音角色分离,即使模型将角色分配正确,整体的角色准确率依然不高,根据统计通话时间较长时,语音分离效果相对较好,通话时间较短时,语音分离混肴情况较多,并且文本过长进行序列标注任务复杂度会比较大,语音的角色分离会导致大量的单句角色会分错,即说话人A中包含B的单句,说话人B中包含属于A的单句,目前语音角度分离的优化较为复杂,耗时较长,且效果不明显,基于关键词规则判断角色,有些坐席和客户的文本区分不明显,找不到规律性,且规则对于不同公司的话术效果较差,不通用,基于二分类模型判断角色依赖于语音分离效果,如果语音本身没有分离开,会影响角色的效果。
[0003]由上可见,在录音文本角色识别的过程中,如何提高录音文本角色识别的效率,增加录音文本角色识别的准确性,提高录音文本角色识别的多样性是本领域有待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种录音文本角色识别方法、装置、设备及介质,能够提高录音文本角色识别的效率,增加录音文本角色识别的准确性,提高录音文本角色识别的多样性。其具体方案如下:
[0005]第一方面,本申请公开了一种录音文本角色识别方法,包括:
[0006]获取待识别的录音内容,并基于所述录音内容确定出各录音文本信息和录音总时长;
[0007]确定出所述录音总时长与预设阈值之间的大小关系,若所述录音总时长大于预设阈值,则利用预设的第一训练模型对各所述录音文本信息进行角色识别,以得到角色识别结果;
[0008]若所述录音总时长小于预设阈值,则利用预设的第二训练模型对各所述录音文本
信息进行角色序列标注,以得到标注后的各录音文本信息,判断所述标注后的录音文本信息的信息长度是否小于预设的处理长度,若所述标注后的录音文本信息的信息长度小于预设的处理长度,则基于所述标注后的录音文本信息确定出角色识别结果。
[0009]可选的,所述获取待识别的录音内容,并基于所述录音内容确定出各录音文本信息和录音总时长,包括:
[0010]获取待识别的录音内容,并利用第三方语音识别技术对所述录音内容进行识别处理,以得到所有的录音文本信息和录音总时长;
[0011]根据录音通道的种类对所述所有的录音文本信息进行分类,以得到各录音文本信息。
[0012]可选的,所述利用预设的第一训练模型对各所述录音文本信息进行角色识别,以得到角色识别结果,包括:
[0013]利用loss加权对预设的albert

tiny模型进行优化,以得到第一训练模型,利用所述第一训练模型对各所述录音文本信息进行二分类角色识别区分操作,以得到各角色预测结果;
[0014]判断各所述角色预测结果是否相同,若各所述角色预测结果不相同,则基于所述角色预测结果确定出角色识别结果。
[0015]可选的,所述判断各所述角色预测结果是否相同之后,还包括:
[0016]若各所述角色预测结果相同,则基于各所述角色预测结果确定出各预测角色以及相应的角色预测概率;
[0017]从所有的角色预测概率中筛选出角色预测概率最大值作为角色概率,基于所述角色概率以及与所述角色概率相对应的预测角色确定出角色识别结果。
[0018]可选的,所述利用预设的第二训练模型对所述录音文本信息进行角色序列标注,以得到标注后的录音文本内容,包括:
[0019]确定出所述录音文本信息中的各标注文本信息,利用loss加权对预设的electra

base模型进行优化,以得到第二训练模型;
[0020]基于各所述标注文本信息并利用所述第二训练模型对所述录音文本信息进行角色序列标注,以得到标注后的录音文本内容。
[0021]可选的,所述利用loss加权对预设的electra

base模型进行优化,以得到第二训练模型,包括:
[0022]从预设的训练方法中确定出第二训练方法;
[0023]利用第二训练方法和loss加权对所述electra

base模型的Embedding层进行训练,以得到所述第二训练模型;
[0024]相应的,所述利用loss加权对预设的albert

tiny模型进行优化,以得到第一训练模型,包括:
[0025]从预设的训练方法中确定出第一训练方法;
[0026]利用第一训练方法和loss加权对所述albert

tiny模型的Embedding层进行训练,以得到所述第一训练模型。
[0027]可选的,所述判断所述标注后的录音文本信息的信息长度是否小于预设的处理长度之后,还包括:
[0028]若所述标注后的录音文本信息的信息长度不小于预设的处理长度,则采用滑窗分割处理方法对所述标注后的录音文本信息进行分割,以得到标注后的子录音文本信息,基于所有的所述标注后的子录音文本信息确定出角色识别结果。
[0029]第二方面,本申请公开了一种录音文本角色识别装置,包括:
[0030]录音内容获取模块,用于获取待识别的录音内容,并基于所述录音内容确定出各录音文本信息和录音总时长;
[0031]第一角色识别结果确定模块,用于确定出所述录音总时长与预设阈值之间的大小关系,若所述录音总时长大于预设阈值,则利用预设的第一训练模型对各所述录音文本信息进行角色识别,以得到角色识别结果;
[0032]第二角色识别结果确定模块,用于若所述录音总时长小于预设阈值,则利用预设的第二训练模型对各所述录音文本信息进行角色序列标注,以得到标注后的各录音文本信息,判断所述标注后的录音文本信息的信息长度是否小于预设的处理长度,若所述标注后的录音文本信息的信息长度小于预设的处理长度,则基于所述标注后的录音文本信息确定出角色识别结果。
[0033]第三方面,本申请公开了一种电子设备,包括:
[0034]存储器,用于保存计算机程序;
[0035]处理器,用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种录音文本角色识别方法,其特征在于,包括:获取待识别的录音内容,并基于所述录音内容确定出各录音文本信息和录音总时长;确定出所述录音总时长与预设阈值之间的大小关系,若所述录音总时长大于预设阈值,则利用预设的第一训练模型对各所述录音文本信息进行角色识别,以得到角色识别结果;若所述录音总时长小于预设阈值,则利用预设的第二训练模型对各所述录音文本信息进行角色序列标注,以得到标注后的各录音文本信息,判断所述标注后的录音文本信息的信息长度是否小于预设的处理长度,若所述标注后的录音文本信息的信息长度小于预设的处理长度,则基于所述标注后的录音文本信息确定出角色识别结果。2.根据权利要求1所述的录音文本角色识别方法,其特征在于,所述获取待识别的录音内容,并基于所述录音内容确定出各录音文本信息和录音总时长,包括:获取待识别的录音内容,并利用第三方语音识别技术对所述录音内容进行识别处理,以得到所有的录音文本信息和录音总时长;根据录音通道的种类对所述所有的录音文本信息进行分类,以得到各录音文本信息。3.根据权利要求1所述的录音文本角色识别方法,其特征在于,所述利用预设的第一训练模型对各所述录音文本信息进行角色识别,以得到角色识别结果,包括:利用loss加权对预设的albert

tiny模型进行优化,以得到第一训练模型,利用所述第一训练模型对各所述录音文本信息进行二分类角色识别区分操作,以得到各角色预测结果;判断各所述角色预测结果是否相同,若各所述角色预测结果不相同,则基于所述角色预测结果确定出角色识别结果。4.根据权利要求3所述的录音文本角色识别方法,其特征在于,所述判断各所述角色预测结果是否相同之后,还包括:若各所述角色预测结果相同,则基于各所述角色预测结果确定出各预测角色以及相应的角色预测概率;从所有的角色预测概率中筛选出角色预测概率最大值作为角色概率,基于所述角色概率以及与所述角色概率相对应的预测角色确定出角色识别结果。5.根据权利要求4所述的录音文本角色识别方法,其特征在于,所述利用预设的第二训练模型对所述录音文本信息进行角色序列标注,以得到标注后的录音文本内容,包括:确定出所述录音文本信息中的各标注文本信息,利用loss加权对预设的electra

base模型进行优化,以得到第二训练模型;基于各所述标注文本信息并利用所述第二训练模型对所述录音文本信息进行角...

【专利技术属性】
技术研发人员:陈倩倩蒋林林周柳阳
申请(专利权)人:上海销氪信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1