一种角色识别智能语音设备制造技术

技术编号:29159879 阅读:66 留言:0更新日期:2021-07-06 23:00
本发明专利技术涉及语音识别技术领域,具体涉及一种角色识别智能语音设备,包括:采集模块,用于采集语音会话;切分模块,用于对语音会话进行切分,得到多个语音片段;识别模块,用于根据预设的语言模型和声学模型逐个识别语音片段中的说话人身份,并得到说话人的数量;修正模块,用于逐个从语音片段中提取说话人的声音特征,采用聚类算法对声音特征进行聚类,得到聚类的种类数量,并判断种类数量与说话人的数量是否相等,如果种类数量与说话人的数量不相等,发送重新切分的指令到切分模块;输出模块,用于输出说话人身份。本发明专利技术解决了现有技术对时长较短的语音会话无法进行准确的角色识别的技术问题。

【技术实现步骤摘要】
一种角色识别智能语音设备
本专利技术涉及语音识别
,具体涉及一种角色识别智能语音设备。
技术介绍
通常,对于说话人的角色识别来说,先检测谈话语音中说话人身份的改变点,并利用这些改变点将谈话语音分割成多个语音片段;再采用聚类算法将属于同一说话人身份的语音片段聚类在一起,并根据聚类结果得到语音会话中说话人个数以及各说话人的语音。基于语音片段的特征进行聚类,在不同说话人的语音片段之间的特征差异很小时无法对相应语音片段的说话人身份进行有效识别。对此,中国专利CN111583906A公开了一种语音会话的角色识别方法,包括步骤:获取待识别语音会话;对待识别语音会话进行切分,得到多个语音片段;利用预先训练的多个语言模型和多个声学模型,识别得到多个语音片段中的每个语音片段的说话人身份;其中,多个语言模型是区分角色的,每个语言模型对应于一个角色;多个声学模型是区分角色的,每个声学模型对应于一个角色。在上述技术方案中,利用已知说话人身份的语音信息,并充分考虑声学特征以及文本特征,实现对语音会话的识别,从而对相应语音片段的说话人身份进行有效识别。但是,当说话人的语音会话时长较短时,切分以后的语音片段的时长就会更短,导致语音片段中可能会丢失掉声学特征以及文本特征,故而使得对于时长较短的语音会话无法进行准确的角色识别。
技术实现思路
本专利技术提供一种角色识别智能语音设备,解决了现有技术对时长较短的语音会话无法进行准确的角色识别的技术问题。本专利技术提供的基础方案为:一种角色识别智能语音设备,包括:采集模块,用于采集语音会话;切分模块,用于对语音会话进行语音识别,以得到语音会话的录音时长,判断录音时长与时长阈值的大小,若录音时长大于时长阈值,对语音会话进行切分,得到多个语音片段;识别模块,用于根据预设的语言模型和声学模型逐个识别语音片段中的说话人身份,并得到说话人的数量;修正模块,用于逐个从语音片段中提取说话人的声音特征,采用聚类算法对声音特征进行聚类,得到聚类的种类数量,并判断种类数量与说话人的数量是否相等:如果种类数量与说话人的数量相等,发送输出说话人身份的指令到输出模块;如果种类数量与说话人的数量不相等,发送重新切分的指令到切分模块;输出模块,用于输出说话人身份以及对应的语音会话的内容。本专利技术的工作原理及优点在于:(1)在对语音会话进行切分之前,先判断录音时长与时长阈值的大小:如果录音时长大于时长阈值,表明录音时长相对比较长,对语音会话切分不至于丢失掉其中的声学特征和文本特征,故而对语音会话进行切分,得到多个语音片段;反之,如果录音时长短于时长阈值,表明录音时长相对比较短,对语音会话切分很可能丢失掉其中的声学特征和文本特征,故而不对语音会话进行切分。通过这样的方式,当语音会话的录音时长比较短时,能够避免无法进行准确的角色识别。(2)在得到每个语音片段中的说话人身份以后,提取说话人的声音特征并进行聚类:如果种类数量与说话人的数量相等,表明说话人与声音特征逐个对应;反之,如果种类数量与说话人的数量不相等,表明说话人与声音特征没有逐个对应,从而需要重新切分语音会话。通过这样的方式,能够对切分过程进行反馈,提高说话人角色识别的准确性。本专利技术当录音时长比较长时才对语音会话进行切分,能够确保经过切分不丢失掉其中的声学特征和文本特征,解决了现有技术对时长较短的语音会话无法进行准确的角色识别的技术问题。进一步,切分模块还用于,若录音时长短于时长阈值,复制多份语音会话以使得经过复制后的语音会话的录音时长大于时长阈值,并对语音会话进行切分以得到多个语音片段。有益效果在于:当录音时长短于时长阈值时,复制多份语音会话以使得经过复制后的语音会话的录音时长大于时长阈值,既能够实现切分,又可以避免因为录音时长短而丢失掉其中的声学特征和文本特征。进一步,识别模块还用于,将语音片段逐个输入到语言模型中,得到语音片段属于每个角色时的第一得分;将语音片段逐个输入到声学模型中,得到语音片段属于每个角色时的第二得分;根据第一得分和第二得分,确定语音片段的说话人身份。有益效果在于:第一得分反映文本特征,第二得分反映声学特征,通过这样的方式将第一得分和第二得分结合起来确定语音片段的说话人身份,综合考虑了文本特征与声学特征,从而提高了识别的准确率。进一步,识别模块还用于在识别语音片段中的说话人身份之前,对语音片段进行增益处理。有益效果在于:当语音片段的响度过低时,通过这样的方式,能够提高语音片段的响度,避免因为响度过低而产生误差。进一步,识别模块还用于在识别语音片段中的说话人身份之前,对语音片段进行回声消除处理。有益效果在于:回音的存在会对语音片段形成干扰,通过这样的方式消除语音片段中的回声,能够降低回声干扰产生的误差。进一步,识别模块还用于在识别语音片段中的说话人身份之前,对语音片段进行降噪处理。有益效果在于:由于现实中很少存在完全没有杂音的环境,对语音片段进行降噪处理,剔除掉无关因素,有利于提高后续处理的准确性。进一步,输出模块还用于同步显示说话人身份以及对应的语音会话的内容。有益效果在于:通过这样的方式既便于当场进行核实,又利于对谈话过程进行实时监督。附图说明图1为本专利技术一种角色识别智能语音设备实施例的系统结构框图。具体实施方式下面通过具体实施方式进一步详细的说明:实施例1实施例基本如附图1所示,包括:采集模块,用于采集语音会话;切分模块,用于对语音会话进行语音识别,以得到语音会话的录音时长,判断录音时长与时长阈值的大小,若录音时长大于时长阈值,对语音会话进行切分,得到多个语音片段;识别模块,用于根据预设的语言模型和声学模型逐个识别语音片段中的说话人身份,并得到说话人的数量;修正模块,用于逐个从语音片段中提取说话人的声音特征,采用聚类算法对声音特征进行聚类,得到聚类的种类数量,并判断种类数量与说话人的数量是否相等:如果种类数量与说话人的数量相等,发送输出说话人身份的指令到输出模块;如果种类数量与说话人的数量不相等,发送重新切分的指令到切分模块;输出模块,用于输出说话人身份以及对应的语音会话的内容。具体实施过程如下:首先,采集模块采集语音会话,比如说,采用麦克风阵列来获取谈话者与被谈话者的声音;或者,采用多个枪型麦克风分别指向谈话者与被谈话者,来获取不同的语音信号。然后,切分模块对语音会话进行语音识别,以得到语音会话的录音时长。比如说,采用自动语音识别技术(AutomaticSpeechRecognition,简称ASR)进行自动识别,在识别到一句完整的句子后对语音会话进行处理,得到语音会话的录音信息以及录音时长。其中,录音信息是语音会话中的声音信息(比如说话人的声音以及噪声),录音时长是录音信息的时间长度。得到语音会话的录音时长以后,判断录音时长与时长阈值的大小,若录音时长大于时长本文档来自技高网...

【技术保护点】
1.一种角色识别智能语音设备,其特征在于,包括:/n采集模块,用于采集语音会话;/n切分模块,用于对语音会话进行语音识别,以得到语音会话的录音时长,判断录音时长与时长阈值的大小,若录音时长大于时长阈值,对语音会话进行切分,得到多个语音片段;/n识别模块,用于根据预设的语言模型和声学模型逐个识别语音片段中的说话人身份,并得到说话人的数量;/n修正模块,用于逐个从语音片段中提取说话人的声音特征,采用聚类算法对声音特征进行聚类,得到聚类的种类数量,并判断种类数量与说话人的数量是否相等:如果种类数量与说话人的数量相等,发送输出说话人身份的指令到输出模块;如果种类数量与说话人的数量不相等,发送重新切分的指令到切分模块;/n输出模块,用于输出说话人身份以及对应的语音会话的内容。/n

【技术特征摘要】
1.一种角色识别智能语音设备,其特征在于,包括:
采集模块,用于采集语音会话;
切分模块,用于对语音会话进行语音识别,以得到语音会话的录音时长,判断录音时长与时长阈值的大小,若录音时长大于时长阈值,对语音会话进行切分,得到多个语音片段;
识别模块,用于根据预设的语言模型和声学模型逐个识别语音片段中的说话人身份,并得到说话人的数量;
修正模块,用于逐个从语音片段中提取说话人的声音特征,采用聚类算法对声音特征进行聚类,得到聚类的种类数量,并判断种类数量与说话人的数量是否相等:如果种类数量与说话人的数量相等,发送输出说话人身份的指令到输出模块;如果种类数量与说话人的数量不相等,发送重新切分的指令到切分模块;
输出模块,用于输出说话人身份以及对应的语音会话的内容。


2.如权利要求1所述的角色识别智能语音设备,其特征在于,切分模块还用于,若录音时长短于时长阈值,复制多份语音会话以使得经过复制后的语音会话的录音时长大于时长阈值,并对语音会话进行切分以...

【专利技术属性】
技术研发人员:熊倩王宇骁王政王学春苏远超
申请(专利权)人:重庆风云际会智慧科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1