语音分离方法和装置及系统、存储介质制造方法及图纸

技术编号:24097220 阅读:21 留言:0更新日期:2020-05-09 10:59
本发明专利技术公开了一种语音分离方法和装置及系统、存储介质。其中,该方法包括:在第一角色音源对象与第二角色音源对象进行语音交互的过程中,获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段;对第一语音片段添加与第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对第二语音片段添加与第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;根据第一语音片段对应的第一采集时间及第二语音片段对应的第二采集时间,建立第一角色语音片段及第二角色语音片段之间的关联关系。本发明专利技术解决了语音分离操作复杂度较高的技术问题。

Speech separation method, device, system and storage medium

【技术实现步骤摘要】
语音分离方法和装置及系统、存储介质
本专利技术涉及计算机领域,具体而言,涉及一种语音分离方法和装置及系统、存储介质。
技术介绍
在很多服务行业,通常会有对服务人员提供服务的过程进行录音并对录音进行分析的需求。但是在相关技术提供的语音识别方法,很难将服务过程中不同角色的声音进行区分,从而导致语音分离操作复杂度高的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音分离方法和装置及系统、存储介质,以至少解决语音分离操作复杂度较高的技术问题。根据本专利技术实施例的一个方面,提供了一种语音分离方法,包括:在第一角色音源对象与第二角色音源对象进行语音交互的过程中,获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段,其中,上述第一位置与上述第一角色音源对象所在第一对象位置之间的距离小于第一阈值,上述第二位置与上述第二角色音源对象所在第二对象位置之间的距离小于第二阈值;对上述第一语音片段添加与上述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对上述第二语音片段添加与上述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;根据上述第一语音片段对应的第一采集时间及上述第二语音片段对应的第二采集时间,建立上述第一角色语音片段及上述第二角色语音片段之间的关联关系。作为一种可选的实施方式,上述获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段包括:获取通过上述第一语音采集装置采集到的至少两个第一语音采集片段,及上述第二语音采集装置采集到的至少两个第二语音采集片段;比对上述至少两个第一语音采集片段的音量,并将音量最高的第一语音采集片段确定为上述第一语音片段;并比对上述至少两个第二语音采集片段的音量,并将音量最高的第二语音采集片段确定为上述第二语音片段。作为一种可选的实施方式,在上述对上述第一语音片段添加与上述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对上述第二语音片段添加与上述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段之前,还包括:对上述第一语音片段及上述第二语音片段进行降噪处理。作为一种可选的实施方式,上述根据上述第一语音片段对应的第一采集时间及上述第二语音片段对应的第二采集时间,建立上述第一角色语音片段及上述第二角色语音片段之间的关联关系包括:对上述第一角色语音片段进行语音识别,以得到第一角色文本,并对上述第二角色语音片段进行语音识别,以得到第二角色文本;按照上述第一采集时间及上述第二采集时间的时间顺序,对上述第一角色文本及上述第二角色文本进行排列,以生成具有上述关联关系的文本文件。作为一种可选的实施方式,上述根据上述第一语音片段对应的第一采集时间及上述第二语音片段对应的第二采集时间,建立上述第一角色语音片段及上述第二角色语音片段之间的关联关系包括:对上述第一角色语音片段进行语音识别,以得到第一角色文本,并对上述第二角色语音片段进行语音识别,以得到第二角色文本;按照上述第一采集时间及上述第二采集时间的时间顺序,对上述第一角色文本及上述第二角色文本进行排列,以生成具有上述关联关系的文本文件。根据本专利技术实施例的另一方面,还提供了一种语音分离装置,包括:获取单元,语音在第一角色音源对象与第二角色音源对象进行语音交互的过程中,获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段,其中,上述第一位置与上述第一角色音源对象所在第一对象位置之间的距离小于第一阈值,上述第二位置与上述第二角色音源对象所在第二对象位置之间的距离小于第二阈值;标记单元,用于对上述第一语音片段添加与上述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对上述第二语音片段添加与上述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;建立单元,用于根据上述第一语音片段对应的第一采集时间及上述第二语音片段对应的第二采集时间,建立上述第一角色语音片段及上述第二角色语音片段之间的关联关系。根据本专利技术实施例的另一方面,还提供了一种语音分离系统,包括:第一语音采集装置,位于第一位置上,用于采集第一角色语音对象的第一语音片段,其中,上述第一位置与上述第一角色音源对象所在第一对象位置之间的距离小于第一阈值;第二语音采集装置,位于第二位置上,用于采集第二角色语音对象的第二语音片段,其中,上述第二位置与上述第二角色音源对象所在第二对象位置之间的距离小于第二阈值;处理器,与上述第一语音采集装置连接,并与上述第二语音采集装置连接,用于为上述第一语音片段添加与上述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并为上述第二语音片段添加与上述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;还用于根据上述第一语音片段对应的第一采集时间及上述第二语音片段对应的第二采集时间,建立上述第一角色语音片段及上述第二角色语音片段之间的关联关系。作为一种可选的实施方式,上述第一语音采集装置包括:位于上述第一角色音源对象的手持装置中的拾音部件,上述第二语音采集装置包括:位于上述第二角色音源对象所佩戴的录音设备中的拾音部件。作为一种可选的实施方式,上述第一语音采集装置包括:位于柜台第一侧的第一拾音部件,上述第二语音采集装置包括:位于柜台第二侧的第二拾音部件。根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音分离方法。在本专利技术实施例中,通过不同位置上的分体式的语音采集装置来直接采集不同角色音源对象的语音片段,并为不同语音片段添加不同角色音源对象对应的角色标记,然后再对该语音交互过程中标记后的角色语音片段建立关联关系,从而实现直接利用分体式的语音采集装置分别采集不同角色语音对象各自的语音片段,再对其分别进行角色标记,而无需对全部的语音交互内容进行识别分离,以达到简化语音分离操作的目的,进而克服相关技术语音分离操作的复杂度较高的问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的语音分离方法的流程图;图2是根据本专利技术实施例的一种可选的语音分离方法的示意图;图3是根据本专利技术实施例的另一种可选的语音分离方法的示意图;图4是根据本专利技术实施例的一种可选的语音分离装置的结构示意图;图5是根据本专利技术实施例的一种可选的语音分离系统的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本文档来自技高网
...

【技术保护点】
1.一种语音分离方法,其特征在于,包括:/n在第一角色音源对象与第二角色音源对象进行语音交互的过程中,获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段,其中,所述第一位置与所述第一角色音源对象所在第一对象位置之间的距离小于第一阈值,所述第二位置与所述第二角色音源对象所在第二对象位置之间的距离小于第二阈值;/n对所述第一语音片段添加与所述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对所述第二语音片段添加与所述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;/n根据所述第一语音片段对应的第一采集时间及所述第二语音片段对应的第二采集时间,建立所述第一角色语音片段及所述第二角色语音片段之间的关联关系。/n

【技术特征摘要】
1.一种语音分离方法,其特征在于,包括:
在第一角色音源对象与第二角色音源对象进行语音交互的过程中,获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段,其中,所述第一位置与所述第一角色音源对象所在第一对象位置之间的距离小于第一阈值,所述第二位置与所述第二角色音源对象所在第二对象位置之间的距离小于第二阈值;
对所述第一语音片段添加与所述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对所述第二语音片段添加与所述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段;
根据所述第一语音片段对应的第一采集时间及所述第二语音片段对应的第二采集时间,建立所述第一角色语音片段及所述第二角色语音片段之间的关联关系。


2.根据权利要求1所述的方法,其特征在于,所述获取第一位置上的第一语音采集装置采集到的第一语音片段,及第二位置上的第二语音采集装置采集到的第二语音片段包括:
获取通过所述第一语音采集装置采集到的至少两个第一语音采集片段,及所述第二语音采集装置采集到的至少两个第二语音采集片段;
比对所述至少两个第一语音采集片段的音量,并将音量最高的第一语音采集片段确定为所述第一语音片段;并比对所述至少两个第二语音采集片段的音量,并将音量最高的第二语音采集片段确定为所述第二语音片段。


3.根据权利要求1所述的方法,其特征在于,在所述对所述第一语音片段添加与所述第一角色音源对象匹配的第一角色标记,得到第一角色语音片段,并对所述第二语音片段添加与所述第二角色音源对象匹配的第二角色标记,得到第二角色语音片段之前,还包括:
对所述第一语音片段及所述第二语音片段进行降噪处理。


4.根据权利要求1所述的方法,其特征在于,所述根据所述第一语音片段对应的第一采集时间及所述第二语音片段对应的第二采集时间,建立所述第一角色语音片段及所述第二角色语音片段之间的关联关系包括:
按照所述第一采集时间及所述第二采集时间的时间顺序,对所述第一角色语音片段及所述第二角色语音片段进行排列,以生成具有所述关联关系的语音文件。


5.根据权利要求1所述的方法,其特征在于,所述根据所述第一语音片段对应的第一采集时间及所述第二语音片段对应的第二采集时间,建立所述第一角色语音片段及所述第二角色语音片段之间的关联关系包括:
对所述第一角色语音片段进行语音识别,以得到第一角色文本,并对所述第二角色语音片段进行语音识别,以得到第二角色文本;
按照所述...

【专利技术属性】
技术研发人员:黄照徐世超梁志婷
申请(专利权)人:秒针信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1