本说明书实施例公开了一种语音信息处理方法、装置、电子设备、介质及程序产品。其中,该方法包括:获取目标信息,目标信息包括目标语音数据和/或目标语音数据对应的目标账号标识;基于目标信息从目标声纹库中进行检索,得到目标风险感知信息,目标声纹库包括至少一个目标任务对应的目标声纹子库,目标声纹子库包括按照基于声纹特征确定的目标任务对应的目标数据存储结构存储的多条语音信息,语音信息包括语音数据和语音数据对应的账号标识;基于目标风险感知信息确定目标信息对应的目标风险结果。险结果。险结果。
【技术实现步骤摘要】
语音信息处理方法、装置、电子设备、介质及程序产品
[0001]本说明书涉及计算机
,尤其涉及一种语音信息处理方法、装置、电子设备、介质及程序产品。
技术介绍
[0002]在线服务、远程服务逐步普及,其中通过电话语音、网络语音进行咨询、投诉、服务办理的方式是最为快捷有效的方式。但是利用这种服务,会存在别有用心的用户进行欺诈或其它不良行为,比如为风控账号解除限制的申诉、比如对消费服务的恶意投诉等,目前客权系统仅能通过账号维度记录该用户是否有风险,但是当这个用户更换账号后就很难识别。
技术实现思路
[0003]本说明书实施例提供了一种语音信息处理方法、装置、电子设备、介质及程序产品,利用声纹特征,结合目标任务场景的特殊属性,挖掘出与语音数据中文本无关但是与语音数据对应的身份相关的目标数据存储结构,针对各种目标任务场景提供对应风险识别的挖掘,更加有效到帮助需要语音交互的客服系统提前预知风险。上述技术方案如下:
[0004]第一方面,本说明书实施例提供了一种语音信息处理方法,包括:
[0005]获取目标信息;上述目标信息包括目标语音数据和/或上述目标语音数据对应的目标账号标识;
[0006]基于上述目标信息从目标声纹库中进行检索,得到目标风险感知信息;上述目标声纹库包括至少一个目标任务对应的目标声纹子库;上述目标声纹子库包括按照基于声纹特征确定的上述目标任务对应的目标数据存储结构存储的多条语音信息;上述语音信息包括语音数据和上述语音数据对应的账号标识;
[0007]基于上述目标风险感知信息确定上述目标信息对应的目标风险结果。
[0008]在一种可能的实现方式中,上述基于上述目标信息从目标声纹库中进行检索,得到目标风险感知信息之前,上述方法还包括:
[0009]获取上述多条语音信息;
[0010]基于上述多条语音信息中各语音数据对应的声纹特征以及上述账号标识确定至少一个目标任务对应的目标数据存储结构;
[0011]将上述多条语音信息按照上述至少一个目标任务对应的目标数据存储结构存储在目标声纹库中。
[0012]在一种可能的实现方式中,上述基于上述多条语音信息中各语音数据对应的声纹特征以及上述账号标识确定至少一个目标任务对应的目标数据存储结构,包括:
[0013]基于上述多条语音信息中各语音数据对应的声纹特征对上述多条语音信息进行聚类;
[0014]根据上述多条语音信息的聚类结果确定至少一个目标任务对应的目标数据存储
结构。
[0015]在一种可能的实现方式中,上述基于上述多条语音信息中各语音数据对应的声纹特征对上述多条语音信息进行聚类,包括:
[0016]基于上述多条语音信息中各语音数据对应的声纹特征对账号标识相同的语音数据进行聚类。
[0017]在一种可能的实现方式中,上述至少一个目标任务包括第一目标任务;上述目标声纹库包括上述第一目标任务对应的第一目标声纹子库;上述第一目标声纹子库包括以账号标识为主键按照上述账号标识下各语音数据对应的声纹特征进行分类存储的上述多条语音信息。
[0018]在一种可能的实现方式中,上述基于上述多条语音信息中各语音数据对应的声纹特征对上述多条语音信息进行聚类,包括:
[0019]基于上述多条语音信息中各语音数据对应的声纹特征将声源属性相同的语音信息进行聚类。
[0020]在一种可能的实现方式中,上述至少一个目标任务包括第二目标任务;上述目标声纹库包括上述第二目标任务对应的第二目标声纹子库;上述第二目标声纹子库包括以声源属性为主键按照上述声源属性下各语音数据对应的账号标识进行分类存储的上述多条语音信息。
[0021]在一种可能的实现方式中,上述目标声纹库包括多个目标任务各自对应的目标声纹子库;上述多个目标任务各自对应的目标声纹子库之间的数据相互隔离。
[0022]第二方面,本说明书实施例提供了一种语音信息处理装置,包括:
[0023]第一获取模块,用于获取目标信息;上述目标信息包括目标语音数据和/或上述目标语音数据对应的目标账号标识;
[0024]检索模块,用于基于上述目标信息从目标声纹库中进行检索,得到目标风险感知信息;上述目标声纹库包括至少一个目标任务对应的目标声纹子库;上述目标声纹子库包括按照基于声纹特征确定的上述目标任务对应的目标数据存储结构存储的多条语音信息;上述语音信息包括语音数据和上述语音数据对应的账号标识;
[0025]第一确定模块,用于基于上述目标风险感知信息确定上述目标信息对应的目标风险结果。
[0026]在一种可能的实现方式中,上述语音信息处理装置还包括:
[0027]第二获取模块,用于获取上述多条语音信息;
[0028]第二确定模块,用于基于上述多条语音信息中各语音数据对应的声纹特征以及上述账号标识确定至少一个目标任务对应的目标数据存储结构;
[0029]存储模块,用于将上述多条语音信息按照上述至少一个目标任务对应的目标数据存储结构存储在目标声纹库中。
[0030]在一种可能的实现方式中,上述第二确定模块包括:
[0031]聚类单元,用于基于上述多条语音信息中各语音数据对应的声纹特征对上述多条语音信息进行聚类;
[0032]确定单元,用于根据上述多条语音信息的聚类结果确定至少一个目标任务对应的目标数据存储结构。
[0033]在一种可能的实现方式中,上述聚类单元具体用于:
[0034]基于上述多条语音信息中各语音数据对应的声纹特征对账号标识相同的语音数据进行聚类。
[0035]在一种可能的实现方式中,上述至少一个目标任务包括第一目标任务;上述目标声纹库包括上述第一目标任务对应的第一目标声纹子库;上述第一目标声纹子库包括以账号标识为主键按照上述账号标识下各语音数据对应的声纹特征进行分类存储的上述多条语音信息。
[0036]在一种可能的实现方式中,上述聚类单元具体用于:
[0037]基于上述多条语音信息中各语音数据对应的声纹特征将声源属性相同的语音信息进行聚类。
[0038]在一种可能的实现方式中,上述至少一个目标任务包括第二目标任务;上述目标声纹库包括上述第二目标任务对应的第二目标声纹子库;上述第二目标声纹子库包括以声源属性为主键按照上述声源属性下各语音数据对应的账号标识进行分类存储的上述多条语音信息。
[0039]在一种可能的实现方式中,上述目标声纹库包括多个目标任务各自对应的目标声纹子库;上述多个目标任务各自对应的目标声纹子库之间的数据相互隔离。
[0040]第三方面,本说明书实施例提供了一种电子设备,包括:处理器以及存储器;
[0041]上述处理器与上述存储器相连;
[0042]上述存储器,用于存储可执行程序代码;
[0043]上述处理器通过读取上述存储器中存储的可执行程序代码来运行与上述可执行程序代码对应的程序,以用于执行本说明书实施例第一方面或第一方面的任意本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音信息处理方法,所述方法包括:获取目标信息;所述目标信息包括目标语音数据和/或所述目标语音数据对应的目标账号标识;基于所述目标信息从目标声纹库中进行检索,得到目标风险感知信息;所述目标声纹库包括至少一个目标任务对应的目标声纹子库;所述目标声纹子库包括按照基于声纹特征确定的所述目标任务对应的目标数据存储结构存储的多条语音信息;所述语音信息包括语音数据和所述语音数据对应的账号标识;基于所述目标风险感知信息确定所述目标信息对应的目标风险结果。2.如权利要求1所述的方法,所述基于所述目标信息从目标声纹库中进行检索,得到目标风险感知信息之前,所述方法还包括:获取所述多条语音信息;基于所述多条语音信息中各语音数据对应的声纹特征以及所述账号标识确定至少一个目标任务对应的目标数据存储结构;将所述多条语音信息按照所述至少一个目标任务对应的目标数据存储结构存储在目标声纹库中。3.如权利要求2所述的方法,所述基于所述多条语音信息中各语音数据对应的声纹特征以及所述账号标识确定至少一个目标任务对应的目标数据存储结构,包括:基于所述多条语音信息中各语音数据对应的声纹特征对所述多条语音信息进行聚类;根据所述多条语音信息的聚类结果确定至少一个目标任务对应的目标数据存储结构。4.如权利要求3所述的方法,所述基于所述多条语音信息中各语音数据对应的声纹特征对所述多条语音信息进行聚类,包括:基于所述多条语音信息中各语音数据对应的声纹特征对账号标识相同的语音数据进行聚类。5.如权利要求4所述的方法,所述至少一个目标任务包括第一目标任务;所述目标声纹库包括所述第一目标任务对应的第一目标声纹子库;所述第一目标声纹子库包括以账号标识为主键按照所述账号标识下各语音数据对应的声纹特征进行分类存储的所述多条语音信息。6.如权利要求3
‑
5任一项所述的方法,所述基于所述多条语音信息中各语音数据对应的声纹特征对所述多条语音信息进行聚...
【专利技术属性】
技术研发人员:赵鹏飞,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。