基于声音识别的同步录音录像方法、装置以及存储介质制造方法及图纸

技术编号:33758350 阅读:63 留言:0更新日期:2022-06-12 14:07
本申请公开了一种基于声音识别的同步录音录像方法、装置以及存储介质。其中,该方法包括:获取用户在办理业务过程中产生的视频图像信息和与视频图像信息对应的第一音频信息;根据第二音频信息判断第一音频信息是否为用户的真实音频,其中第二音频信息为预先采集的与用户对应的音频信息;以及在判断第一音频信息为用户的真实音频的情况下,根据视频图像信息和第一音频信息生成用户在业务过程中的同步录音录像信息。录音录像信息。录音录像信息。

【技术实现步骤摘要】
基于声音识别的同步录音录像方法、装置以及存储介质


[0001]本申请涉及智能识别
,特别是涉及一种基于声音识别的同步录音录像方法、装置以及存储介质。

技术介绍

[0002]基于银保监会监管要求,银行、保险、信托等金融机构均已开始推行“双录”措施,对自有理财产品和代理产品的销售过程实施实时管理。今年以来,双录逐步进入V3.0时代,客户购买金融产品不但可以随时随地通过手机自助完成双录,还可以极大降低了金融机构的人力成本,减少展业经理数量。
[0003]自助双录目前主要通过人脸识别等手段确保当前完成双录的人员为客户本人,但无法准确判断用户语音回答为本人真实回答,如双录过程出现代答情况,则存在一定的欺诈和管理风险。此外,采用人脸识别的方式需要提供用户身份证头像或者其他生活大头照作为比对源,有一定的隐私风险的问题。
[0004]针对上述的现有技术中存在的双录过程采用人脸识别的方式进行,因此无法准确判断用户语音回答为本人真实回答,并且人脸识别需要客户的人脸信息,进而还存在隐私泄露的风险的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本公开的实施例提供了一种基于声音识别的同步录音录像方法、装置以及存储介质,以至少解决现有技术中存在的双录过程采用人脸识别的方式进行,因此无法准确判断用户语音回答为本人真实回答,并且人脸识别需要客户的人脸信息,进而还存在隐私泄露的风险的技术问题。
[0006]根据本公开实施例的一个方面,提供了一种基于声音识别的同步录音录像方法,包括:获取用户在办理业务过程中产生的视频图像信息和与视频图像信息对应的第一音频信息;根据第二音频信息判断第一音频信息是否为用户的真实音频,其中第二音频信息为预先采集的与用户对应的音频信息;以及在判断第一音频信息为用户的真实音频的情况下,根据视频图像信息和第一音频信息生成用户在业务过程中的同步录音录像信息。
[0007]根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0008]根据本公开实施例的另一个方面,还提供了一种基于声音识别的同步录音录像装置,包括:信息获取模块,用于获取用户在办理业务过程中产生的视频图像信息和与视频图像信息对应的第一音频信息;判断模块,用于根据第二音频信息判断第一音频信息是否为用户的真实音频,其中第二音频信息为预先采集的与用户对应的音频信息;以及录像合成模块,用于在判断第一音频信息为用户的真实音频的情况下,根据视频图像信息和第一音频信息生成用户在业务过程中的同步录音录像信息。
[0009]根据本公开实施例的另一个方面,还提供了一种基于声音识别的同步录音录像装
置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取用户在办理业务过程中产生的视频图像信息和与视频图像信息对应的第一音频信息;根据第二音频信息判断第一音频信息是否为用户的真实音频,其中第二音频信息为预先采集的与用户对应的音频信息;以及在判断第一音频信息为用户的真实音频的情况下,根据视频图像信息和第一音频信息生成用户在业务过程中的同步录音录像信息。
[0010]在本公开实施例中,业务处理系统首先获取业务过程中产生的视频图像信息和第一音频信息,然后根据预先采集的用户的第二音频信息判断该第一音频是否为用户的真实音频,即通过音频对用户的身份进行认证。最终,在判断第一音频为用户真实音频的情况下,根据视频图像信息和第一音频信息合成同步录音录像,完成双录的操作。与现有双录过程采用人脸识别的方式相比,本方案通过音频确定用户的身份,可以准确判断用户语音回答为本人真实回答,防止他人假冒用户办理业务。此外,本方案只需要根据用户的声音即可完成身份的认证,不需要用户输入身份证或者照片等隐私信息,因此还可以防止用户的隐私泄露。从而达到了准确进行身份认证并且保护隐私的技术效果。进而解决了现有技术中存在的双录过程采用人脸识别的方式进行,因此无法准确判断用户语音回答为本人真实回答,并且人脸识别需要客户的人脸信息,进而还存在隐私泄露的风险的技术问题。
附图说明
[0011]此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0012]图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
[0013]图2是根据本公开实施例1所述的基于声音识别的同步录音录像的系统的示意图;
[0014]图3是根据本公开实施例1所述的双录流程示意图;
[0015]图4是根据本公开实施例1的第一个方面所述的基于声音识别的同步录音录像方法的流程示意图;
[0016]图5是根据本公开实施例1所述的双录操作过程的示意图;
[0017]图6是根据本公开实施例1所述的声纹比对过程的示意图;
[0018]图7是根据本公开实施例1所述的双录操作界面的示意图;
[0019]图8是根据本公开实施例2所述的基于声音识别的同步录音录像装置的示意图;以及
[0020]图9是根据本公开实施例3所述的基于声音识别的同步录音录像装置的示意图。
具体实施方式
[0021]为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0022]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0023]实施例1
[0024]根据本实施例,还提供了一种基于声音识别的同步录音录像方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0025]本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现基于声音识别的同步录音录像方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件F本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声音识别的同步录音录像方法,其特征在于,包括:获取用户在办理业务过程中产生的视频图像信息和与所述视频图像信息对应的第一音频信息;根据第二音频信息判断所述第一音频信息是否为所述用户的真实音频,其中所述第二音频信息为预先采集的与所述用户对应的音频信息;以及在判断所述第一音频信息为所述用户的真实音频的情况下,根据所述视频图像信息和所述第一音频信息生成所述用户在所述业务过程中的同步录音录像信息。2.根据权利要求1所述的方法,其特征在于,所述第二音频信息为用户声纹特征信息,并且根据第二音频信息判断所述第一音频信息是否为所述用户的真实音频,包括:提取所述第一音频信息包含的声纹特征信息;以及将所述第一音频信息包含的声纹特征信息与所述用户声纹特征信息进行比对,判断所述第一音频信息是否为所述用户的真实音频。3.根据权利要求1所述的方法,其特征在于,还包括:对所述视频图像信息进行活体检测,判断所述视频图像信息中用户是否为活体,并且根据所述视频图像信息和所述第一音频信息生成所述用户在所述业务过程中的同步录音录像信息,包括:在判断所述第一音频信息为所述用户的真实音频并且所述视频图像信息中用户为活体的情况下,生成所述同步录音录像信息。4.根据权利要求1

2任意一项所述的方法,其特征在于,还包括:提取视频图像信息中包含的第一人脸图像信息;根据第二人脸图像信息判断所述第一人脸图像信息是否为所述用户的真实人脸,其中所述第二人脸图像信息为预先采集的与所述用户对应的人脸信息,并且根据所述视频图像信息和所述第一音频信息生成所述用户在所述业务过程中的同...

【专利技术属性】
技术研发人员:林上青吴海英夏溧王洪斌蒋宁
申请(专利权)人:北京有限元科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1