【技术实现步骤摘要】
一种智能双录质检方法和系统
[0001]本专利技术涉及双录质检
,尤其涉一种智能双录质检方法和系统。
技术介绍
[0002]在金融行业中,在购买一款金融理财产品的时候,为了更准确的让投资人知晓这款金融理财产品的风险,会要求投资人做一个风险揭示双录,双录包含录制音频和录制视频,录制音频内容为用户朗读预设的文字,录制视频内容为人物上半身包含头部。为了保证双录数据的有效性及可用性,需要对双录数据进行质检。
[0003]现有技术主要采用人工质检,这种方式不仅效率低,而且十分浪费人力资源,人力质检的强主观性也导致检测结果存在较大偏差。
技术实现思路
[0004]鉴于上述的分析,本专利技术实施例旨在提供一种智能双录质检方法和系统。用以解决现有双录质检采用人工质检效率低并且结果不准确的问题。
[0005]一方面,本专利技术实施例提供了一种智能双录质检方法,包括以下步骤:
[0006]实时获取每段双录视频流和对应的体征数据;
[0007]对每段双录视频流进行解码获得视频数据和音频数据;基于所述视频数据进行人脸识别检测,得到人脸识别检测结果;基于所述视频数据、音频数据和所述体征数据进行胁迫检测,得到胁迫检测分数;
[0008]将所有视频流的音频文件拼接为双录音频文件,对所述双录音频文件进行语音识别得到语音文本,基于所述语音文本进行话术检测得到话术检测分数;
[0009]基于人脸识别检测结果、胁迫检测分数,以及所述话术检测分数得到双录质检结果。
[0010]基 ...
【技术保护点】
【技术特征摘要】
1.一种智能双录质检方法,其特征在于,包括以下步骤:实时获取每段双录视频流和对应的体征数据;对每段双录视频流进行解码获得视频数据和音频数据;基于所述视频数据进行人脸识别检测,得到人脸识别检测结果;基于所述视频数据、音频数据和所述体征数据进行胁迫检测,得到胁迫检测分数;将所有视频流的音频文件拼接为双录音频文件,对所述双录音频文件进行语音识别得到语音文本,基于所述语音文本进行话术检测得到话术检测分数;基于人脸识别检测结果、胁迫检测分数,以及所述话术检测分数得到双录质检结果。2.根据权利要求1所述的智能双录质检方法,其特征在于,基于所述视频数据进行人脸识别检测,得到人脸识别检测结果,包括:基于第一段视频流的视频数据进行人脸识别检测,得到人脸识别检测结果;基于所述视频数据、音频数据和所述体征数据进行胁迫检测,得到胁迫检测分数,包括:基于第二段至最后一段视频流的视频数据、音频数据和对应的体征数据进行胁迫检测,得到胁迫检测分数。3.根据权利要求1所述的智能双录质检方法,其特征在于,所述基于人脸识别检测结果、胁迫检测分数,以及所述话术检测分数到双录质检结果,包括:当人脸识别检测结果为不通过,则双录质检结果为不通过;当人脸识别检测结果为通过,则根据公式Z=α1X4+β1X5计算双录质检分数;其中,X4表示胁迫检测分数,α1表示胁迫检测的权重,X5表示话术检测分数,β1表示话术检测的权重;若所述双录质检分数低于第一阈值,则双录质检不通过;否则双录质检通过。4.根据权利要求2所述的智能双录质检方法,其特征在于,基于第一段视频流的视频数据进行人脸识别检测,得到人脸识别检测结果,包括:提取所述视频数据中的多张关键帧图像;对于每张关键帧图像,基于预设的人脸识别模型在所述关键帧图像中提取人脸图像;根据人脸图像在所述关键帧图像中的位置,采用相似度匹配算法对人脸图像和目标人脸图像进行相似度匹配,得到所述关键帧图像的相似度匹配结果;根据所述多张关键帧的相似度匹配结果得到人脸识别检测结果。5.根据权利要求4所述的智能双录质检方法,其特征在于,根据人脸图像在所述关键帧图像中的位置,采用相似度匹配算法对人脸图像和目标人脸图像进行相似度匹配,得到所述关键帧图像的相似度匹配结果;根据所述多张关键帧的相似度匹配结果得到人脸识别检测结果,包括:在每张关键帧图像中,计算每张人脸的中心位置与所述关键帧图像的中心位置的距离;从最靠近关键帧图像中心位置的人脸图像开始到最远离关键帧图像中心位置的人脸图像为止,依次采用相似度匹配算法与目标人脸图像进行相似度匹配,若当前人脸图像与目标人脸图像相似,则匹配结束,该关键帧图像为合规图像;否则继续的提取下一张人脸图像与目标人脸图像进行相似度匹配;若当前关键帧图像中不存在与目标人脸图像的相似的人脸图像,则判断该关键帧图像
不合规;根据合规关键帧图像的数量与所述关键帧图像总数量的比值,得到人脸识别检测结果。6.根据权利要求2所述的智能双录质检方法,其特征在于,基于第二段至最后一段...
【专利技术属性】
技术研发人员:曾德,胡峻洁,户刘军,刘小婷,
申请(专利权)人:四川科瑞软件有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。