【技术实现步骤摘要】
基于大数据的数据审核方法、装置及存储介质
本申请涉及大数据
,具体涉及一种基于大数据的数据审核方法、装置及存储介质。
技术介绍
现有的很多数据采集系统,除了系统表单上报验证之外,后台管理数据大都基于人工审核的方式,导致产生很多重复性的工作,浪费大量的人力物力,并且审核质量受人为因素影响。在已有数据表中,用户经常会针对这些数据期望过滤筛选出自己的目标数据,但往往这些目标数据需要经过表内、标间以及历史数据比较计算,过程冗长以及复杂,导致用户想要批量处理变得极其困难。此外,在数据采集系统中,经常会遇到验证需求需要变更的场景。每次审核逻辑的修改都需要重新编码、测试、发布等一系列工作,造成了很大的资源浪费,并且处理的及时性也较滞后。
技术实现思路
本申请实施例提供一种基于大数据的数据审核方法、装置及存储介质,能够根据应用场景确定用于审核所述数据表单的审核公式,按照审核复杂度由低到高的顺序,对至少一个目标数据标识对应的数据内容进行审核,提高数据审核效率。本申请实施例的第一方面提供了基于大数据的数据审核方法,所述方法包括:获取大数据平台中数据表单的应用场景,所述应用场景为表单验证应用场景或批量审核应用场景,所述数据表单包括多个数据内容,每一数据内容对应一个数据标识;获取与所述应用场景对应的用于审核所述数据表单的审核公式;确定所述多个数据内容对应的多个数据标识中属于预设白名单的至少一个目标数据标识;确定所述至少一个目标数据标识对应的数据内容的审核复杂度;按照审 ...
【技术保护点】
1.一种基于大数据的数据审核方法,其特征在于,所述方法包括:/n获取大数据平台中数据表单的应用场景,所述应用场景为表单验证应用场景或批量审核应用场景,所述数据表单包括多个数据内容,每一数据内容对应一个数据标识;/n获取与所述应用场景对应的用于审核所述数据表单的审核公式;/n确定所述多个数据内容对应的多个数据标识中属于预设白名单的至少一个目标数据标识;/n确定所述至少一个目标数据标识对应的数据内容的审核复杂度;/n按照审核复杂度由低到高的顺序,根据所述审核公式对所述至少一个目标数据标识对应的数据内容进行审核,在对所述至少一个目标数据标识对应的数据内容审核通过之后,对所述数据表单中除了所述至少一个目标数据标识对应的数据内容之外的其他数据内容进行审核。/n
【技术特征摘要】
1.一种基于大数据的数据审核方法,其特征在于,所述方法包括:
获取大数据平台中数据表单的应用场景,所述应用场景为表单验证应用场景或批量审核应用场景,所述数据表单包括多个数据内容,每一数据内容对应一个数据标识;
获取与所述应用场景对应的用于审核所述数据表单的审核公式;
确定所述多个数据内容对应的多个数据标识中属于预设白名单的至少一个目标数据标识;
确定所述至少一个目标数据标识对应的数据内容的审核复杂度;
按照审核复杂度由低到高的顺序,根据所述审核公式对所述至少一个目标数据标识对应的数据内容进行审核,在对所述至少一个目标数据标识对应的数据内容审核通过之后,对所述数据表单中除了所述至少一个目标数据标识对应的数据内容之外的其他数据内容进行审核。
2.根据权利要求1所述的方法,其特征在于,所述审核公式为表单验证应用场景下与所述数据表单对应的第一审核公式,所述按照审核复杂度由低到高的顺序,根据所述审核公式对所述至少一个目标数据标识对应的数据内容进行审核,包括:
按照审核复杂度由低到高的顺序,根据所述第一审核公式生成页面脚本;
将所述页面脚本写入所述数据表单中,并通过审核引擎运行所述页面脚本,以对所述至少一个目标数据标识对应的数据内容进行审核。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一审核公式生成页面脚本,包括:
根据所述第一审核公式生成预设脚本;
根据关键字标识从所述数据表单中提取关键字;
根据所述关键字替换所述预设脚本中的预设字段,得到所述页面脚本。
4.根据权利要求1所述的方法,其特征在于,若所述应用场景为批量审核应用场景,所述数据表单包括待批量审核的N个数据表单,所述N个数据表单具有相同的表单标签,N为正整数,所述按照审核复杂度由低到高的顺序,根据所述审核公式对所述至少一个目标数据标识对应的数据内容进行审核,包括:
根据所述表单标签查找地址树;
遍历所述地址树,根据所述地址树中每一子节点的数据内容地址读取数据内容,其中,遍历所述地址树的第二层子节点i以及所述第二层子节点i的所有子节点读取到的数据内容对应相同的目标数据标识,所述地址树中所述第二层子节点i及所述第二层子节点i的所有子节点对应的数据内容的审核复杂度与所述数据内容所处的层数呈正相关;调用与所述数据标识对应的第二审核公式,根据所述第二审核公式对具有所述相同的目标数据标识的多个数据内容进行批量审核,所述第二层子节点i为第二层中任一子节点。
5.根据权利要求4所述的方法,其特征在于,在所述调用与所述数据标识对应的第二审核公式之前,所述方法还包括:
获取M个数据表单的M个表单标识信息,M为大于N的正整数;
确定所述M个表单标识信息中的具有相同表单标签的N个表单标识信息;
确定所述N个表单标识信息对应的N个数据表单;
所述调用与所述数据标识对应的第二审核公式,包括:
根据所述数...
【专利技术属性】
技术研发人员:黎惟春,吴中山,
申请(专利权)人:深圳市维度统计咨询股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。