一种基于隐私计算的大数据分析金融服务平台制造技术

技术编号:34880484 阅读:30 留言:0更新日期:2022-09-10 13:37
本发明专利技术公开了一种基于隐私计算的大数据分析金融服务平台,包括大数据分析子系统、应用支撑子系统、前端页面子系统以及后台管理子系统;大数据分析子系统包括数据采集集成模块、数据治理模块和数据沙箱模块,数据采集集成模块用于对各类数据源的采集以及数据同步,数据治理模块主要用于对数据采集集成模块采集后的数据进行数据ETL操作,数据沙箱模块为银行贷款业务提供基于隐私计算的业务模型;基于隐私计算包括具有一定敏感性的数据经过独立的脱敏空间进行数据去标识化处理;应用支撑子系统包括接口网关模块、身份中心模块和授权中心模块;前端页面子系统包括信贷业务模块和用户中心模块。本发明专利技术方便了银行贷款业务的实时办理。时办理。时办理。

【技术实现步骤摘要】
一种基于隐私计算的大数据分析金融服务平台


[0001]本专利技术涉及数字金融及大数据
,特别是一种基于隐私计算的大数据分析金融服务平台。

技术介绍

[0002]因为数据要素支撑不足,下沉客户拓展困难,银行传统模式更多的面相优质客户,客户群体较局限且放贷成本较高。目前银行在进行个人、企业信用评价或者风险控制时,主要基于本银行所掌握的个人、企业业务数据,或者需要个人、企业进行相关资质上传审核,导致贷款办理流程较为繁琐,银行的风控能力也难以提升。
[0003]政府数据缺少安全有序的对外开放模式,难以在保证数据隐私安全的基础上对社会化应用产生价值。政府、企业数据缺少一个安全的融合利用环境,各数据源相对独立,形成信息孤岛。目前银行大多通过点对点方式获取相关政府公共数据,对接成本较高,而且数据未经过长期的质量分析、治理,利用较为困难。
[0004]授信额度难以根据评估人资产情况、信用情况等信息进行动态调整,贷前、中、后的风险控制难以对用户无感进行,目前银行对于贷后的风控成本较高,而且难以收集到客户最新的动态资产情况进行评估,用户最新的资产情况:例如工作调整、婚姻情况等也难以实时体现在银行的风控分析结果上。
[0005]小微企业或大多数用户融资时因没有太多可供抵押的资产,而银行开发纯信用贷款产品成本较高,数据维度较窄,导致用户贷款过程需要提交多份资质材料,整个过程需要多次前往银行网点,多为线下进行,整个审批流程持续时间长。
[0006]目前银行贷款大多在各自独立app进行,用户进行贷款服务时难以进行产品的横向比较,很难在短时间获取匹配度最高的优质产品,市场上缺少一个集成各银行产品的统一平台。因此,亟需研发一款大数据分析金融服务平台以解决上述的问题。

技术实现思路

[0007]本专利技术的目的在于,提供一种基于隐私计算的大数据分析金融服务平台。本专利技术创新了一种公共数据的开放利用方式,降低了银行自行对接数据的成本,方便了贷款业务的实时办理。
[0008]本专利技术的技术方案:一种基于隐私计算的大数据分析金融服务平台,包括大数据分析子系统、应用支撑子系统、前端页面子系统以及后台管理子系统;
[0009]所述大数据分析子系统包括数据采集集成模块、数据治理模块和数据沙箱模块,所述数据采集集成模块用于对各类数据源的采集以及数据同步,所述数据治理模块主要用于对数据采集集成模块采集后的数据进行数据ETL操作,所述数据沙箱模块为银行贷款业务提供基于隐私计算的业务模型;所述基于隐私计算包括具有一定敏感性的数据经过独立的脱敏空间进行数据去标识化处理;
[0010]所述应用支撑子系统包括接口网关模块、身份中心模块和授权中心模块,所述接
口网关模块为数据沙箱模块中开发完成的业务模型结果提供到前端贷款业务使用的链路支撑;
[0011]所述前端页面子系统包括信贷业务模块和用户中心模块。
[0012]前述的一种基于隐私计算的大数据分析金融服务平台中,所述数据去标识化处理结合了差分隐私的技术手段,对数值类型敏感数据添加了拉普拉斯噪声,使其每次被查询的结果均满足拉普拉斯分布,分布于真实值的周围,保证真实数据不被直接查询得到的前提下保留了数据的统计含义。
[0013]前述的一种基于隐私计算的大数据分析金融服务平台中,所述数据去标识化处理结合了差分隐私的技术手段包括以下实施步骤:
[0014]步骤一、通过数据采集集成模块实时获取各方来源数据,统一存放于大数据处理分析平台MaxCompute环境中,组成数据仓库最底层STG贴源层;
[0015]步骤二、对已归集的数据进行分层治理,首先对全域数据进行数据清洗,形成较高数据质量的ODS层;
[0016]步骤三、对ODS层数据进行分域建模,根据数据的不同业务属性,进行数据整合、数据建模,形成主题库表结构DWD层;
[0017]步骤四、根据贷款业务的实际需求,抽取DWD主题库中的核心业务字段,并结合根据业务需求分析得到的数据结果,形成DWS层专题层,同时对于专题层中涉及个人、企业隐私数据进行静态脱敏处理;
[0018]步骤五、将贷款模型分为贷款准入模型、授信额度测算模型和贷款风控模型。
[0019]前述的一种基于隐私计算的大数据分析金融服务平台中,所述步骤二中对全域数据进行数据清洗包括数据的内容标准化、数据的去重和数据关联回填补充。
[0020]前述的一种基于隐私计算的大数据分析金融服务平台中,所述数据采集集成模块支持同构、异构的各类数据源,并且支持实时、定时任务同步,根据源数据更新情况,自动对平台内数据进行同步更新。
[0021]前述的一种基于隐私计算的大数据分析金融服务平台中,所述数据ETL操作包括数据的清洗、比对、关联回填和标准化处理。
[0022]前述的一种基于隐私计算的大数据分析金融服务平台中,所述数据沙箱模块采用了开发空间、生产空间隔离的数据建模模式,开发空间数据经过去标识化和脱敏处理,保证隐私数据不可接触;所述数据沙箱模块在模型开发中使用评分卡模型和分箱的数据特征工程方法。
[0023]前述的一种基于隐私计算的大数据分析金融服务平台中,所述接口网关模块将所有的建模结果统一封装为模型接口,所有接口调用记录在区块链上进行存证。
[0024]前述的一种基于隐私计算的大数据分析金融服务平台中,所述身份中心模块与政务服务网的个人、法人单点登录体系对接,并与浙里办人脸认证接口进行结合,保证平台用户的实名性,登录到平台的用户需要经过人脸识别的二次认证。
[0025]前述的一种基于隐私计算的大数据分析金融服务平台中,所述授权中心模块提供模型数据接口与数据主体授权的关联,保证数据透出之前经过数据主体的充分授权,同时形成用户的授权记录表,用于后续的存证和追溯。
[0026]与现有技术相比,本专利技术的有益效果体现在:
[0027]1、创新了一种银行的风控服务方式,将银行所不具备的政府公共数据在基于隐私计算以及受限开放模式的技术环境上,安全有序开放给所需银行进行风控模型开发,拓宽了银行风控利用的数据维度,提升了银行风控水平,减少了贷款用户所需要提交的证明材料。
[0028]2、创新了一种公共数据的开放利用方式,将具有更高社会价值的受限开放数据在隐私计算的技术基础上进行有序开放利用,本专利技术平台的整体模型开发环境遵循数据沙箱的隔离理念,在隐私计算技术的保障下“数据可用不可见”,最终仅对外开放模型计算的结果,模型结果无法溯源倒推出个人、企业隐私源数据,并在数据主体授权的前提下,提供给银行作为风控、授信评估的参考。
[0029]3、实现了数据要素市场化配置的“从0到1”的突破,以数字驱动数字经济发展,平台与政府公共数据平台进行了有机结合,整体数据源由政府相关部分提供,经过数据治理、清洗、脱敏、去标签化处理等手段后,提供给部署在公共数据平台内的银行风控模型、银行授信模型等数据模型使用,公共数据平台与各数据源实时打通,保证了数据源的鲜活。提供给模型前的数据清洗、治本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私计算的大数据分析金融服务平台,其特征在于:包括大数据分析子系统、应用支撑子系统、前端页面子系统以及后台管理子系统;所述大数据分析子系统包括数据采集集成模块、数据治理模块和数据沙箱模块,所述数据采集集成模块用于对各类数据源的采集以及数据同步,所述数据治理模块主要用于对数据采集集成模块采集后的数据进行数据ETL操作,所述数据沙箱模块为银行贷款业务提供基于隐私计算的业务模型;所述基于隐私计算包括具有一定敏感性的数据经过独立的脱敏空间进行数据去标识化处理;所述应用支撑子系统包括接口网关模块、身份中心模块和授权中心模块,所述接口网关模块为数据沙箱模块中开发完成的业务模型结果提供到前端贷款业务使用的链路支撑;所述前端页面子系统包括信贷业务模块和用户中心模块。2.根据权利要求1所述的一种基于隐私计算的大数据分析金融服务平台,其特征在于:所述数据去标识化处理结合了差分隐私的技术手段,对数值类型敏感数据添加了拉普拉斯噪声,使其每次被查询的结果均满足拉普拉斯分布,分布于真实值的周围,保证真实数据不被直接查询得到的前提下保留了数据的统计含义。3.根据权利要求2所述的一种基于隐私计算的大数据分析金融服务平台,其特征在于:所述数据去标识化处理结合了差分隐私的技术手段包括以下实施步骤:步骤一、通过数据采集集成模块实时获取各方来源数据,统一存放于大数据处理分析平台MaxCompute环境中,组成数据仓库最底层STG贴源层;步骤二、对已归集的数据进行分层治理,首先对全域数据进行数据清洗,形成较高数据质量的ODS层;步骤三、对ODS层数据进行分域建模,根据数据的不同业务属性,进行数据整合、数据建模,形成主题库表结构DWD层;步骤四、根据贷款业务的实际需求,抽取DWD主题库中的核心业务字段,并结合根据业务需求分析得到的数据结果,形成DWS层专题层,同时对于专题层中涉及个人、企业隐...

【专利技术属性】
技术研发人员:忻犁李晓儿胡长征王子昊方孟垚
申请(专利权)人:数字宁波科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1