一种数据处理方法及装置制造方法及图纸

技术编号:24500082 阅读:32 留言:0更新日期:2020-06-13 04:42
本发明专利技术涉及金融科技(Fintech)领域,公开一种数据处理方法及装置,用以解决现有技术无法训练得到通用的行为预测模型的问题,方法包括:参与方设备接收联邦服务器发送的模型训练请求,根据模型训练请求获取本地存储的用户行为数据,并按照预设特征分布规则处理用户行为数据得到与其他参与方设备特征分布一致的待训练数据集,通过各个参与方设备使用特征分布一致的待训练数据集训练得到模型结构一致的各个参与方模型,使得联邦服务器能够基于模型结构一致的各个参与方模型训练得到行为预测模型。由于行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于预测各个参与方设备中的用户的行为,通用性较好,且准确率较高。

A data processing method and device

【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及金融科技(Fintech)
,尤其涉及一种数据处理方法及装置。
技术介绍
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性和实时性要求较高,因此也对金融科技领域的技术提出了更高的要求。在金融领域中,在推广用户之前通常需要对用户的行为进行预测,比如通过预测用户对某商品感兴趣的概率,能够预先将对该商品不感兴趣的用户排除,从而降低无用的推广操作,提高推广效率。现阶段,各个参与方仅能使用本地存储的用户行为数据训练得到行为预测模型,然而,由于不同参与方中的用户不同,对象也不同,因此某一参与方训练的行为预测模型仅能适用于对本参与方中的用户的行为进行预测,而无法对其它参与方中的用户的行为进行预测,从而导致行为预测模型的通用性较差,预测的准确率较低。
技术实现思路
本专利技术提供一种数据处理方法及装置,用以训练得到通用的行为预测模型,以实现对各个参与方中的用户的行为进行预测,进而能够提升用户行为预测的准确率。第一方面,本专利技术提供的一种数据处理方法,所述方法应用于参与方设备,所述方法包括:接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。在一种可能的实现方式中,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;具体实施中,所述按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的训练数据集,包括:按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。在一种可能的实现方式中,所述按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征包括:从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;相应地,所述按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,包括:从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。在一种可能的实现方式中,所述基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,包括:按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征,根据所述用户与所述对象的交互特征,确定所述特征对对应的标签,将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。在一种可能的实现方式中,所述根据所述各个特征对对应的待训练数据,构建所述待训练数据集,包括:根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围,若不符合预设范围,则对标签为负样本的待训练数据进行下采样,或者对标签为正样本的待训练数据进行上采样处理,若符合预设范围,则基于所述各个待训练数据构建所述待训练数据集。在一种可能的实现方式中,所述将所述参与方模型发送给所述联邦服务器之后,还接收所述联邦服务器发送的所述行为预测模型,将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。在一种可能的实现方式中,所述共用的用户行为特征维度包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数;相应地,所述共用的对象行为特征维度包括对象被执行所述预设行为的时间和/或对象在各时段内被执行所述预设行为的次数。在一种可能的实现方式中,所述交互行为特征维度包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数。第二方面,本专利技术提供的一种数据处理装置,所述装置包括:收发模块,用于接收联邦服务器发送的模型训练请求;获取模块,用于根据所述模型训练请求获取本地存储的用户行为数据;处理模块,用于按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;训练模块,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。在一种可能的实现方式中,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;具体实施中,所述处理模块具体用于:按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。在一种可能的实现方式中,所述处理模块具体用于:从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;以及,从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。在一种可能的实现方式中,所述处理模块具体用于:按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征,根据所述用户与所述对象的交互特征,确定所述特征对对应的标签,将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。在一种可能的实现方式中,所述处理模块具体用于:根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围,若不符合预设范围,则对标签为负样本的待训练数据进行下采样处理,或者对标签为正样本的待训练本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,应用于参与方设备,所述方法包括:/n接收联邦服务器发送的模型训练请求;/n根据所述模型训练请求获取本地存储的用户行为数据;/n按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;/n利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于参与方设备,所述方法包括:
接收联邦服务器发送的模型训练请求;
根据所述模型训练请求获取本地存储的用户行为数据;
按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。


2.根据权利要求1所述的方法,其特征在于,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;
所述按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的训练数据集,包括:
按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征;
按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征;
构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。


3.根据权利要求2所述的方法,其特征在于,所述按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,包括:
从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;
所述按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,包括:
从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。


4.根据权利要求2所述的方法,其特征在于,所述基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,包括:
按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征;
根据所述用户与所述对象的交互特征,确定所述特征对对应的标签;
将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。


5.根据权利要求4所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:衣志昊程勇刘洋陈天健
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1