对表格数据和序列数据融合处理的方法和装置制造方法及图纸

技术编号:38483554 阅读:11 留言:0更新日期:2023-08-15 17:00
本说明书实施例提供一种对表格数据和序列数据融合处理的方法和装置。方法包括:将表格数据输入表格编码器,得到表格嵌入向量;将序列数据输入序列编码器,得到初始嵌入矩阵,序列数据包括与目标对象相关、按照时序排列的t个事件的事件数据,初始嵌入矩阵由t个事件分别对应的初始事件嵌入向量按照时序排列而成;将表格嵌入向量和初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照时序排列而成;将拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;融合嵌入矩阵用于对目标对象进行检索或分类。能够使得对目标对象进行检索或分类取得良好的效果。类取得良好的效果。类取得良好的效果。

【技术实现步骤摘要】
对表格数据和序列数据融合处理的方法和装置


[0001]本说明书一个或多个实施例涉及计算机领域,尤其涉及对表格数据和序列数据融合处理的方法和装置。

技术介绍

[0002]当前,常常基于目标对象的特征数据,采用神经网络模型对目标对象进行检索或分类。目标对象的特征数据通常为表格数据,随着基于序列数据的神经网络的算法与工程方案都逐渐成熟,在表格数据的基础上,添加序列数据进行联合建模就成了一种优选的建模方案。其中,目标对象的特征数据可能属于隐私数据,需要保护其不被泄露。
[0003]现有技术中,对表格数据和序列数据融合处理的方案,无法使得对目标对象进行检索或分类取得良好的效果。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种对表格数据和序列数据融合处理的方法和装置,能够使得对目标对象进行检索或分类取得良好的效果。
[0005]第一方面,提供了一种对表格数据和序列数据融合处理的方法,方法包括:
[0006]将目标对象的表格数据输入表格编码器,得到表格嵌入向量;
[0007]将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
[0008]将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;
[0009]将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。
[0010]在一种可能的实施方式中,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。
[0011]在一种可能的实施方式中,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。
[0012]在一种可能的实施方式中,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。
[0013]进一步地,所述方法还包括:
[0014]将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;
[0015]将所述二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类
的结果。
[0016]进一步地,所述二次融合处理,包括:
[0017]将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。
[0018]在一种可能的实施方式中,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代训练得到,在各轮迭代中,所述表格编码器基于第一学习率进行调参,所述序列编码器基于第二学习率进行调参,使得所述表格编码器收敛的轮次和使所述序列编码器收敛的轮次之间的差别在预设范围内。
[0019]进一步地,所述第一学习率大于所述第二学习率。
[0020]在一种可能的实施方式中,所述融合事件嵌入向量基于自注意力机制得到,包括:
[0021]针对m个事件中的第一事件,确定其与其他事件之间分别对应的注意力分数;
[0022]基于各注意力分数,对m个事件分别对应的拼接事件嵌入向量进行加权求和,得到所述第一事件对应的融合事件嵌入向量。
[0023]第二方面,提供了一种对表格数据和序列数据融合处理的装置,包括:
[0024]表格嵌入单元,用于将目标对象的表格数据输入表格编码器,得到表格嵌入向量;
[0025]序列嵌入单元,用于将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
[0026]拼接单元,用于将所述表格嵌入单元得到的表格嵌入向量和所述序列嵌入单元得到的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;
[0027]自注意力单元,用于将所述拼接单元得到的拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。
[0028]第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
[0029]第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
[0030]通过本说明书实施例提供的方法和装置,首先将目标对象的表格数据输入表格编码器,得到表格嵌入向量;然后将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;接着将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;最后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。由上可见,本说明书实施例,先对表格数据对应的表格嵌入向量和序列数据对应的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵,然后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵,该融合嵌
入矩阵用于对所述目标对象进行检索或分类。该方案利用了神经网络模型的自注意力层来进行表格数据和序列数据的融合处理,能够使得对目标对象进行检索或分类取得良好的效果。
附图说明
[0031]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0032]图1为本说明书披露的一个实施例的实施场景示意图;
[0033]图2示出根据一个实施例的对表格数据和序列数据融合处理的方法流程图;
[0034]图3示出根据一个实施例的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对表格数据和序列数据融合处理的方法,所述方法包括:将目标对象的表格数据输入表格编码器,得到表格嵌入向量;将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。2.如权利要求1所述的方法,其中,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。3.如权利要求1所述的方法,其中,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。4.如权利要求1所述的方法,其中,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。5.如权利要求4所述的方法,其中,所述方法还包括:将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;将所述二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类的结果。6.如权利要求5所述的方法,其中,所述二次融合处理,包括:将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。7.如权利要求1所述的方法,其中,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代...

【专利技术属性】
技术研发人员:王宁涛傅幸王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1