序列挖掘模型的训练方法、序列数据的处理方法及设备技术

技术编号：24707988 阅读：58 留言：0更新日期：2020-06-30 23:58

本申请公开了一种序列挖掘模型的训练方法、序列数据的处理方法及设备，属于人工智能和机器学习技术领域，所述方法包括：获取目标业务场景下的第一序列样本；确定第一序列样本的标签状态；根据标签状态，从序列挖掘框架中选取子模型构建序列挖掘模型；采用第一序列样本对序列挖掘模型进行训练。本申请实施例提供的技术方案提出了一种序列挖掘框架，针对不同的业务场景下历史序列数据不同的标签状态，可以从序列挖掘框架中选取对应的子模型构建序列挖掘模型。相比于相关技术中只能采用结构固定的单一模型进行训练，本申请实施例提供的技术方案，充分利用了业务场景中的所有历史序列数据，提升了资源利用率。

全部详细技术资料下载

【技术实现步骤摘要】
序列挖掘模型的训练方法、序列数据的处理方法及设备
本申请实施例涉及人工智能和机器学习
，特别涉及一种序列挖掘模型的训练方法、序列数据的处理方法及设备。
技术介绍
诸如信用卡反欺诈、反小号作弊、反薅羊毛党等风控业务场景中，通常会面临海量的序列数据，对海量的序列数据进行处理，以挖掘和区分“好”与“坏”的长期行为模式，在风控业务场景中尤为重要。相关技术针对风控业务场景中序列数据的挖掘，提供了一种有监督学习方案。首先，利用DTW(DynamicTimeWarping，动态时间归整)算法对所有序列样本进行规整对齐，再计算两两序列样本间的相似度，根据序列间相似度，利用KNN(K-NearestNeighbor，K最邻近)模型对所有的序列样本进行分类，从而可以将“好”的序列样本与“坏”的序列样本进行区分。然而，由于不同的风控业务场景中，序列样本并非都是具备标签的，相关技术提供的技术方案仅适用于某一能够提供具备标签的序列样本的风控业务场景，不具备通用性。
技术实现思路
本申请实施例提供了一种序列挖掘模型的训练方法、序列数据的处理方法及设备，可以充分利用业务场景中的历史序列数据，提升资源利用率，并且提升通过序列挖掘模型确定序列数据的标签信息的准确性。所述技术方案如下：一方面，本申请实施例提供了一种序列挖掘模型的训练方法，所述方法包括：获取目标业务场景下的第一序列样本，所述第一序列样本包括所述目标业务场景下的历史序列数据；确定所述第一序列样本的标签状态，所述第一序...

【技术保护点】
1.一种序列挖掘模型的训练方法，其特征在于，所述方法包括：/n获取目标业务场景下的第一序列样本，所述第一序列样本包括所述目标业务场景下的历史序列数据；/n确定所述第一序列样本的标签状态，所述第一序列样本的标签状态用于指示所述第一序列样本具备标签信息的情况；/n根据所述标签状态，从序列挖掘框架中选取子模型构建序列挖掘模型，所述序列挖掘模型用于确定所述目标业务场景下序列数据的标签信息；/n采用所述第一序列样本对所述序列挖掘模型进行训练；/n其中，所述序列挖掘框架包括第一子模型、第二子模型和第三子模型；所述第一子模型用于获取所述序列数据的隐向量表示；所述第二子模型用于在所述标签状态满足第一条件的情况下，根据所述序列数据的隐向量表示确定所述序列数据的标签信息，所述第一条件包括所述标签状态为所述第一序列样本不存在标签信息；所述第三子模型用于在所述标签状态满足第二条件的情况下，根据所述序列数据的隐向量表示确定所述序列数据的标签信息，所述第二条件包括所述标签状态为所述第一序列样本至少部分存在标签信息。/n

【技术特征摘要】
1.一种序列挖掘模型的训练方法，其特征在于，所述方法包括：
获取目标业务场景下的第一序列样本，所述第一序列样本包括所述目标业务场景下的历史序列数据；
确定所述第一序列样本的标签状态，所述第一序列样本的标签状态用于指示所述第一序列样本具备标签信息的情况；
根据所述标签状态，从序列挖掘框架中选取子模型构建序列挖掘模型，所述序列挖掘模型用于确定所述目标业务场景下序列数据的标签信息；
采用所述第一序列样本对所述序列挖掘模型进行训练；
其中，所述序列挖掘框架包括第一子模型、第二子模型和第三子模型；所述第一子模型用于获取所述序列数据的隐向量表示；所述第二子模型用于在所述标签状态满足第一条件的情况下，根据所述序列数据的隐向量表示确定所述序列数据的标签信息，所述第一条件包括所述标签状态为所述第一序列样本不存在标签信息；所述第三子模型用于在所述标签状态满足第二条件的情况下，根据所述序列数据的隐向量表示确定所述序列数据的标签信息，所述第二条件包括所述标签状态为所述第一序列样本至少部分存在标签信息。

2.根据权利要求1所述的方法，其特征在于，所述标签状态为所述第一序列样本不存在标签信息，所述序列挖掘模型包括所述第一子模型和所述第二子模型；
所述采用所述第一序列样本对所述序列挖掘模型进行训练，包括：
采用所述第一序列样本对所述第一子模型进行预训练，得到预训练的第一子模型；
通过所述预训练的第一子模型对所述第一序列样本进行处理，得到所述第一序列样本的隐向量表示；
采用所述第一序列样本和所述第一序列样本的隐向量表示，对所述预训练的第一子模型和所述第二子模型进行联合训练，得到所述序列挖掘模型。

3.根据权利要求1所述的方法，其特征在于，所述标签状态为所述第一序列样本至少部分存在标签信息，且第二序列样本的数量大于第三序列样本的数量；其中，所述第二序列样本是指所述第一序列样本中存在标签信息的序列样本；所述第三序列样本是指所述第一序列样本中不存在标签信息的序列样本；所述序列挖掘模型包括所述第一子模型和所述第三子模型；
所述采用所述第一序列样本对所述序列挖掘模型进行训练，包括：
采用所述第一序列样本对所述第一子模型进行预训练，得到预训练的第一子模型；
通过所述预训练的第一子模型对所述第二序列样本进行处理，得到所述第二序列样本的隐向量表示；
采用所述第二序列样本和所述第二序列样本的隐向量表示，对所述预训练的第一子模型和所述第三子模型进行联合训练，得到所述序列挖掘模型。

4.根据权利要求1所述的方法，其特征在于，所述标签状态为所述第一序列样本至少部分存在标签信息，且第二序列样本的数量小于第三序列样本的数量；其中，所述第二序列样本是指所述第一序列样本中存在标签信息的序列样本；所述第三序列样本是指所述第一序列样本中不存在标签信息的序列样本；所述序列挖掘模型包括所述第一子模型、所述第二子模型和所述第三子模型；
所述采用所述第一序列样本对所述序列挖掘模型进行训练，包括：
采用所述第一序列样本对所述第一子模型进行预训练，得到预训练的第一子模型；
通过所述预训练的第一子模型对所述第二序列样本进行处理，得到所述第二序列样本的隐向量表示；
采用所述第二序列样本和所述第二序列样本的隐向量表示，对所述预训练的第一子模型和所述第三子模型进行联合训练，得到联合训练的第一子模型；
通过所述联合训练的第一子模型对所述第三序列样本进行处理，得到所述第三序列样本的隐向量表示；
采用所述第三序列样本和所述第三序列样本的隐向量表示，对所述联合训练的第一子模型和所述第二子模型进行联合训练，得到所述序列挖掘模型。

5.根据权利要求2至4任一项所述的方法，其特征在于，所述第一子模型包括隐向量提取单元和重构单元；
所述采用所述第一序列样本对所述第一子模型进行预训练，得到预训练的第一子模型，包括：
通过所述隐向量提取单元对所述第一序列样本进行处理，得到所述第一序列样本的隐向量表示；
通过所述重构单元对所述第一序列样本的隐向量表示进行处理，得到重构后的第一序列样本；
根据所述第一序列样本和所述重构后的第一序列样本，计算第一损失函数的值，所述第一损失函数是指所述第一子模型对应的损失函数；
根据所述第一损失函数的值，调整所述第一子模型的参数，得到所述预训练的第一子模型。

6.根据权利要求5所述的方法，其特征在于，所述隐向量提取单元包括映射子单元、降维子单元和递归子单元；
所述通过所述隐向量提取单元对所述第一序列样本进行处理，得到所述第一序列样本的隐向量表示，包括：
通过所述映射子单元获取所述第一序列样本的特征信息，得到所述第一序列样本的特征信息表示；
通过所述降维子单元对所述第一序列样本的特征信息进行降维处理，得到所述第一序列样本的降维特征信息；
通过所述递归子单元学习所述第一序列样本的降维特征信息的序列间跨步长的变化规律，得到所述第一序列样本的隐向量表示。

7.根据权利要求2所述的方法，其特征在于，所述通过所述预训练的第一子模型对所述第一序列样本进行处理，得到所述第一序列样本的隐向量表示之后，还包括：
获取所述第一序列样本的静态特征；
根据所述第一序列样本的静态特征和所述第一序列样本的隐向量表示，得到所述第一序列样本的优化向量表示；
其中，所述第一序列样本的优化向量表示用于对所述预训练的第一子模型和所述第二子模型进行联合训练。

8.根据权利要求7所述的方法，其特征在于，所述根据所述第一序列样本的静态特征和所述第一序列样本的隐向量表示，得到所述第一序列样本的优化向量表示，包括：...

【专利技术属性】
技术研发人员：陶冶，金欢，金洪波，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人