一种用于社交网络用户行为序列间的可迁移性度量方法技术

技术编号：37821491 阅读：9 留言：0更新日期：2023-06-09 09:57

本发明专利技术涉及一种用于社交网络用户行为序列间的可迁移性度量方法，所述方法采用TEMCS模型来学习行为序列间的可迁移性大小，得到用户行为序列间可迁移性的度量；所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型；所述多概念语义压缩模型用于最大化序列的语义信息；所述归一化转移熵模型是建模序列间动态的信息转移。本发明专利技术提出的一种用于社交网络用户行为序列间的可迁移性度量方法，计算简单，且不需要模型训练的一种序列间可迁移性度量方式，本发明专利技术的方法用于选择合适的源行为来提高目标少样本行为的预测性能，也可以将其作为先验知识用于多行为融合模型中来提高多行为融合模型的性能。为融合模型的性能。为融合模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于社交网络用户行为序列间的可迁移性度量方法

[0001]本专利技术涉及基于深度学习的行为预测和信息熵领域，尤其涉及信息熵领域中的转移熵方法。

技术介绍

[0002]在线信息平台(比如zhihu、Quora等)中用户多样的行为可以为用户兴趣的建模提供丰富的信息。因此，对于某些数据稀少不足以完整表达用户兴趣的行为，一般使用跨域行为预测或者多行为融合预测的方式来解决。由于不相关的知识的迁移会导致负迁移的现象，我们希望事先度量出行为序列间可迁移性的大小，从而有助于选择合适的行为进行迁移，同时也可以将其作为先验知识提高迁移模型和多行为融合模型的预测性能。
[0003]传统度量可迁移性的方法是基于验证集或测试集上特定模型的损失。它首先设计一个模型来融合不同的源行为，然后比较不同源行为迁移到目标行为上损失的降低程度(或者准确度的提高程度，或者其他的用户预定义的量化函数)来判别源行为到目标行为的可迁移性大小。该方式完全依赖于设计的模型和用户预定义的可迁移性量化函数(比如相似度函数、一层非线性神经网络函数等等)，消耗了大量的模型训练时间和计算资源。为了避免模型的依赖和训练阶段时间的消耗，现有的方法试图基于目标域标签和源域标签/特征/模型等数据，从数据统计的角度来量化源域和目标域的可迁移性。比如通过计算目标域和源域的标签的条件熵来度量给定源域标签的情况下，获得目标域标签所需要的信息量，即获得源域到目标域可迁移性程度。然而这些方法由于统计粗粒度的标签信息，仅仅针对于分类任务，不适用于标签信息细粒度的行为预测任务。同时，序列内...

【技术保护点】

【技术特征摘要】
1.一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述方法采用TEMCS模型来学习行为序列间的可迁移性大小，得到用户行为序列间可迁移性的度量；所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型；所述多概念语义压缩模型用于最大化序列的语义信息；所述归一化转移熵模型是建模序列间动态的信息转移。2.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述多概念语义压缩模型的建立首先利用所有序列内item的语义信息进行k
‑
means聚类获取概念矩阵C；其中|C|是概念的个数，也就是聚类的个数。3.根据权利要求2所述的一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述|C|的范围在[20,30,50,100,200,300,500]之内。4.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述计算行为序列的多概念分布，是通过行为序列内item的语义信息和概念矩阵C之间的欧氏距离相似度来得到行为序列的多概念分布。5.根据权利要求4所述的一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述item的语义信息是通过嵌入矩阵E得到的；所述嵌入矩阵E是利用收集item的评论信息，利用word2vec模型去获取item评论信息的语义信息，获取item本身的语义信息，即所有item的嵌入矩阵E。6.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法，其特征在于：所述采用TEMCS模型来学习行为序列间的可迁移性大小时，先将整体行为...

【专利技术属性】
技术研发人员：郭斌，李诺，刘琰，丁亚三，徐恩，於志文，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人