一种用于社交网络用户行为序列间的可迁移性度量方法技术

技术编号:37821491 阅读:9 留言:0更新日期:2023-06-09 09:57
本发明专利技术涉及一种用于社交网络用户行为序列间的可迁移性度量方法,所述方法采用TEMCS模型来学习行为序列间的可迁移性大小,得到用户行为序列间可迁移性的度量;所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型;所述多概念语义压缩模型用于最大化序列的语义信息;所述归一化转移熵模型是建模序列间动态的信息转移。本发明专利技术提出的一种用于社交网络用户行为序列间的可迁移性度量方法,计算简单,且不需要模型训练的一种序列间可迁移性度量方式,本发明专利技术的方法用于选择合适的源行为来提高目标少样本行为的预测性能,也可以将其作为先验知识用于多行为融合模型中来提高多行为融合模型的性能。为融合模型的性能。为融合模型的性能。

【技术实现步骤摘要】
一种用于社交网络用户行为序列间的可迁移性度量方法


[0001]本专利技术涉及基于深度学习的行为预测和信息熵领域,尤其涉及信息熵领域中的转移熵方法。

技术介绍

[0002]在线信息平台(比如zhihu、Quora等)中用户多样的行为可以为用户兴趣的建模提供丰富的信息。因此,对于某些数据稀少不足以完整表达用户兴趣的行为,一般使用跨域行为预测或者多行为融合预测的方式来解决。由于不相关的知识的迁移会导致负迁移的现象,我们希望事先度量出行为序列间可迁移性的大小,从而有助于选择合适的行为进行迁移,同时也可以将其作为先验知识提高迁移模型和多行为融合模型的预测性能。
[0003]传统度量可迁移性的方法是基于验证集或测试集上特定模型的损失。它首先设计一个模型来融合不同的源行为,然后比较不同源行为迁移到目标行为上损失的降低程度(或者准确度的提高程度,或者其他的用户预定义的量化函数)来判别源行为到目标行为的可迁移性大小。该方式完全依赖于设计的模型和用户预定义的可迁移性量化函数(比如相似度函数、一层非线性神经网络函数等等),消耗了大量的模型训练时间和计算资源。为了避免模型的依赖和训练阶段时间的消耗,现有的方法试图基于目标域标签和源域标签/特征/模型等数据,从数据统计的角度来量化源域和目标域的可迁移性。比如通过计算目标域和源域的标签的条件熵来度量给定源域标签的情况下,获得目标域标签所需要的信息量,即获得源域到目标域可迁移性程度。然而这些方法由于统计粗粒度的标签信息,仅仅针对于分类任务,不适用于标签信息细粒度的行为预测任务。同时,序列内和序列间的信息具有时间依赖关系,使得可迁移的信息是动态变化的。

技术实现思路

[0004]要解决的技术问题
[0005]为了避免现有技术的不足之处,本专利技术提供一种用于社交网络用户行为序列间的可迁移性度量方法。可以用于选择合适的源行为来提高目标少样本行为的预测性能,也可以将其作为先验知识用于多行为融合模型中来提高多行为融合模型的性能。
[0006]技术方案
[0007]一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述方法采用TEMCS模型来学习行为序列间的可迁移性大小,得到用户行为序列间可迁移性的度量;所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型;所述多概念语义压缩模型用于最大化序列的语义信息;所述归一化转移熵模型是建模序列间动态的信息转移。
[0008]本专利技术进一步的技术方案:所述多概念语义压缩模型的建立首先利用所有序列内item的语义信息进行k

means聚类获取概念矩阵C;其中|C|是概念的个数,也就是聚类的个数。
[0009]本专利技术进一步的技术方案:所述|C|的范围在[20,30,50,100,200,300,500]之内。
[0010]本专利技术进一步的技术方案:所述计算行为序列的多概念分布,是通过行为序列内item的语义信息和概念矩阵C之间的欧氏距离相似度来得到行为序列的多概念分布。
[0011]本专利技术进一步的技术方案:所述item的语义信息是通过嵌入矩阵E得到的;所述嵌入矩阵E是利用收集item的评论信息,利用word2vec模型去获取item评论信息的语义信息,获取item本身的语义信息,即所有item的嵌入矩阵E。
[0012]本专利技术进一步的技术方案:所述采用TEMCS模型来学习行为序列间的可迁移性大小时,先将整体行为序列根据目标行为序列划分为子序列,分别计算不同时刻信息的传递量,再计算整体行为序列的信息传递量;然后通过计算条件概率,最后计算最终的源行为序列到目标行为序列的可迁移性TEMCS值。
[0013]本专利技术进一步的技术方案:所述条件概率可以视为相似度,利用Jaccard相似度来计算两种行为子序列的离散的多概念分布的相似度,将其作为已知一种行为子序列去得到另外一种行为子序列的概率。
[0014]本专利技术进一步的技术方案:包括如下步骤:
[0015]步骤一、收集用户的多种源行为序列,目标行为序列以及所有序列内的item的评论信息;
[0016]步骤二、计算每种行为序列中item的预训练语义信息,得到所有item的嵌入矩阵E;
[0017]步骤三、根据步骤二中所有item的嵌入矩阵E进行聚类,得到概念矩阵C;
[0018]步骤四、根据步骤二中的嵌入矩阵E和步骤三中的概念矩阵C,计算每种行为序列的multi

concept分布;
[0019]步骤五、根据用户的目标行为序列将原始的源行为序列和目标行为序列划分为子序列片段;
[0020]步骤六、计算条件概率:对于当子序列的目标行为的历史记录已知的情况下,目标被预测的概率可以得到:
[0021][0022]其中∩表示集合的交集,而∪表示集合的并集;表示目标和目标行为的历史记录共享的concept集合,而表示目标和目标行为的历史记录共有的concept集合;
[0023]步骤七、计算最终的源行为序列到目标行为序列的可迁移性TEMCS值,即:
[0024][0025]其中,
[0026][0027]表示当目标行为和源行为的历史记录已知的情况下,目标被预测的概率。
[0028]有益效果
[0029]本专利技术提出的一种用于社交网络用户行为序列间的可迁移性度量方法,可以用于选择合适的源行为来提高目标少样本行为的预测性能,也可以将其作为先验知识用于多行为融合模型中来提高多行为融合模型的性能。
附图说明
[0030]附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。
[0031]图1为本专利技术一种用于社交网络用户行为序列间的可迁移性度量方法社交网络用户行为序列间的可迁移性度量方法流程图。
[0032]图2为在zhihu数据集上,Voting answers行为和creating answers行为之间的TEMCS值随着Concept个数的变化趋势。
[0033]图3为在zhihu数据集上,following questions行为和creating answers行为之间的TEMCS值随着Concept个数的变化趋势。
[0034]图4为在Zhihu数据集上TEMCS值随着距离阈值的变化趋势。
[0035]图5为在Amazon数据集上TEMCS值随着Concept个数的变化趋势。
[0036]图6为zhihu数据集和Amazon数据集上不同可迁移性度量方式的比较。
具体实施方式
[0037]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。此外,下面描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0038]本专利技术提供的一种用于社交网络用户行为序列间的可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述方法采用TEMCS模型来学习行为序列间的可迁移性大小,得到用户行为序列间可迁移性的度量;所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型;所述多概念语义压缩模型用于最大化序列的语义信息;所述归一化转移熵模型是建模序列间动态的信息转移。2.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述多概念语义压缩模型的建立首先利用所有序列内item的语义信息进行k

means聚类获取概念矩阵C;其中|C|是概念的个数,也就是聚类的个数。3.根据权利要求2所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述|C|的范围在[20,30,50,100,200,300,500]之内。4.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述计算行为序列的多概念分布,是通过行为序列内item的语义信息和概念矩阵C之间的欧氏距离相似度来得到行为序列的多概念分布。5.根据权利要求4所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述item的语义信息是通过嵌入矩阵E得到的;所述嵌入矩阵E是利用收集item的评论信息,利用word2vec模型去获取item评论信息的语义信息,获取item本身的语义信息,即所有item的嵌入矩阵E。6.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述采用TEMCS模型来学习行为序列间的可迁移性大小时,先将整体行为...

【专利技术属性】
技术研发人员:郭斌李诺刘琰丁亚三徐恩於志文
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1