当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于FastGCN推荐的样本特征聚合方法技术

技术编号:28837527 阅读:74 留言:0更新日期:2021-06-11 23:35
本发明专利技术公开了一种基于FastGCN推荐的样本特征聚合方法,其方法为:步骤一、首先确定当前网络中的所有结点对象;步骤二、获得特征矩阵的高阶度矩阵;步骤三、将得到的高阶度矩阵聚合为一个最终形式的度矩阵;步骤四、使用处理后的特征样本进行FastGCN网络推荐,并获得质量更高的推荐内容,提升公司的数据服务业务的高效率运作。本发明专利技术的有益效果:使用了一种局部特征融合的技术手段完成了对FastGCN模型样本属性特征的融合。经过融合后的样本对象将会有更丰富的属性特征,神经网络对这些对象进行特征映射时将会更容易地区分出它们所属的类别,从而实现提高模型的推荐精度。增加应用体验。

【技术实现步骤摘要】
一种基于FastGCN推荐的样本特征聚合方法
本专利技术涉及一种样本特征聚合方法,特别涉及一种基于FastGCN推荐的样本特征聚合方法。
技术介绍
目前,基于FastGCN的推荐系统模型的应用范围在逐渐的扩大,该模型在GCN的基础上加快了它的推荐速度。但是它在对原始数据的特征量化时,只采集了图谱(下文中称为图或者网络)中的显式信息部分,而忽略了这些数据中的隐式信息。比如,在一个百科索引网络中,有一项词条为词典,该词条将会把与词典某些特征相关或者相似的工具书列为它的扩展阅读。但是在FastGCN模型的样本数据中,像词典这样的对象却缺少与之相关的其它对象的特征。然而实际上它们在某些特征上很可能是相似的,只不过当前对象在该特征中的表现较弱。这说明了该模型存在数据处理方面的技术缺陷,该缺陷使得该模型在实际的使用中将会降低用户的应用体验。并且也不利于公司的大数据业务的良性运作。
技术实现思路
本专利技术的目的是为了解决FastGCN模型在数据处理方面所存在的技术缺陷,而提供的一种基于FastGCN推荐的样本特征聚合方法。本专利技术提供的基于FastGCN推荐的样本特征聚合方法,其方法包括如下步骤:步骤一、首先确定当前网络中的所有结点对象,然后确定网络中的所有对象属性的个数,将这些数据整理为列表形式,也就是哪些对象具有哪种属性,并测量出每个对象与属性的关系强度,通常取值0到1之间,将该列表转化为特征矩阵的数据形式;步骤二、获得特征矩阵的高阶度矩阵,特征矩阵中的每行进行度数加权时,需要增加上其邻接对象的特征;步骤三、将得到的高阶度矩阵以C=C1+α*C2的形式将它们聚合为一个最终形式的度矩阵,然后用该矩阵求出度数加权特征矩阵,它的计算表示为:F=C-1F,最后将得到的F矩阵进行归一化处理既可作为FastGCN的输入;在上述的计算中,首先要通过统计的方法得到合适的参数α,并且它会存在一个能够优化模型表现的取值区间,除此之外,具有某些特点的应用领域它们的参数的取值比较近似,因此特征聚合方案如果长期应用在同一个领域中可以将它的值进行固定;统计开始前,设置它的起始值为0,然后在以一定的间隔增大它的值,在这个过程如果发现,模型的变现没有相应的变化,可考虑加大跳跃间隔;而模型的推荐精度如果出现较大幅度的上升或者下降,那么考虑减少跳跃间隔或者是在一个更小的区间中进行统计,直到统计结果出现一个上升的幅度,继续增大协调参数的值,当模型的表现趋于平稳的时候可以结束统计,并且将对模型优化最好的参数设为固定值;当该模型所处的领域随着时间的流逝,网络结构以及属性特征发生变化的时候,应当考虑重新统计最优参数;步骤四、使用处理后的特征样本进行FastGCN网络推荐,并获得质量更高的推荐内容,提升公司的数据服务业务的高效率运作。本专利技术的有益效果:本专利技术提供的基于FastGCN推荐的样本特征聚合方法使用了一种局部特征融合的技术手段完成了对FastGCN模型样本属性特征的融合。经过融合后的样本对象将会有更丰富的属性特征,神经网络对这些对象进行特征映射时将会更容易地区分出它们所属的类别,从而实现提高模型的推荐精度。增加应用体验。附图说明图1为本专利技术所述的有4个结点图的二阶特征度矩阵计算实例示意图。图2为本专利技术所述的使用特征融合方法的图卷积神经网络在参数α取值不同时的准确率曲线示意图。图3为本专利技术所述的使用特征融合方法的图卷积神经网络在参数α取值不同时的训练成本曲线示意图。图4为本专利技术所述的使用特征融合方法的图卷积神经网络在参数α取值不同时的训练时间曲线示意图。具体实施方式请参阅图1至图4所示:本专利技术提供的基于FastGCN推荐的样本特征聚合方法,其方法包括如下步骤:步骤一、首先确定当前网络中的所有结点对象,然后确定网络中的所有对象属性的个数,将这些数据整理为列表形式(也就是哪些对象具有哪种属性,并测量出每个对象与属性的关系强度,通常取值0到1之间)。将该列表转化为特征矩阵的数据形式。步骤二、获得特征矩阵的高阶度矩阵(如图1中的右下角公式)。图中为了方便说明,参数α被设置为1,而在实际的使用中它的值通常远小于1。图中的C2就是图中对象的邻接结点的特征向量。最终的矩阵C为聚合后的对象特征度,它反映了对象结点与更多属性的相关程度。特征矩阵中的每行进行度数加权时,需要增加上其邻接对象的特征。它的操作过程如图1中所示。步骤三、将得到的高阶度矩阵以C=C1+α*C2的形式将它们聚合为一个最终形式的度矩阵,然后用该矩阵求出度数加权特征矩阵,它的计算可表示为:F=C-1F。最后将得到的F矩阵进行归一化处理既可作为FastGCN的输入。在上述的计算中,首先要通过统计的方法得到合适的参数α,并且它一般会存在一个能够优化模型表现的取值区间。除此之外,具有某些特点的应用领域它们的参数的取值比较近似。因此特征聚合方案如果长期应用在同一个领域中可以将它的值进行固定。统计开始前,需要确定它的初始值,设置它的起始值为0,因为当它是0的时候,特征聚合方法是无效的。然后在以一定的间隔增大它的值,在这个过程如果发现,模型的变现没有相应的变化,可以考虑加大跳跃间隔。而模型的推荐精度如果出现较大幅度的上升或者下降,那么应当考虑减少跳跃间隔或者是在一个更小的区间中进行统计。直到统计结果出现一个上升的幅度,继续增大协调参数的值。当模型的表现趋于平稳的时候可以结束统计。并且将对模型优化最好的参数设为固定值。当该模型所处的领域随着时间的流逝,网络结构以及属性特征发生变化的时候,应当考虑重新统计最优参数。步骤四、使用处理后的特征样本进行FastGCN网络推荐,并获得质量更高的推荐内容。提升公司的数据服务业务的高效率运作。本专利技术的原理及相关试验如下所述:在一个图网络中,邻接矩阵以及特征矩阵被表示为A和F。邻接矩阵被用于计算图的拉普拉斯矩阵,该矩阵被用于生成可以完成特征映射的正交矩阵U。它的所有行向量就像信号处理领域中的多条信道,不同类型的信息在这些通道中传输。这样将会得到一个固定长度的特征存储向量。而F矩阵中的属性数量往往会少于这些信道的数量,以确保不会发生信息溢出。这里为了得到高阶的特征矩阵。需要求出该特征矩阵的邻接度,由于再将F矩阵输入神经网络之前,它需要进行度加权操作。在这个过程中增加邻接特征。如果F矩阵的原始度矩阵为C1。依据邻接矩阵,该过程可以被表示为图1,最终求得高阶度加权的矩阵C.图中的C2矩阵是根据邻接矩阵计算出来的二阶度矩阵。在计算机程序中实现以上过程,通过以下几步来完成。1.首先得到矩阵F,通过循环来遍历该矩阵中的所有行向量,然后对每行的所有值进行求和,因此得到该矩阵的一阶度矩阵。2.然后通过使用循环遍历邻接矩阵每行得到每个结点的二阶邻接结点,然后将这些二阶邻接结点的特征度进行相加得到当前关注结点的二阶特征矩阵。3.通过这两个矩阵求出矩阵C,将一阶度矩阵表示为C1,而二阶度矩阵表示本文档来自技高网...

【技术保护点】
1.一种基于FastGCN推荐的样本特征聚合方法,其特征在于:其方法包括如下步骤:/n步骤一、首先确定当前网络中的所有结点对象,然后确定网络中的所有对象属性的个数,将这些数据整理为列表形式,也就是哪些对象具有哪种属性,并测量出每个对象与属性的关系强度,通常取值0到1之间,将该列表转化为特征矩阵的数据形式;/n步骤二、获得特征矩阵的高阶度矩阵,特征矩阵中的每行进行度数加权时,需要增加上其邻接对象的特征;/n步骤三、将得到的高阶度矩阵以C=C

【技术特征摘要】
1.一种基于FastGCN推荐的样本特征聚合方法,其特征在于:其方法包括如下步骤:
步骤一、首先确定当前网络中的所有结点对象,然后确定网络中的所有对象属性的个数,将这些数据整理为列表形式,也就是哪些对象具有哪种属性,并测量出每个对象与属性的关系强度,通常取值0到1之间,将该列表转化为特征矩阵的数据形式;
步骤二、获得特征矩阵的高阶度矩阵,特征矩阵中的每行进行度数加权时,需要增加上其邻接对象的特征;
步骤三、将得到的高阶度矩阵以C=C1+α*C2的形式将它们聚合为一个最终形式的度矩阵,然后用该矩阵求出度数加权特征矩阵,它的计算表示为:F=C-1F,然后将得到的F矩阵进行归一化处理既可作为FastGCN的输入;
在上述的计算中,首先要通过统计的方法得到合适的参数α,并且它会存在一个能够优化模型表现的...

【专利技术属性】
技术研发人员:董立岩王浩马心陶刘元宁朱晓冬
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1