资源推荐方法、装置以及存储介质制造方法及图纸

技术编号:37311854 阅读:20 留言:0更新日期:2023-04-21 22:54
本公开提供了一种资源推荐方法、装置以及存储介质,涉及计算机技术领域,其中的方法包括:对词向量进行向量聚类处理,对与资源相对应的词向量组进行聚合处理,采用语义聚类以及向量融合的方式生成资源特征向量,构建知识图谱并通过注意力机制训练获得各个资源特征向量在知识图谱中的传播偏好,并基于各类资源分别与用户类型的交互关系进行训练学习,对多个预测模型进行训练;使用知识图谱和/或训练好的预测模型进行资源推荐处理。本公开能够充分利用资源实体的信息和交互信息进行融合推荐,并采用多任务模式解决数据稀疏性问题;可以实现资源的精准匹配推荐,解决了实体的异构多类型问题,提高了推荐结果的准确性,提高用户的使用体验。使用体验。使用体验。

【技术实现步骤摘要】
资源推荐方法、装置以及存储介质


[0001]本公开涉及计算机
,尤其涉及一种资源推荐方法、装置以及存储介质。

技术介绍

[0002]在技术转移平台中集聚了科技成果、科研人才、学术论文、专利技术专利、科技服务、技术经纪人、技术需求等资源,资源类型多且数量庞大。技术转移平台需要对用户提供精准的资源推荐,能够对海量信息进行筛选、过滤,将用户最关注最感兴趣的信息展现在用户面前,对用户提供具有良好用户体验的互联网平台,提升用户工作的效率,节省用户筛选信息的时间。现有的技术转移平台使用的推荐模型通常基于内容或协同过滤,部分通过知识图谱等技术进行路径推荐或者权重推荐,缺少针对复杂资源场景的推荐模型,并且具有用户的交互数据稀疏、推荐结果不准确等问题。因此,需要新的关于资源推荐的技术方案。

技术实现思路

[0003]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种资源推荐方法、装置以及存储介质。
[0004]根据本公开实施例的第一方面,提供一种资源推荐方法,包括:生成资源的数字表征信息;其中,所述数字表征信息包括:资源ID、资源类型和词向量;对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组;对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量;确定用户实体与所述资源之间的关系信息,基于所述用户实体、所述资源的资源特征向量和所述关系信息构建知识图谱;在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重;根据用户的交互行为类型并基于所述资源特征向量,生成多个交互行为数据集,并基于所述多个交互行为数据集生成多个训练样本,对多个预测模型进行训练;使用所述知识图谱和/或训练好的预测模型进行资源推荐处理。
[0005]可选地,所述生成资源的数字表征信息包括:对所述资源的描述文本进行分词处理,获得多个分词;生成与各个分词相对应的词向量;基于所述资源ID、所述资源类型、所述词向量生成所述数字表征信息。
[0006]可选地,所述对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组包括:在全部词向量中获取词向量集合;其中,所述词向量集合中的词向量数量等于预设的向量数量;对所述词向量集合进行分组处理,获得多个词向量子集合;其中,所述词向量子集合的总数量等于预设的分组数量;对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量,并基于此多个聚类词向量生成所述词向量组;其中,此多个聚类词向量的数量等于预设的每个词向量组中的聚类向量数量。
[0007]可选地,所述对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量包括:计算所述全部词向量中的任意两个词向量
之间的第一余弦相似度;基于与至少一个最大第一余弦相似度对应的两个词向量,获得多个聚类词向量。
[0008]可选地,所述对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量包括:对于各个词向量组中的聚类词向量进行降维处理,使得各个词向量组中的聚类词向量的维度都相同;对各个词向量组中的全部聚类词向量进行求和运算,生成所述资源特征向量。
[0009]可选地,所述在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重包括:计算所述资源特征向量之间的第二余弦相似度;获得与大于相似度阈值的第二余弦相似度对应两个资源特征向量,在此两个资源特征向量之间建立关联关系;通过注意力机制确定所述资源特征向量之间的传播偏好系数;基于所述传播偏好系数构建资源特征向量之间的路径权重。
[0010]可选地,所述资源包括:科技成果、学术论文、专利技术专利、科研人才、以及科技企业、技术需求中的至少一项;所述交互行为数据集包括:所述资源特征向量、所述用户实体以及所述资源特征向量和所述用户实体之间的交互关系;所述预测模型包括:CTR预估模型。
[0011]根据本公开实施例的第二方面,提供一种资源推荐装置,包括:资源表征模块,用于生成资源的数字表征信息;其中,所述数字表征信息包括:资源ID、资源类型和词向量;聚类处理模块,用于对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组;聚合处理模块,用于对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量;图谱构建模块,用于确定用户实体与所述资源之间的关系信息,基于所述用户实体、所述资源的资源特征向量和所述关系信息构建知识图谱;权重确定模块,用于在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重;模型训练模块,用于根据用户的交互行为类型并基于所述资源特征向量,生成多个交互行为数据集,并基于所述多个交互行为数据集生成多个训练样本,对多个预测模型进行训练;推荐处理模块,用于使用所述知识图谱和/或训练好的预测模型进行资源推荐处理。
[0012]根据本公开实施例的第三方面,提供一种资源推荐装置,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述的方法。
[0013]根据本公开实施例的第四方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的方法。
[0014]基于本公开上述实施例提供的资源推荐方法、装置以及存储介质,通过对资源进行数字化表征并采用语义聚类以及向量融合的方式生成资源特征向量,构建知识图谱并通过注意力机制训练获得各个资源特征向量在知识图谱中的传播偏好,并基于各类资源分别与用户类型的交互关系进行训练学习,对多个预测模型进行训练;能够充分利用资源实体的信息和交互信息进行融合推荐,并采用多任务模式解决数据稀疏性问题;可以实现资源的精准匹配推荐,解决了实体的异构多类型问题,提高了推荐结果的准确性,提高用户的使用体验。
[0015]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0016]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征以及优势将变得更加明显。附图用来提供对本公开实施例的进一步的理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0017]图1为本公开的资源推荐方法的一个实施例的流程示意图;
[0018]图2为本公开的资源推荐方法的一个实施例中的生成资源的数字表征信息的示意图;
[0019]图3为本公开的资源推荐方法的一个实施例中的进行向量聚类处理的流程示意图;
[0020]图4为本公开的资源推荐方法的一个实施例中的进行融合的示意图;
[0021]图5为本公开的资源推荐方法的一个实施例中的生成资源特征向量的流程示意图;
[0022]图6为本公开的资源推荐方法的一个实施例中的构建传播偏好的流程示意图;
[0023]图7为本公开的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资源推荐方法,包括:生成资源的数字表征信息;其中,所述数字表征信息包括:资源ID、资源类型和词向量;对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组;对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量;确定用户实体与所述资源之间的关系信息,基于所述用户实体、所述资源的资源特征向量和所述关系信息构建知识图谱;在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重;根据用户的交互行为类型并基于所述资源特征向量,生成多个交互行为数据集,并基于所述多个交互行为数据集生成多个训练样本,对多个预测模型进行训练;使用所述知识图谱和/或训练好的预测模型进行资源推荐处理。2.如权利要求1所述的方法,所述生成资源的数字表征信息包括:对所述资源的描述文本进行分词处理,获得多个分词;生成与各个分词相对应的词向量;基于所述资源ID、所述资源类型、所述词向量生成所述数字表征信息。3.如权利要求2所述的方法,所述对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组包括:在全部词向量中获取词向量集合;其中,所述词向量集合中的词向量数量等于预设的向量数量;对所述词向量集合进行分组处理,获得多个词向量子集合;其中,所述词向量子集合的总数量等于预设的分组数量;对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量,并基于此多个聚类词向量生成所述词向量组。4.如权利要求3所述的方法,所述对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量包括:计算所述全部词向量中的任意两个词向量之间的第一余弦相似度;基于与至少一个最大第一余弦相似度对应的两个词向量,获得多个聚类词向量。5.如权利要求1所述的方法,所述对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量包括:对于各个词向量组中的聚类词向量进行降维处理,使得各个词向量组中的聚类词向量的维度都相同;对各个词向量组中的全部聚类词向量进行求和运算,生成所述资...

【专利技术属性】
技术研发人员:赖培源周宇轩廖晓东廖德章王增辉李奎李岱素邱姗姗
申请(专利权)人:广东省华南技术转移中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1