System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及下一代互联网,更具体地,涉及一种网页资源推荐方法、装置、电子设备、存储介质及程序产品。
技术介绍
1、ipv6技术的采用为教育资源的网络传输提供了更广阔的地址空间,解决了ipv4地址资源不足的问题,使得每一台设备都有可能被唯一标识,从而提高了网络的可扩展性和安全性。在保障教育网信息的顺畅流通,为学生和教师提供更加丰富、高效的教育资源获取体验的同时,建设教育网ipv6特色资源推荐网站,提升教育资源的可访问性、促进教育资源的共享与利用,推动教育信息化和现代化的进程。
2、普通的资源推荐现状有三类:一是对基于内容的推荐是一种非常直接的推荐方法,这种算法对于物品特征的描述准确性和完备性要求较高,且对于新用户或冷门物品的推荐效果可能不佳。二是协同过滤推荐是通过分析用户的行为数据来发现用户的兴趣偏好,并根据其他用户的偏好信息进行推荐。然而,对于大规模数据集,协同过滤算法的计算复杂度较高,且可能存在数据稀疏性和冷启动问题。三是基于知识的推荐是一种基于逻辑推理技术的推荐方法,它通过分析用户的需要和偏好来为其提供个性化的推荐服务。通过推理和规则匹配来为用户提供符合其需求的推荐内容。然而,这种算法对于领域知识和规则的要求较高。
技术实现思路
1、有鉴于此,本公开提供了一种网页资源推荐方法、装置、电子设备、存储介质及程序产品。
2、本公开的一个方面提供了一种网页资源推荐方法,包括:
3、获取目标网页上存在的至少一个链接的文本内容,生成各所述链接的文本内容的文
4、基于所述文本向量中各所述关键词的元素值进行加权计算,得到所述链接的量化表示;
5、获取用户的网页资源请求,从所述网页资源请求中提取目标关键词;
6、基于所述链接的量化表示得到所述目标关键词与各所述链接的文本向量的关联度,向所述用户推荐关联度最高的所述链接。
7、根据本公开的实施例,所述获取目标网页上存在的至少一个链接的文本内容包括:
8、基于预设的爬虫模块采集所述目标网页的网页数据;
9、对所述网页数据进行预处理,得到所述目标网页上至少一个链接的文本内容。
10、根据本公开的实施例,所述生成各所述链接的文本内容的文本向量包括:
11、基于预设的word2vec模型将各所述链接的文本内容转化为文本向量;
12、通过tf-idf算法给所述文本内容包括的关键词赋予权重。
13、根据本公开的实施例,所述基于所述链接的量化表示得到所述目标关键词与各所述链接的文本向量的关联度,向所述用户推荐关联度最高的所述链接包括:
14、基于tf-idf算法计算所述目标关键词的权重和对应各所述链接的向量值;
15、基于所述权重和所述目标关键词对应各所述链接的向量值计算所述目标关键词对应各所述链接的表示值;
16、计算所述表示值和各所述链接的量化表示的关联度,选择向所述用户推荐关联度最高的所述链接。
17、根据本公开的实施例,所述方法包括:
18、获取新的网页文本内容,基于所述新的网页文本内容对所述word2vec模型进行增量训练,以提升所述word2vec模型的准确率。
19、根据本公开的实施例,所述获取新的网页文本内容,基于所述新的网页文本内容对所述word2vec模型进行增量训练包括:
20、获取新的网页文本内容,提取所述网页文本内容中的词语加入所述word2vec模型的语料库;
21、将所述网页文本内容以语句为单位数计入所述word2vec模型进行向量计算训练,其中,所述网页文本内容中的词语作为向量计算训练的一部分。
22、本公开的另一方面提供了一种网页资源推荐装置,包括:
23、内容获取模块,用于获取目标网页上存在的至少一个链接的文本内容,生成各所述链接的文本内容的文本向量,所述文本向量中的每个元素值表征所述文本内容包括的关键词;
24、量化计算模块,用于基于所述文本向量中各所述关键词的元素值进行加权计算,得到所述链接的量化表示;
25、关键词提取模块,用于获取用户的网页资源请求,从所述网页资源请求中提取目标关键词;
26、关联推荐模块,用于基于所述链接的量化表示计算所述目标关键词与各所述链接的文本向量的关联度,向所述用户推荐关联度最高的所述链接。
27、本公开的另一个方面提供了一种电子设备,包括:
28、一个或多个处理器;
29、存储器,用于存储一个或多个程序,
30、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
31、本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
32、本公开的另一方面提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本文档来自技高网...【技术保护点】
1.一种网页资源推荐方法,包括
2.根据权利要求1所述的方法,其中,所述获取目标网页上存在的至少一个链接的文本内容包括:
3.根据权利要求1所述的方法,其中,所述生成各所述链接的文本内容的文本向量包括:
4.根据权利要求1所述的方法,其中,所述基于所述链接的量化表示得到所述目标关键词与各所述链接的文本向量的关联度,向所述用户推荐关联度最高的所述链接包括:
5.根据权利要求3所述的方法,其中,所述方法包括:
6.根据权利要求3所述的方法,其中,所述获取新的网页文本内容,基于所述新的网页文本内容对所述Word2Vec模型进行增量训练包括:
7.一种网页资源推荐装置,包括:
8.一种电子设备,包括:
9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。
10.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现权利要求1~6中任一项所述的方法。
【技术特征摘要】
1.一种网页资源推荐方法,包括
2.根据权利要求1所述的方法,其中,所述获取目标网页上存在的至少一个链接的文本内容包括:
3.根据权利要求1所述的方法,其中,所述生成各所述链接的文本内容的文本向量包括:
4.根据权利要求1所述的方法,其中,所述基于所述链接的量化表示得到所述目标关键词与各所述链接的文本向量的关联度,向所述用户推荐关联度最高的所述链接包括:
5.根据权利要求3所述的方法,其中,所述方法包括:
6.根据权...
【专利技术属性】
技术研发人员:吕泓卓,王岩,吴建平,王飞,郑先伟,刘知刚,李威,
申请(专利权)人:赛尔网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。