本发明专利技术公开了一种基于网络连接速度的个性化网络资源推荐方法。包括以下步骤:利用自定义浏览器,记录用户与浏览过的网站的连接速度;利用获得的连接速度,训练出可预测该用户与任何网站连接速度的人工神经网络;对用户欲访问的网络资源,运用相关搜索引擎找出互联网上所有拥有该资源的网站;使用人工神经网络预测该用户与所有找出的网站的连接速度;将所有找出的网站按照用户连接速度从小到大排序,作为资源推荐的结果。本发明专利技术有效地利用了用户历史网络访问记录,应用人工智能的方法预测了用户与各个网站的连接速度,将用户个人网络情况结合在了网络访问过程中,使得网络资源的使用可以更大限度的利用到用户带宽,为用户提供更好的互联网体验。
【技术实现步骤摘要】
本专利技术涉及计算机搜索与万维网
,尤其涉及一种基于网络连接 速度的个性化网络资源推荐方法。技术背景近年来,出现了一系列的研究活动,以研究个性化或面向用户的搜索引擎和算法,如2007年发表在第十六届国际万维网会议(WWW'07: Proceedings of the 16th international conference on World Wide Web)上的一篇文章"个性化搜索 策略的大规模评价与分析"("A large-scale evaluation and analysis of personalized search strategies")。在2008年第二十三届美国人工智能学会会议上的一篇文章 "基于用户关注时间的面向用户网页排序算法"("A user-oriented webpage ranking algorithm based on user attention time")里,作者也提出建立一个面向用户的网 页搜索引擎的个性化解决方案。本专利技术是用于专门优化个人用户的网络连接情 况。在本专利技术中,我们最大限度的研究了面向用户的最佳网络连接选择,而这 在以往的研究和专利技术工作很少被涉及到。由于服务质量在网页浏览器和许多其他类型的网络接入中是非常关键的, 任何可以提高服务质量的方法,都有巨大的商业价值。 一些解决方案有人提出, 有些则已投入商业使用。在这些解决方案,最成功的大型商业软件是利用简单 的想法,会自动打开多个链接网络内容提供商做并行下载或访问。 一个例子是 一款叫做迅雷的软件(http:〃www.xunlei.com/),这是最受欢迎的中文软件之一。 然而,使用这类程序,网页内容供应商的网站将受到巨大影响,因为它是由自 动程序来访问网页,而不是最终用户,因此,在线广告在这些网页上将失去他 们的价值。这个问题已导致正在进行提供此类服务质量改进服务的企业和网站 内容供应商之间的一些法院案件。在本专利技术中,我们提出了一种基于数据挖掘 的方法,考虑了用户网络状况来推荐网络站点,可以为个人用户提供最佳的服 务质量。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供一种基于网络连接速度的个 性化网络资源推荐方法。基于网络连接速度的个性化网络资源推荐方法包括以下步骤1)利用自定义浏览器,记录用户与浏览过的所有网站间的连接速度;2) 利用获得的网站间的连接速度,训练出可预测用户与任何网站间连接速度的人工神经网络;3) 对用户欲访问的网络资源,运用相关搜索引擎找出互联网上所有拥有 该网络资源的网站;4) 使用人工神经网络预测用户与步骤3)找出的网站间的连接速度;5) 按照用户与步骤3)找出的所有网站之间的连接速度从小到大排序,作 为网络资源推荐的结果。所述的利用自定义浏览器,记录用户与其浏览过的所有网站间的连接速 度步骤(a) 对用户访问过的每个网站,记录每次用户向网站发出访问请求到用户 获得网站回应的时间间隔,记为网站的用户连接时间;(b) 对用户访问过的每个网站,记录每次用户从网站下载数据时的下载速 度,记为网站的用户带宽;(c) 若用户多次访问该网站,则以最近一周中或最近10次的用户连接时间 的平均值作为该网站的用户连接时间,以最近一周中或最近10次的用户带宽 的平均值作为该网站的用户带宽。所述的利用获得的网站间的连接速度,训练出可预测用户与任何网站间连 接速度的人工神经网络步骤(d) 建立一个人工神经网络,其输入为一个网站的特征数据包括一个表 示为32位整数的网络IP地址和1个取值在0 23之间的整数用于表示当前时 间的小时数;其输出为一个实数,表示用户与网站间的连接时间估计值;(e) 另建立一个人工神经网络,其输入为一个网络站点的特征数据包括 一个表示为32位整数的网络IP地址和1个取值在0 23之间的整数用于表示 当前时间的小时数;其输出为一个实数,表示用户与网站间的带宽估计值;(f) 分别将步骤(a)和(c)获得的用户连接时间历史数据作为训练集,使用反 向传播算法训练步骤(d)所建立的神经网络,保存训练后的神经网络;(g) 分别将步骤(b)和(c)获得的用户带宽历史数据作为训练集,使用反向传 播算法训练步骤(e)所建立的神经网络,保存训练后的神经网络。所述的对用户欲访问的网络资源,运用相关搜索引擎找出互联网上所有拥 有该网络资源的网站步骤(h) 使用搜索引擎,对用户给定的关键字进行网络资源搜索,得到前30 IOO项搜索结果网站;(i)若用户需要的网络资源为文本,则对搜索结果中的每两项,计算它们 之间的文本相似度;若其相似度大于95%,则标记这两项为相同内容;(j)若用户需要的网络资源为其他形式,则对搜索结果中的每两项,随机 选取IO个偏移量位置,在这两项的数据文件中的每个偏移量位置上比较1K字 节长度的数据;若这两项的数据文件在所有10个位置处的数据完全相同,则 将它们标记为具有相同内容;(k)调整步骤(h)中获得的搜索结果网站列表将所有具有相同内容的网站 都归并到最前出现该内容的搜索结果项当中,合为一个搜索结果项。所述的使用人工神经网络预测用户与步骤3)找出的网站间的连接速度步骤(1)对步骤(k)所得搜索结果列表中每个包含了两个或以上网站的搜索结果 项,使用步骤(f)所得神经网络估计用户与其中每个网站之间的连接速度;使用 步骤(g)所得神经网络估计用户与其中每个网站之间的带宽。所述的按照用户与步骤3)找出的所有网站之间的连接速度从小到大排序, 作为网络资源推荐的结果步骤(m)若用户需要的网络资源数据尺寸小于100K,对步骤(k)所得搜索结果 列表中每个包含了两个或以上网站的搜索结果项,将其中的网站按照步骤(l) 估计得到的用户连接时间从小到大重新排序;(n)若用户需要的网络资源数据尺寸大于100K,对步骤(k)所得到搜索结 果列表中每个包含了两个或以上网站的搜索结果项,将其中的网站按照步骤(l) 估计得到的用户带宽从大到小重新排序;(o)将调整后的搜索结果列表,作为该用户的资源推荐结果。本专利技术有效地利用了用户历史网络访问记录,应用人工智能的方法预测了 用户与各个网站间的连接速度,将用户的个人网络情况结合在了网络访问过程 中,使得网络资源的使用可以更大限度的利用到用户带宽,为用户提供更好的 互联网体验。 附图说明图1是具体实施方式的系统流程图;图2是虚拟网络实验中使用的虚拟网络结构示意图;具体实施方式基于网络连接速度的个性化网络资源推荐方法包括以下步骤1)利用自定义浏览器,记录用户与浏览过的所有网站间的连接速度;2) 利用获得的网站间的连接速度,训练出可预测用户与任何网站间连接速度的人工神经网络;3) 对用户欲访问的网络资源,运用相关搜索引擎找出互联网上所有拥有 该网络资源的网站;4) 使用人工神经网络预测用户与步骤3)找出的网站间的连接速度;5) 按照用户与步骤3)找出的所有网站之间的连接速度从小到大排序,作 为网络资源推荐的结果。厂所述的利用自定义浏览器,记录用户与其浏览过的所有网站间的连接速 度步骤(a) 对用户访问过的每个网站,记录每次用户向网站发出访问请求到用户 获得网站回应的时间间隔,记为网站的用户连接时间;(b) 对用户访问过的每个网站,记本文档来自技高网...
【技术保护点】
一种基于网络连接速度的个性化网络资源推荐方法,其特征在于包括以下步骤: 1)利用自定义浏览器,记录用户与浏览过的所有网站间的连接速度; 2)利用获得的网站间的连接速度,训练出可预测用户与任何网站间连接速度的人工神经网络; 3)对用户欲访问的网络资源,运用相关搜索引擎找出互联网上所有拥有该网络资源的网站; 4)使用人工神经网络预测用户与步骤3)找出的网站间的连接速度; 5)按照用户与步骤3)找出的所有网站之间的连接速度从小到大排序,作为网络资源推荐 的结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:徐颂华,江浩,刘智满,潘云鹤,
申请(专利权)人:浙江大学,
类型:发明
国别省市:86[中国|杭州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。