资源平衡性的确定方法、装置、设备以及存储介质制造方法及图纸

技术编号:16038003 阅读:66 留言:0更新日期:2017-08-19 19:49
本发明专利技术实施例公开了一种资源平衡性的确定方法、装置、设备及存储介质。所述方法包括:在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量;应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数。本发明专利技术实施例的方案创造性的给出了一种有效衡量资源库中资源的收录与分发平衡性的方法,使用户可以根据资源平衡性参数,量化的感知出资源库中资源的收录与分发是否平衡,并可以根据该资源平衡性参数的计算结果,适应性的调整针对所述资源库的资源抓取策略。

【技术实现步骤摘要】
资源平衡性的确定方法、装置、设备以及存储介质
本专利技术实施例涉及信息处理技术,尤其涉及一种资源平衡性的确定方法、装置、设备以及存储介质。
技术介绍
搜索引擎(SearchEngine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,并将用户检索相关的信息展示给用户的系统,其已经成为广大用户获取网络信息的一项不可或缺的方式。搜索资源是搜索引擎类产品的基石,一条资源(典型的,一个资源站点中更新的一个网页)从产生到展现给搜索用户要经历资源抓取、入库(也即将资源收录于资源库中)、召回(也即资源的分发)、排序、展现等一系列过程。其中资源的抓取、入库是召回的基础;请求召回的资源数量的多少是对资源抓取、入库质量优良的有效指标,也是影响用户体验的主要因素。在现有技术中,没有对资源库中资源的收录与分发的平衡性进行衡量的方法。
技术实现思路
本专利技术实施例提供了一种资源平衡性的确定方法、装置、设备以及存储介质,以有效衡量资源库中资源的收录与分发的平衡性。第一方面,本专利技术实施例提供了一种资源平衡性的确定方法,包括:在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量;应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数;其中,所述目标经济学参数用于衡量经济分配的公平程度,所述资源平衡性参数用于衡量所述资源库的资源收录及分发的平衡性。第二方面,本专利技术实施例还提供了一种资源平衡性的确定装置,包括:资源站点信息统计模块,用于在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量;资源平衡性参数计算模块,用于应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数;其中,所述目标经济学参数用于衡量经济分配的公平程度,所述资源平衡性参数用于衡量所述资源库的资源收录及分发的平衡性。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本专利技术实施例中任一所述的资源平衡性的确定方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的资源平衡性的确定方法。本专利技术实施例提供了一种资源平衡性的确定方法、装置、设备以及存储介质,通过应用衡量经济分配的公平程度的目标经济学参数的计算方法,使用设定时间区间内资源库针对各个资源站点的资源收录量以及资源分发量,计算用于衡量所述资源库的资源收录及分发的平衡性的资源平衡性参数的技术手段,创造性的给出了一种有效衡量资源库中资源的收录与分发平衡性的新方法,使得用户可以根据计算得到的资源平衡性参数,量化的感知出资源库中资源的收录与分发是否平衡,并进而可以根据该资源平衡性参数的计算结果,适应性的调整针对所述资源库的资源抓取策略。附图说明图1是本专利技术实施例一中的一种资源平衡性的确定方法的流程图;图2是本专利技术实施例二中的一种资源平衡性的确定方法的流程图;图3a是本专利技术实施例三中的一种资源平衡性的确定方法的流程图;图3b是本专利技术实施例的一种具体应用场景的示意图;图4是本专利技术实施例四中的一种资源平衡性的确定装置的结构图;图5是本专利技术实施例五中的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一提供的一种资源平衡性的确定方法的流程图,本实施例可适用于对搜索引擎产品资源库的资源收录与资源分发的平衡性进行衡量的情况,该方法可以由本专利技术实施例提供的资源平衡性的确定装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在搜索引擎产品的服务器中。如图1所示,本实施例的方法具体包括:110、在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量。在本实施例中,所述资源库具体是指由网络爬虫抓取的,或者由网站自主上报的网页资源构成的,用于进行数据搜索的搜索引擎数据库。其中,所述资源库中包括的资源可以为文本形式的资源、图片形式的资源以及多媒体形式的资源,本实施例对此并不进行限制。所述设定时间区间可以以设定时间单元(例如,小时、天、一周或者一个月等)为单位进行划分。所述资源库针对各个资源站点的资源收录量,具体是指所述资源库在该设定时间区间内,对不同资源站点的网页资源的资源收录增量;所述资源库针对各个资源站点的资源分发量,具体是指在该设定时间区间内,搜索引擎产品的召回结果中(针对用户的搜索式返回的搜索结果),与不同资源站点对应的资源数量。例如:2017.4.10,资源库针对资源站点1(www.baidu.com)共新收录了60个资源,搜索引擎产品共召回了资源库中资源站点1的30个资源,则在2017.4.10这一天,该资源库针对该资源站点1的资源收录量为60,该资源库针对该资源站点1的资源分发量为30。120、应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数。其中,所述目标经济学参数用于衡量经济分配的公平程度,所述资源平衡性参数用于衡量所述资源库的资源收录及分发的平衡性。在本实施例中,专利技术人通过创造性的劳动发现:在经济学领域中的经济(或者说收入)的分配与资源库中资源的收录及分发具有一定的相似性。因此,可以将设定经济学参数应用于资源的收录及分发领域用于计算资源平衡性参数。相应的,在本实施例的一个可选的实施方式中,在应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数之前,还可以包括:预先建立所述资源库的资源收录及分发过程与经济学活动之间的映射关系,并根据所述映射关系,选取所述目标经济学参数。可选的,可以将所述资源库的资源收录及分发过程与经济学活动之间建立如下映射关系:将所述资源库映射为整体社会,将所述资源库中包括的资源站点映射为居民;将所述资源库中的资源收录过程映射为收入,将所述资源库中的资源分发过程映射为收入的分配;根据建立的所述映射关系,选取基尼系数作为所述目标经济学参数。其中,经济学经典指标“基尼系数”的含义是指,在全部居民收入中,用于进行不平均分配的那部分收入所占的比例。基尼系数最大为“1”,最小等于“0”。前者表示居民之间的收入分配绝对不平均本文档来自技高网...
资源平衡性的确定方法、装置、设备以及存储介质

【技术保护点】
一种资源平衡性的确定方法,其特征在于,包括:在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量;应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数;其中,所述目标经济学参数用于衡量经济分配的公平程度,所述资源平衡性参数用于衡量所述资源库的资源收录及分发的平衡性。

【技术特征摘要】
1.一种资源平衡性的确定方法,其特征在于,包括:在设定时间区间内,统计资源库针对各个资源站点的资源收录量,以及所述资源库针对各个资源站点的资源分发量;应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数;其中,所述目标经济学参数用于衡量经济分配的公平程度,所述资源平衡性参数用于衡量所述资源库的资源收录及分发的平衡性。2.根据权利要求1所述的方法,其特征在于,在应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源库的资源平衡性参数之前,还包括:预先建立所述资源库的资源收录及分发过程与经济学活动之间的映射关系,并根据所述映射关系,选取所述目标经济学参数。3.根据权利要求2所述的方法,其特征在于,预先建立所述资源库的资源收录及分发过程与经济学活动之间的映射关系,并根据建立所述映射关系,选取所述目标经济学参数,包括:将所述述资源库的资源收录及分发过程与经济学活动之间建立如下映射关系:将所述资源库映射为整体社会,将所述资源库中包括的资源站点映射为居民;将所述资源库中的资源收录过程映射为收入,将所述资源库中的资源分发过程映射为收入的分配;根据建立的所述映射关系,选取基尼系数作为所述目标经济学参数。4.根据权利要求3所述的方法,其特征在于,应用目标经济学参数的计算方法,使用所述资源收录量以及所述资源分发量,计算所述资源平衡性参数,包括:将所述资源库中包括的资源站点按照资源收录量从小到大的顺序进行排序;按照排序结果,将与各组资源站点分别对应的分发收录比重进行累加求和,得到第一中间量;其中,所述分发收录比重为一个目标资源站点的资源分发量数占全部资源站点的资源分发总量的比重与所述目标资源站点的资源收录数占全部资源站点的资源收录总数的比重的乘积;按照排序结果,将与各组资源站点分别对应的累积分发收录比重进行累加求和,得到第二中间量;其中,所述累积分发收录比重为累计到一个目标资源站点的资源收录总数占全部资源站点资源收录总数的比重与所述目标资源站点的资源收录数占全部资源站点的资源收录总数的比重的乘...

【专利技术属性】
技术研发人员:黄平李升起
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1