一种热度迭代计算方法技术

技术编号:18302219 阅读:84 留言:0更新日期:2018-06-28 12:05
本发明专利技术公开了一种热度迭代计算方法,旨在解决现有技术中很难实现对网页的热度量化和归一化进而导致网页热度的预计不够准确或不同网页热度之间很难进行对比分析的问题;本发明专利技术包括以下步骤:设定网页的热度指标,获得热度指标序列,对热度指标序列进行条件约束;设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列标准化为热度标准序列,并构造关于热度标准序列的热度迭代函数;对热度迭代函数进行进行迭代计算获得热度指标序列的最大迭代增量;本发明专利技术将网页热度控制在设定的范围内,实现了网页热度地归一化处理,方便了各个网页热度地统计与对比,对网页热度的量化,能更加准确的对网页热度进行评估和预测;本发明专利技术适用于热度计算相关领域。

An iterative calculation method of heat degree

The invention discloses an iterative calculation method of heat degree, which aims to solve the problem that it is difficult to quantify and normalize the heat of a web page in the existing technology, so that the prediction of the web page heat is not accurate or the heat degree of different web pages is difficult to compare and analysis. The invention includes the following steps: setting the thermal index of the web page, obtaining the heat index of the web page, The heat index sequence is constrained by the heat index sequence, the normalized interval of the heat index sequence is set, and the heat index sequence is normalized to the heat standard sequence according to the standardized interval, and the heat iterative function on the heat degree standard sequence is constructed, and the heat iteration function is iteratively calculated to obtain the heat. The maximum iteration increment of the degree index sequence; the invention realizes the homepage heat degree normalization processing within the set range, facilitates the statistics and comparison of the web pages heat, quantifies the heat of the web pages, and can more accurately evaluate and predict the heat degree of the web pages; the invention is suitable for the calculation of heat degree. Related fields.

【技术实现步骤摘要】
一种热度迭代计算方法
本专利技术涉及热度计算领域,具体涉及一种热度迭代计算方法。
技术介绍
搜索引擎已成为我们获取信息必不可少的途径,但是现在的信息资源丰富且多样化。正因为信息资源丰富和多样化,我们很难获取得到我们自己真正需要的信息。现有的搜索引擎为了满足用户的需求,利用搜索引擎根据采集到的用户的搜索信息来预计用户需要的信息。但是在实际处理的过程中,现有的热度计算由于加入的变量过多而导致算法较为复杂,对于供应商而言,算法越复杂,所占CPU过高,且占内存较多进而导致搜索引擎的成本高,试想搜索引擎的用户量大,如果每个用户量的计算量均较大,那么搜索引擎的主服务器很难满足用户所需,而服务器的成本是极高的;另一方面算法过于复杂的时候也容易导致实际运算效率低。现有的一些热度算法还有一些缺陷,就是往往只能对已经发生的搜索行为进行热度统计和计算,但是对热度很难量化进而很难对网页未来的热点进行准确预估。同时在现有的热度预估中存在有一定的技术偏见,往往认为热度会随着上涨的速度越来越高,只有当趋势下降的时候才会开始预估下跌,这样就会导致当某个词的热度已经下降的时候才预估下降,也就是很难预测到某个词的热度的热度什么时候会下滑,换言之,很难预测到这个转折点,而这才是预测最有价值的地方;同时现有的一些网页的热度统计通常是累积式的,即累加统计,但是在大数据分析的时候,往往需要对某一类或者甚至不同类的页面进行综合分析,对于不同页面的热点差异很大,以点击量为例,某个页面的点击量为几百万次,另一个页面的点击量为几次,当需要进行数据分析的时候,很难对不同数量级之间的数据进行统计对比,换言之,一个无限大的数据与一个无限小的数据之间没有进行比较的意义,那么如何控制其热度在一定的有限范围内进行有意义的对比统计对于大数据的挖掘发展有重要意义。
技术实现思路
本专利技术的目的在于:针对现有技术中很难实现对网页的热度量化和归一化进而导致网页热度的预计不够准确或不同网页热度之间很难进行对比分析的问题,本专利技术提供了一种热度迭代计算方法。本专利技术采用的技术方案如下:一种热度迭代计算方法,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;上述方案中,具体地,所述步骤1具体为:步骤1.1:设定网页的热度指标hn,以Δhn标记第n+1次刷新后热度增量Δhn为:Δhn=hn+1-hn;步骤1.2:获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束,所述条件包括:hn应当位于区间[0,X]之内,X为正整数,热度指标序列为:h0,h1…hn,h0为初始热度值,h0=0,热度指标序列为{hn}为递增序列,即hn<hn+1,热度指标序列为{hn}的增长应当是递减,即Δhn>Δhn+1,热度指标序列hn应当具有上界,hn≤X;步骤2:设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},并构造关于热度标准序列{gn}的热度迭代函数f(gn);上述方案中,具体地,所述步骤2具体为:步骤2.1:设定热度指标序列的标准化区间为[0,1];步骤2.2:根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},即满足:步骤2.3:并构造关于热度标准序列{gn}的热度迭代函数f(gn),即:gn+1=f(gn)其中f(gn)即为热度迭代函数,其中g0=0。步骤3:设定热度迭代函数f(gn)的初始值参量ε,对热度迭代函数f(gn)进行进行迭代计算获得热度指标序列{hn}的最大迭代增量Δhnmax。上述方案中,具体地,所述步骤3的具体步骤为:步骤3.1:设定热度迭代函数f(gn)的初始值参量ε,即:f(0)=ε且f(1)=1,f'(0)=1,f'(1)=1-σ,f(x)≥x,f'(x)>0,f″(x)<0,σ=2ε;步骤3.2:设定f(gn)为四次多项式函数,自变量gn以x来表示:f(x)=P4(x)=a4x4+a3x3+a2x2+a1x+a0且a0=ε,a1=1,2a4+a3=2ε-σ,a4+a3+a2=-ε;步骤3.3:利用步骤3.2中的关系式对f(x)进行变换得到:f(x)=ax4-2ax3+(a-ε)x2+x+ε;当a=0时,迭代函数系统具有最简形式f(x)=ε+x-εx2进而得到:f'(x)=1-εxf″(x)=-ε进而获得热度标准序列{gn}的迭代增量的最大值Δgnmax:步骤3.4:获得热度指标序列{hn}的最大迭代增量Δhnmax为:其中Δhnmax为热度指标序列{hn}最大迭代增量。上述方案中,进一步地,还包括步骤4:根据最大最大迭代增量Δhnmax获得网页的最大热度值。上述方案中,具体地,所述步骤4根据最大最大迭代增量Δhnmax获得网页的最大热度值hnmax为:hnmax=Δhnmax+hn-1max其中hn-1max是热度指标序列{hn}中小于最大热度值hnmax的值。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1.本专利技术中通过设定热度指标序列为{hn},并通过建立标准化区间,获得热度标准序列,并对热度标准序列进行热度迭代获得热度标准序列的迭代最大增量进而获得热度指标序列的最大迭代增量Δhnmax,本专利技术将网页热度控制在设定的范围内,一方面将实现了网页热度的归一化处理,方便了各个网页热度相互之间的统计与对比,另一方面实现了对网页热度的量化,能更加准确的对网页热度进行评估和预测;2.本专利技术中根据最大迭代增量获得了最大热度值,进而可以预测到网页的最大热点值,从而获得了网页热度的最高点即由热到冷或由冷到热的转折点,从而对网页热度的转折点进行评估;3.本专利技术适用于网页热度的计算方法,同样适用于对词频等的热度计算,为热点的热度统计等提供了具体的量化标准,为大数据分析提供了更可靠的量化标准;4.本专利技术中只引入了单个变量,且热度计算的过程中不断地简化,从而实现了简便的热度计算方法,相对于其他更复杂的热度计算方法,本专利技术的热度计算方法的运算效率更高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本专利技术的主旨。图1是本专利技术的迭代原理示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种热度迭代计算方法,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;上述方案中,具体地,所述步骤1具体为:步骤1.1:设定网页的热度指标hn;步骤1.2:获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束,所述条件包括:hn应当位于区间[0,X]之内,X为正整数,热本文档来自技高网
...
一种热度迭代计算方法

【技术保护点】
1.一种热度迭代计算方法,其特征在于,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;步骤2:设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},并构造关于热度标准序列{gn}的热度迭代函数f(gn);步骤3:设定热度迭代函数f(gn)的初始值参量ε,对热度迭代函数f(gn)进行进行迭代计算获得热度指标序列{hn}的最大迭代增量Δhnmax。

【技术特征摘要】
1.一种热度迭代计算方法,其特征在于,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;步骤2:设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},并构造关于热度标准序列{gn}的热度迭代函数f(gn);步骤3:设定热度迭代函数f(gn)的初始值参量ε,对热度迭代函数f(gn)进行进行迭代计算获得热度指标序列{hn}的最大迭代增量Δhnmax。2.如权利要求1所述的一种热度迭代计算方法,其特征在于,还包括步骤4:根据最大迭代增量Δhnmax获得网页的最大热度值。3.如权利要求2所述的一种热度迭代计算方法,其特征在于,所述步骤1具体为:步骤1.1:设定网页的热度指标hn,以Δhn标记第n+1次刷新后热度增量Δhn为:Δhn=hn+1-hn;步骤1.2:获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束,所述条件包括:hn应当位于区间[0,X]之内,X为正整数,热度指标序列为:h0,h1…hn,h0为初始热度值,h0=0,热度指标序列为{hn}为递增序列,即hn<hn+1,热度指标序列为{hn}的增长应当是递减,即Δhn>Δhn+1,热度指标序列hn应当具有上界,hn≤X。4.如权利要求3所述的一种热度迭代计算方法,其特征在于,所述步骤2具体为:步骤2.1:设定热度指标序列的标准化区间为[0,1];步骤2.2:根据标准化区间将热...

【专利技术属性】
技术研发人员:鲁勇志
申请(专利权)人:成都优易数据有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1