The invention discloses an iterative calculation method of heat degree, which aims to solve the problem that it is difficult to quantify and normalize the heat of a web page in the existing technology, so that the prediction of the web page heat is not accurate or the heat degree of different web pages is difficult to compare and analysis. The invention includes the following steps: setting the thermal index of the web page, obtaining the heat index of the web page, The heat index sequence is constrained by the heat index sequence, the normalized interval of the heat index sequence is set, and the heat index sequence is normalized to the heat standard sequence according to the standardized interval, and the heat iterative function on the heat degree standard sequence is constructed, and the heat iteration function is iteratively calculated to obtain the heat. The maximum iteration increment of the degree index sequence; the invention realizes the homepage heat degree normalization processing within the set range, facilitates the statistics and comparison of the web pages heat, quantifies the heat of the web pages, and can more accurately evaluate and predict the heat degree of the web pages; the invention is suitable for the calculation of heat degree. Related fields.
【技术实现步骤摘要】
一种热度迭代计算方法
本专利技术涉及热度计算领域,具体涉及一种热度迭代计算方法。
技术介绍
搜索引擎已成为我们获取信息必不可少的途径,但是现在的信息资源丰富且多样化。正因为信息资源丰富和多样化,我们很难获取得到我们自己真正需要的信息。现有的搜索引擎为了满足用户的需求,利用搜索引擎根据采集到的用户的搜索信息来预计用户需要的信息。但是在实际处理的过程中,现有的热度计算由于加入的变量过多而导致算法较为复杂,对于供应商而言,算法越复杂,所占CPU过高,且占内存较多进而导致搜索引擎的成本高,试想搜索引擎的用户量大,如果每个用户量的计算量均较大,那么搜索引擎的主服务器很难满足用户所需,而服务器的成本是极高的;另一方面算法过于复杂的时候也容易导致实际运算效率低。现有的一些热度算法还有一些缺陷,就是往往只能对已经发生的搜索行为进行热度统计和计算,但是对热度很难量化进而很难对网页未来的热点进行准确预估。同时在现有的热度预估中存在有一定的技术偏见,往往认为热度会随着上涨的速度越来越高,只有当趋势下降的时候才会开始预估下跌,这样就会导致当某个词的热度已经下降的时候才预估下降,也就是很难预测到某个词的热度的热度什么时候会下滑,换言之,很难预测到这个转折点,而这才是预测最有价值的地方;同时现有的一些网页的热度统计通常是累积式的,即累加统计,但是在大数据分析的时候,往往需要对某一类或者甚至不同类的页面进行综合分析,对于不同页面的热点差异很大,以点击量为例,某个页面的点击量为几百万次,另一个页面的点击量为几次,当需要进行数据分析的时候,很难对不同数量级之间的数据进行统计对比,换言之,一 ...
【技术保护点】
1.一种热度迭代计算方法,其特征在于,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;步骤2:设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},并构造关于热度标准序列{gn}的热度迭代函数f(gn);步骤3:设定热度迭代函数f(gn)的初始值参量ε,对热度迭代函数f(gn)进行进行迭代计算获得热度指标序列{hn}的最大迭代增量Δhnmax。
【技术特征摘要】
1.一种热度迭代计算方法,其特征在于,包括以下步骤:步骤1:设定网页的热度指标hn,获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束;步骤2:设定热度指标序列的标准化区间,并根据标准化区间将热度指标序列{hn}标准化为热度标准序列{gn},并构造关于热度标准序列{gn}的热度迭代函数f(gn);步骤3:设定热度迭代函数f(gn)的初始值参量ε,对热度迭代函数f(gn)进行进行迭代计算获得热度指标序列{hn}的最大迭代增量Δhnmax。2.如权利要求1所述的一种热度迭代计算方法,其特征在于,还包括步骤4:根据最大迭代增量Δhnmax获得网页的最大热度值。3.如权利要求2所述的一种热度迭代计算方法,其特征在于,所述步骤1具体为:步骤1.1:设定网页的热度指标hn,以Δhn标记第n+1次刷新后热度增量Δhn为:Δhn=hn+1-hn;步骤1.2:获得热度指标序列为{hn},对热度指标序列{hn}进行条件约束,所述条件包括:hn应当位于区间[0,X]之内,X为正整数,热度指标序列为:h0,h1…hn,h0为初始热度值,h0=0,热度指标序列为{hn}为递增序列,即hn<hn+1,热度指标序列为{hn}的增长应当是递减,即Δhn>Δhn+1,热度指标序列hn应当具有上界,hn≤X。4.如权利要求3所述的一种热度迭代计算方法,其特征在于,所述步骤2具体为:步骤2.1:设定热度指标序列的标准化区间为[0,1];步骤2.2:根据标准化区间将热...
【专利技术属性】
技术研发人员:鲁勇志,
申请(专利权)人:成都优易数据有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。