System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及互联网,尤其涉及一种内容热度评分方法、计算设备和可读存储介质。
技术介绍
1、互联网时代,内容和信息出现了大爆炸,如何在海量内容尤其是用户生成内容(user generated content)中快速有效地找到有价值的内容,是互联网行业的核心问题。
2、在现有的互联网平台中,对用户发表的内容,按照一定的公式或规则评分(热度分),进而用此热度分作为内容排行的依据是业内的常见做法。内容的评分受内容质量、内容属性、创作者身份、发布时间、回复时间、用户互动行为等多个维度影响。由于内容热度分会直接影响内容在网站或app中的展示与曝光,与内容发布者的利益密切相关,因此热度分和热门榜单往往伴随着数据造假。传统的热度计算方法在应对数据造假方面存在缺陷,无法识别出数据造假的内容或需要数据预处理才能评分,导致热门榜单的准确性无法得到保证,劣质内容进入榜单之中。
3、因此,需要提供一种内容热度评分方案,以准确合理地计算内容的热度分。
技术实现思路
1、为此,本专利技术提供了一种内容热度评分方法、计算设备和可读存储介质,以解决或至少缓解上面存在的问题。
2、根据本专利技术的一个方面,提供了一种内容热度评分方法,在计算设备中执行,适于对内容集合中的内容进行热度评分,所述内容集合包括多条内容,所述方法包括:获取内容集合中各条内容的访问数据,所述访问数据包括浏览数、回复数和点赞数;基于所述访问数据计算所述多条内容的平均浏览数、平均回复数和平均点赞数;以预定的基准
3、可选地,在根据本专利技术的内容热度评分方法中,所述访问数据还包括所述回复数对应的用户数;基于所述待评分内容的访问数据计算对应的回复分值,包括:计算所述待评分内容对应的用户数和回复数的调和平均值;基于所述调和平均值,确定所述待评分内容的回复分值。
4、可选地,根据本专利技术的内容热度评分方法,还包括:基于所述访问数据,计算所述内容集合中各条内容的回复浏览比和点赞浏览比;计算所述多条内容的回复浏览比的第一均值和第一标准差,以及点赞浏览比的第二均值和第二标准差;基于所述第一均值、第一标准差以及所述待评分内容的回复浏览比,计算针对所述浏览权重的第一修正系数和针对所述回复权重的第二修正系数;基于所述第二均值、第二标准差以及所述待评分内容的点赞浏览比,计算针对所述浏览权重的第三修正系数和针对所述点赞权重的第四修正系数;其中,在进行所述加权求和时,采用修正后的浏览权重、回复权重和点赞权重进行计算。
5、可选地,在根据本专利技术的内容热度评分方法中,按照如下公式计算所述第一修正系数:式中,α1为第一修正系数,f()为正态分布概率密度函数,μ1为第一均值,σ1为第一标准差,r1为待评分内容的回复浏览比,k1为预设的第一系数,k2为预设的第二系数。
6、可选地,在根据本专利技术的内容热度评分方法中,k1=-1.6,k2=-1。
7、可选地,在根据本专利技术的内容热度评分方法中,按照如下公式计算所述第二修正系数:式中,α2为第二修正系数,f()为正态分布概率密度函数,μ1为第一均值,σ1为第一标准差,r1为待评分内容的回复浏览比,k3为预设的第三系数,k4为预设的第四系数。
8、可选地,在根据本专利技术的内容热度评分方法中,k3=1.6,k4=1。
9、可选地,在根据本专利技术的内容热度评分方法中,按照如下公式计算所述第三修正系数:式中,β1为第三修正系数,f()为正态分布概率密度函数,μ2为第二均值,σ2为第二标准差,r2为待评分内容的点赞浏览比,k5为预设的第五系数,k6为预设的第六系数。
10、可选地,在根据本专利技术的内容热度评分方法中,k5=-1.6,k6=-1。
11、可选地,在根据本专利技术的内容热度评分方法中,按照如下公式计算所述第四修正系数:式中,β3为第四修正系数,f()为正态分布概率密度函数,μ2为第二均值,σ2为第二标准差,r2为待评分内容的点赞浏览比,k7为预设的第七系数,k8为预设的第八系数。
12、可选地,在根据本专利技术的内容热度评分方法中,k7=1.6,k8=1。
13、可选地,在根据本专利技术的内容热度评分方法中,所述基准系数为1。
14、可选地,在根据本专利技术的内容热度评分方法中,所述计算所述待评分内容的热度评分的衰减速度,包括:确定衰减系数;至少基于所述待评分内容的发布时间和所述衰减系数,计算所述待评分内容的热度评分的衰减速度。
15、可选地,在根据本专利技术的内容热度评分方法中,根据所述多个内容的产生速度确定所述衰减系数。
16、可选地,在根据本专利技术的内容热度评分方法中,根据多个内容集合的内容产生速度的平均值或中位数确定所述衰减系数。
17、可选地,在根据本专利技术的内容热度评分方法中,根据内容的特征确定衰减系数,所述特征为时间段、节日、主题活动中的一个或多个。
18、可选地,在根据本专利技术的内容热度评分方法中,所述访问数据还包括最后互动时间;所述至少基于所述待评分内容的发布时间和所述衰减系数,计算所述待评分内容的热度评分的衰减速度,包括:计算所述待评分内容对应的发布时间与最后互动时间的第三均值;基于所述第三均值和所述衰减系数,计算所述待评分内容的热度评分的衰减速度。
19、可选地,在根据本专利技术的内容热度评分方法中,所述衰减速度的计算公式如下:式中,v为衰减速度,tt为待评分内容对应的发布时间,tu为待评分内容对应的最后互动时间,m为衰减系数。
20、可选地,在根据本专利技术的内容热度评分方法中,所述最后互动时间为最后点赞时间或最后回复时间。
21、根据本专利技术的另一个方面,提供一种计算设备,包括:至少一个处理器;存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如前任一项所述的方法的指令。
22、根据本专利技术的又一个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如前任一项所述方法。
23、根据本专利技术的内容热度评分方案,对内容集合中所有内容的访问数据进行统计,根据统计结果确定浏览权重、回复权重和点赞权重,代替了传统的人为设定权重的方式,更加科学合理,提升了热度评分的公正性与准确性。对待评分内容的访问数据进行处理,得到了对应的浏览分值、回复分值和点赞分值,并将其与对应的权重加权求和本文档来自技高网...
【技术保护点】
1.一种内容热度评分方法,在计算设备中执行,适于对内容集合中的内容进行热度评分,所述内容集合包括多条内容,所述方法包括:
2.如权利要求1所述的内容热度评分方法,其中,所述访问数据还包括所述回复数对应的用户数;
3.如权利要求1或2所述的内容热度评分方法,还包括:
4.如权利要求3所述的内容热度评分方法,其中,按照如下公式计算所述第一修正系数:
5.如权利要求4所述的内容热度评分方法,其中,k1=-1.6,k2=-1。
6.如权利要求3所述的内容热度评分方法,其中,按照如下公式计算所述第二修正系数:
7.如权利要求6所述的内容热度评分方法,其中,k3=1.6,k4=1。
8.如权利要求3所述的内容热度评分方法,其中,按照如下公式计算所述第三修正系数:
9.一种计算设备,包括:
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述方法。
【技术特征摘要】
1.一种内容热度评分方法,在计算设备中执行,适于对内容集合中的内容进行热度评分,所述内容集合包括多条内容,所述方法包括:
2.如权利要求1所述的内容热度评分方法,其中,所述访问数据还包括所述回复数对应的用户数;
3.如权利要求1或2所述的内容热度评分方法,还包括:
4.如权利要求3所述的内容热度评分方法,其中,按照如下公式计算所述第一修正系数:
5.如权利要求4所述的内容热度评分方法,其中,k1=-1.6,k2=...
【专利技术属性】
技术研发人员:杨雷,
申请(专利权)人:北京齐尔布莱特科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。