一种确定热点话题的方法和装置制造方法及图纸

技术编号:38030410 阅读:22 留言:0更新日期:2023-06-30 10:56
本发明专利技术是关于确定热点话题的方法和装置,方法包括:获取社区内容中每个标签的第一正向行为数据,以及每个标签下的每个话题的第二正向行为数据;根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,得到归一化得分相对值;根据预设周期计算每个话题的归一化得分相对值的涨幅和涨幅加速度;将涨幅和涨幅加速度符合预设条件的话题确定为热点话题。本发明专利技术分标签计算不同标签的内容中潜在的热点话题内容,可以服务不同兴趣的人群,并且根据预设周期进行话题的归一化得分相对值的涨幅、涨幅的加速度的计算,提高了发现潜在热点话题的实时性和准确性。提高了发现潜在热点话题的实时性和准确性。提高了发现潜在热点话题的实时性和准确性。

【技术实现步骤摘要】
一种确定热点话题的方法和装置


[0001]本专利技术涉及数据处理
,尤其涉及一种确定热点话题的方法和装置。

技术介绍

[0002]伴随着互联网的快速发展,出现了很多不同类型的社区内容平台,诸如综合在线内容平台、生活类内容平台、文娱类内容平台、消费类内容平台等,在基于社区内容的APP中,用户可以以文字、图像、视频、直播等多种内容形式进行创作,发布社区内容。社区内容平台中通常可以包括标签,对于用户发布的内容,可以对其进行打标,例如加上标签(tag),比如美食、明星等。社区内容平台中还可以包括“话题”,即用户发布的社区内容的主题,如“#明星八卦”等,可以是用户自己添加或者APP客户端引导用户添加。一个标签下可以有多个话题,而一个社区内容可以有不同的标签和话题,例如对于标识为123456的社区内容,它的标签是“追星”,它的话题是#ABC八卦。
[0003]运营方希望能快速发现社区内容的潜在热点话题,或者说当下用户最可能积极参与互动的话题内容。现有技术方案是根据一个新的话题内容下,正向行为在预设时间内达到预设值,并且通常是离线T+1进行计算。其中,正向行为例如是点击、点赞、收藏、发帖等。
[0004]现有方案存在的缺点:(1)马太效应明显:上述方案只容易在人群参与度高的内容中发现潜在爆款,对其他小众兴趣的人群不适用;(2)规则的制定和计算不够实时和动态,统计的指标滞后性比较大。

技术实现思路

[0005]为克服相关技术中存在的问题,本专利技术的实施例提供一种确定热点话题的方法和装置。技术方案如下:
[0006]根据本专利技术的实施例的第一方面,提供一种确定热点话题的方法,包括:
[0007]获取社区内容中每个标签的第一正向行为数据,以及每个标签下的每个话题的第二正向行为数据;
[0008]根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,得到归一化得分相对值;
[0009]根据预设周期计算每个话题的归一化得分相对值的涨幅和涨幅加速度;
[0010]将涨幅和涨幅加速度符合预设条件的话题确定为热点话题。
[0011]在一实施例中,获取社区内容中每个标签的第一正向行为数据,包括:
[0012]对于每个标签,根据标签的正向行为次数计算标签的正向行为得分;
[0013]根据标签的总曝光量对标签的正向行为得分进行归一化处理,得到标签的第一正向行为数据。
[0014]在一实施例中,获取每个标签下的每个话题的第二正向行为数据,包括:
[0015]对于每个话题,根据话题的正向行为次数计算话题的正向行为得分;
[0016]根据话题的总曝光量对话题的正向行为得分进行归一化处理,得到话题的第二正
向行为数据。
[0017]在一实施例中,根据以下公式计算正向行为得分:
[0018]a*点击次数+b*点赞数+c*收藏数+d*发帖数;
[0019]其中,a、b、c、d分别为不同的正向行为各自对应的权重值。
[0020]在一实施例中,所述根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,包括:
[0021]根据以下公式进行归一化处理:话题的第二正向行为数据/话题对应的标签的第一正向行为数据。
[0022]根据本专利技术的实施例的第二方面,提供一种确定热点话题的装置,包括:
[0023]获取模块,用于获取社区内容中每个标签的第一正向行为数据以及每个标签下的每个话题的第二正向行为数据;
[0024]第一处理模块,用于根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,得到归一化得分相对值;
[0025]第二处理模块,用于根据预设周期计算每个话题的归一化得分相对值的涨幅和涨幅加速度;
[0026]确定模块,用于将涨幅和涨幅加速度符合预设条件的话题确定为热点话题。
[0027]在一实施例中,所述获取模块,包括:
[0028]第一计算单元,用于对于每个标签,根据标签的正向行为次数计算标签的正向行为得分;
[0029]第一处理单元,用于根据标签的总曝光量对标签的正向行为得分进行归一化处理,得到标签的第一正向行为数据;
[0030]第二计算单元,用于对于每个话题,根据话题的正向行为次数计算话题的正向行为得分;
[0031]第二处理单元,用于根据话题的总曝光量对话题的正向行为得分进行归一化处理,得到话题的第二正向行为数据。
[0032]在一实施例中,所述第一计算单元和第二计算单元根据以下公式计算正向行为得分:
[0033]a*点击次数+b*点赞数+c*收藏数+d*发帖数,其中,a、b、c、d分别为不同的正向行为各自对应的权重值。
[0034]根据本专利技术的实施例的第三方面,提供一种确定热点话题的装置,包括:
[0035]处理器;
[0036]用于存储处理器可执行指令的存储器;
[0037]其中,所述处理器被配置为:
[0038]获取社区内容中每个标签的第一正向行为数据,以及每个标签下的每个话题的第二正向行为数据;
[0039]根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,得到归一化得分相对值;
[0040]根据预设周期计算每个话题的归一化得分相对值的涨幅和涨幅加速度;将涨幅和涨幅加速度符合预设条件的话题确定为热点话题
[0041]根据本专利技术的实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现本专利技术的实施例的第一方面中任一项方法的步骤。
[0042]本专利技术的实施例提供的技术方案,分标签计算不同标签的内容中潜在的热点话题内容,可以服务不同兴趣的人群,并且根据预设周期进行话题的归一化得分相对值的涨幅、涨幅的加速度的计算,提高了发现潜在热点话题的实时性和准确性。
[0043]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0044]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0045]图1是根据一示例性实施例示出的确定热点话题方法流程图;
[0046]图2是根据一示例性实施例示出的确定热点话题方法流程图;
[0047]图3是根据一示例性实施例示出的确定热点话题装置的框图;
[0048]图4是根据一示例性实施例示出的确定热点话题装置的框图;
[0049]图5是根据一示例性实施例示出的确定热点话题装置的框图;
[0050]图6是根据一示例性实施例示出的确定热点话题装置的框图。
具体实施方式
[0051]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定热点话题的方法,其特征在于,包括:获取社区内容中每个标签的第一正向行为数据,以及每个标签下的每个话题的第二正向行为数据;根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,得到归一化得分相对值;根据预设周期计算每个话题的归一化得分相对值的涨幅和涨幅加速度;将涨幅和涨幅加速度符合预设条件的话题确定为热点话题。2.根据权利要求1所述的方法,其特征在于,获取社区内容中每个标签的第一正向行为数据,包括:对于每个标签,根据标签的正向行为次数计算标签的正向行为得分;根据标签的总曝光量对标签的正向行为得分进行归一化处理,得到标签的第一正向行为数据。3.根据权利要求1所述的方法,其特征在于,获取每个标签下的每个话题的第二正向行为数据,包括:对于每个话题,根据话题的正向行为次数计算话题的正向行为得分;根据话题的总曝光量对话题的正向行为得分进行归一化处理,得到话题的第二正向行为数据。4.根据权利要求2或3所述的方法,其特征在于,根据以下公式计算正向行为得分:a*点击次数+b*点赞数+c*收藏数+d*发帖数;其中,a、b、c、d分别为不同的正向行为各自对应的权重值。5.根据权利要求1所述的方法,其特征在于,所述根据话题对应的标签的第一正向行为数据,对每个话题的第二正向行为数据进行归一化处理,包括:根据以下公式进行归一化处理:话题的第二正向行为数据/话题对应的标签的第一正向行为数据。6.一种确定热点话题的装置,其特征在于,包括:获取模块,用于获取社区内容中每个标签的第一正向行为数据以及每个标签下的每个话题的第二正向行为数据;第一处理模块,用于根据话题对应的标签的第一正向行为数据,对每个话...

【专利技术属性】
技术研发人员:肖宇涵
申请(专利权)人:无线生活杭州信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1