网络社区热点内容的判别方法、装置、设备以及存储介质制造方法及图纸

技术编号:26791305 阅读:22 留言:0更新日期:2020-12-22 17:06
本申请实施例公开了网络社区热点内容的判别方法、装置、设备以及存储介质,涉及机器学习技术领域。该网络社区热点内容的判别方法的一具体实施方式包括:接收到根据用户对网络社区内帖子的操作行为确定的触发信号;获取帖子的属性信息特征;将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子,从而获取符合本网络社区特征的热点内容,提高获取的热点内容的时效性,降低获取热点内容的人工成本。

【技术实现步骤摘要】
网络社区热点内容的判别方法、装置、设备以及存储介质
本申请涉及计算机
,具体涉及机器学习领域,尤其涉及网络社区热点内容的判别方法、装置、设备以及存储介质。
技术介绍
随着移动互联网时代的到来,互联网技术正在不断的影响着人们的生活,各种社区类站点(如:脉脉、贴吧、微博、知乎等)每天产生数亿的内容供用户消费,人们在逛社区时不仅浏览阅读常规内容,更多的会去寻找、消费社会广泛关注的内容,即社会热点新闻或热点内容。现有的热点内容挖掘主要是通过机器抓取、人工等方式,通过机器抓取其它新闻站点(如:微博、头条)的热点事件,其发现的热点事件内容带有其它站点特征较重,与本社区特征不相符,且时效性不强,存在时间延迟。通过人工编辑添加的热点内容发现策略,需要新闻敏感度的运营人员去手工添加,人工成本太高。
技术实现思路
为了解决上述
技术介绍
部分提到的一个或多个技术问题,本申请实施例提供了网络社区热点内容的判别方法、装置、设备以及存储介质。第一方面,本申请实施例提供了网络社区热点内容的判别方法,包括:接收到根据用户对网络社区内帖子的操作行为确定的触发信号;获取帖子的属性信息特征;将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。第二方面,本申请实施例提供了网络社区热点内容的判别装置,包括:接收模块,被配置为接收到根据用户对网络社区内帖子的操作行为确定的触发信号;获取模块,被配置为获取帖子的属性信息特征;判别模块,被配置为将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。第三方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。本申请实施例提供的网络社区热点内容的判别方法、装置、设备以及存储介质,首先接收到根据用户对网络社区内帖子的操作行为确定的触发信号;之后获取帖子的属性信息特征;最后将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子,从而获取符合本网络社区特征的热点内容,提高获取的热点内容的时效性,降低获取热点内容的人工成本。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的网络社区热点内容的判别方法的一个实施例的流程示意图;图3是根据本申请实施例的判别模型的一个实施例的流程图;图4是本申请的网络社区热点内容的判别装置的一个实施例的结构示意图;图5是用来实现本申请实施例的网络社区热点内容的判别方法的电子设备的框图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的网络社区热点内容的判别方法或网络社区热点内容的判别装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、网络102、服务器103。网络102用以在终端设备101、服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101可以通过网络102与服务器103交互。终端设备101中可以检测用户对网络社区内帖子的操作行为,并将根据用户对网络社区内帖子的操作行为确定的触发信号发送至服务器103,包括终端设备但不限于数据库、用户终端等等。服务器103可以提供各种服务,例如服务器103可以对获取帖子的属性信息特征等数据进行分析等处理,生成处理结果(例如将帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子)。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的网络社区热点内容的判别方法一般由服务器103执行,相应地,网络社区热点内容的判别装置一般设置于服务器103中。应该理解,图1中的存储设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的存储设备、网络和服务器。继续参考图2,示出了根据本申请的网络社区热点内容的判别方法的一个实施例的流程200。该网络社区热点内容的判别方法,包括以下步骤:步骤201,接收到根据用户对网络社区内帖子的操作行为确定的触发信号。在本实施例中,网络社区热点内容的判别方法的执行主体(例如图1所示的服务器103)可以接收到根据用户对网络社区内帖子的操作行为确定的触发信号。其中,网络社区是指基于网络技术提供的各种交流信息的手段,比如讨论、通信、聊天等,使社区居民得以互动。例如BBS/论坛、贴吧、知乎、微博、脉脉等。帖子指的是供网络社区内的用户进行搜索、阅读、分享、互动的内容,例如百度贴吧的贴子等。本申请实例的网络社区热点内容的判决方法的触发条件是用户对对帖子的操作行为,例如用户回帖、点赞、点踩、分享等等。终端设备(例如图1所述的终端设备101)可以检测到用户对网络社区内帖子的操作行为,之后基于检测到的操作行为生成触发信号,并将触发信号发送到上述执行主体。步骤202,获取帖子的属性信息特征。在本实施例中,上述执行主体可以获取帖子的属性信息特征。以百度贴吧为例,其贴子的属性信息包括贴子回复总数、贴子点赞总数、贴子浏览总数、贴子分享总数、贴子点踩总数、贴子回复时间、回帖子发贴时间、贴子内容长度、贴子内容等。步骤203,将帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。在本实施例中,上述执行主体可以将帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。具体地,可以使用训练好的判别模型对帖子进行计算分值,分数大于预定本文档来自技高网...

【技术保护点】
1.一种网络社区热点内容的判别方法,包括:/n接收到根据用户对网络社区内帖子的操作行为确定的触发信号;/n获取帖子的属性信息特征;/n将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。/n

【技术特征摘要】
1.一种网络社区热点内容的判别方法,包括:
接收到根据用户对网络社区内帖子的操作行为确定的触发信号;
获取帖子的属性信息特征;
将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。


2.根据权利要求1所述的方法,所述将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别包括:
将所述帖子的属性信息特征输入至预先训练的逻辑回归模型,得到所述帖子的第一分数;
将所述帖子的文本信息输入至自然语言处理分词模型,得到分词集合;
将所述分词集合输入至搜索加权模型,得到所述帖子的第二分数,其中,所述搜索加权模型基于每个分词的搜索频次确定对应的权重分数;
基于所述帖子的第一分数和第二分数,确定所述帖子的综合分数,若所述帖子的综合分数大于或等于预定阈值,则将所述帖子标记为热点内容。


3.根据权利要求2所述的方法,还包括:
根据所述分词出现在第三方网络社区的个数,利用所述搜索加权模型确定所述分词对应的权重分数,得到所述帖子的第三分数;
基于所述帖子的第一分数、第二分数、第三分数,确定所述帖子的综合分数,若所述帖子的综合分数大于或等于预定阈值,则将所述帖子标记为热点内容。


4.根据权利要求2所述的方法,其中,在将所述帖子的文本信息输入至自然语言处理分词模型之前,还包括:
若所述帖子的发布时间与当前时间的时间间隔大于约定阈值,则将所述帖子标记为非热点内容。


5.根据权利要求1所述的方法,训练所述逻辑回归模型的方法包括:
获取训练样本帖子的属性信息特征及属性信息特征的权重信息;
标注训练样本帖子的类别;
基于训练样本帖子的类别、属性信息特征、属性信息特征的权重信息,训练逻辑回归模型,并用梯度下降对所述属性信息特征的权重信息进行更新,得到所述属性信息特征的权重向量。


6.根据权利要求2所述的方法,所述将所述帖子的属性信息特征输入至预先训练的逻辑回归模型,得到所述帖子的第一分数包括:
若所述帖子的第一分数小于预定阈值,则将所述帖子标记为非热点内容。


7.一种网络社区热点内容的判别装置,其特征在于,所述装置包括:
接收模块,被配置为接收到根据用户对网络社区内帖子的操作行为确定的触发信号;
获取模块,被配置为获取帖子的属性信息特征;
判别模块,被配置为将所述帖子的属性信息特征输入至预先训练...

【专利技术属性】
技术研发人员:肖锋逄增耀
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1