本发明专利技术实施例公开了一种事件分级方法、装置、设备和介质,涉及互联网信息领域。该方法包括:识别资讯流中的事件;提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;基于所述事件属性对所述事件进行分级。本发明专利技术实施例提供了一种事件分级方法、装置、设备和介质,实现了事件的自动高效分级,进而根据事件级别可以快速全面地确定出热门事件。
Event classification methods, devices, equipment and media
【技术实现步骤摘要】
事件分级方法、装置、设备和介质
本专利技术实施例涉及互联网信息领域,尤其涉及一种事件分级方法、装置、设备和介质。
技术介绍
伴随着互联网的飞速发展,网络信息呈爆炸式增长的趋势。而在飞速爆炸的信息中人们往往希望能够快速全面的了解时下热门活动和即将发生的热门活动。传统的热门活动发现或者事件分级往往强依赖于运营等相关人员的专业知识或者滞后的用户反馈,比如用户对事件的搜索量和点击量等,进行事件分级。并在事件分级后进行信息的分发。而这些传统方式会带来由于时效性不高或相关运营的专业偏好的主观不可控导致的热点信息损失问题。
技术实现思路
本专利技术实施例提供一种事件分级方法、装置、设备和介质,以实现事件的自动高效分级,进而根据事件级别可以快速全面地确定出热门事件。第一方面,本专利技术实施例提供了一种事件分级方法,该方法包括:识别资讯流中的事件;提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;基于所述事件属性对所述事件进行分级。第二方面,本专利技术实施例还提供了一种事件分级装置,该装置包括:事件识别模块,用于识别资讯流中的事件;属性提取模块,用于提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;事件分级模块,用于基于所述事件属性对所述事件进行分级。第三方面,本专利技术实施例还提供了一种电子设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例中任一项所述的事件分级方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本专利技术实施例中任一项所述的事件分级方法。本专利技术实施例通过识别资讯流中的事件;提取所述事件的事件属性;基于所述事件属性对所述事件进行分级,从而实现对事件的自动分级。而自动分级相比人工参与的分级速度要快,又因为资讯流包括信息的全面性,所以根据事件级别可以快速全面地确定出热门事件。并且,因为没有人工参与,所以本专利技术实施例避免了人工主观因素的影响,提高了事件的分级准确率。附图说明图1为本专利技术实施例一提供的一种事件分级方法的流程图;图2是本专利技术实施例二提供的一种事件分级方法的流程图;图3是本专利技术实施例三提供的一种事件分级方法的流程图;图4是本专利技术实施例四提供的一种事件分级装置的结构示意图;图5为本专利技术实施例五提供的一种设备的结构示意图。具体实施方式当前对事件进行分级的方法主要包括如下:(1)选取结构化的地震灾害事件关键数据特征作为SVM向量特征对地震灾害事件进行分级学习,得到一个根据地震灾害关键数据特征的事件分级模型。(2)通过构建城市交通地理信息等交通数据库,采用层次模糊策略模型,对交通意外进行事件分级。(3)使用突发事件图像信息对突发事件进行分级分类,利用标记好的事件图像信息和事件等级通过深度卷积神经网络进行模型训练,得到一个可以根据突发事件图像信息等级类别的一个分级分类模型。专利技术人在实现本专利技术的过程中发现:现有方法主要通过全人工或半人工的方式对事件关键信息进行提取,将事件提取为较为规整的强结构化数据,然后通过关键数据特征输入作为分级模型特征输入进行模型学习。然而,上述方法存在如下缺点:方案(1)和方案(2)都存在垂直领域过于严重的问题,即通用性较差。其中方案(1)完全依赖于灾害发生且清算完成后数字型数据进行。因此该方案首先是不具备通用性,仅适用于可能提取完全数字特征灾害类事件;其次是时效性较差,该方案利用灾难事件的完整数据,而灾难事件的完整数据需要在事件结束后花费较长时间进行统计,所以缺乏了对突发事件的检测。方案(3),该方案通过构建突发事件的事件图像信息得到分类模型。该方案可以在一定程度上避免由于运营主观经验带来的偏差,同时也具有通用性。但是该方案的可扩展性较差,且依旧依赖于突发事件的事件图像标注,标注过程将带来时效性降低和属性值不易扩展的问题。下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种事件分级方法的流程图。本实施例可适用于对事件进行自动热度分级的情况。典型地,本实施例可适用于从资讯流中提取热门事件的情况。该方法可以由一种事件分级装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的事件分级方法包括:S110、识别资讯流中的事件。其中,资讯流包括至少一条资讯。具体地,资讯流的确定可以是:从互联网上抓取资讯;对抓取的各条资讯进行排列,生成资讯流。事件是比较重大、对一定的人群会产生一定影响的事情。通常事件包括执行人和执行活动。示例性的,事件可以是张三和李四结婚,也可以是张三出轨,还可以是李四死亡等。具体地,识别资讯流中的事件包括:对资讯流进行切分,生成单条资讯;根据事件的特征从生成的单条资讯中识别事件。典型地,根据事件的特征从生成的单条资讯中识别事件,包括:将单条资讯输入预先训练的事件判别模型,输出该条资讯是否为事件的判别结果。可选地,根据事件的特征从生成的单条资讯中识别事件,包括:根据事件的特征确定事件的存在条件;若单条资讯满足所述存在条件,则确定该条资讯为事件。具体地,事件的存在条件可以是具有执行人和执行活动。S120、提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种。其中,事件实体是指事件中存在的实体,具体事件实体可以是人,例如事件的执行人。事件活动是指事件发生的活动,具体事件活动可以是事件执行人的执行动作,例如离婚、结婚、出轨或死亡等。事件领域是指事件所属领域。例如,事件领域可以是体育、娱乐或军事等。事件簇信息是指所述事件所属事件簇的信息,具体可以是事件簇中事件的数量和/或事件簇中事件的发布者属性信息。具体地,发布者属性信息可以是发布机构的权威性。具体地,提取所述事件的事件实体,包括:将事件中出现的名词作为事件实体。为实现对事件实体的准确确定,所述提取所述事件的事件实体,包括:对所述事件的文本进行切词,生成事件词语;基于句法结构从所述事件词语中确定候选实体;将所述候选实体与所述事件所属领域的实体进行匹配;若匹配一致,则将所述候选实体作为所述事件的事件实体。其中,所述事件所属领域的实体是预先根据领域特征确定的。具体地,提取所述事件的事件活动,包括:将事件中出现的动词作为事件活动。典型地,提取所述事件的事件活动,包括:对所述事件的文本进行切词,生成事件词语;基于句法结构从所述事件词语中确定候选活动;将所述候选活动与所述事件所属领域的活动进行匹配;若匹配一致,则将所述候选活动作为所述事件的事件活动。具体地,提取所述事件的事件领域包括:对所述事件的文本进行切词,生成事件词语;将事件词语与领域关键词进行匹配;根据匹配结果确定事件领域。典型地,所述提取所述事件的事件簇信息,包括:基于事件内容,对从资讯流中识别到的至少两个事件进行聚类,生成事件簇;统计所述事件簇中事件的数量;将所述事件簇中事本文档来自技高网...
【技术保护点】
1.一种事件分级方法,其特征在于,包括:识别资讯流中的事件;提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;基于所述事件属性对所述事件进行分级。
【技术特征摘要】
1.一种事件分级方法,其特征在于,包括:识别资讯流中的事件;提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;基于所述事件属性对所述事件进行分级。2.根据权利要求1所述的方法,其特征在于,所述基于所述事件属性对所述事件进行分级,包括:根据所述事件实体的查看信息、所述事件活动的查看信息、所述事件与热门活动的相关度、所述事件中的热门实体信息、所述事件领域的热度信息、所述事件的关注度信息和所述事件的传播性信息中的至少一种,确定所述事件的等级。3.根据权利要求2所述的方法,其特征在于,所述确定所述事件的等级之前,所述方法还包括:根据所述事件实体与热门活动的共现信息,和/或所述事件活动与热门活动的共现信息,确定所述事件与热门活动的相关度信息;根据所述事件所属事件簇中的事件数量,确定所述事件的关注度信息;根据所述事件簇中事件的发布者属性信息,确定所述事件的传播性信息。4.根据权利要求1所述的方法,其特征在于,所述提取所述事件的事件实体,包括:对所述事件的文本进行切词,生成事件词语;基于句法结构从所述事件词语中确定候选实体;将所述候选实体与所述事件所属领域的实体进行匹配;若匹配一致,则将所述候选实体作为所述事件的事件实体。5.根据权利要求1所述的方法,其特征在于,所述提取所述事件的事件簇信息,包括:基于事件内容,对从资讯流中识别到的至少两个事件进行聚类,生成事件簇;统计所述事件簇中事件的数量;将所述事件簇中事件的数量和/或所述事件簇中事件的发布者属性信息,作为所述事件的事件簇信息。6.根据权利要求1所述的方法,其特征在于,所述基于所述事件属性对所述事件进行分级之后,所述方法还包括:根据所述事件的等级,从所述事件中确定待推送事件,并对所述待推送事件进行推送。7.根据权利要求1所述的方法,其特征在于,所述识别资讯流中的事件之后,所述方法还包括:对所述事件的文本进行句子切分;将经过切分的句子作为候选事件名;基于事件名特征,从所述候选事件名中确定目标事件名。8.一种事件分级装置,其特征在于,包括:事件识别模块,用于识别资讯流中的事件;属性提取模块,用于提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种...
【专利技术属性】
技术研发人员:雷伟俊,陈玉光,罗雨,潘禄,陈伟娜,韩翠云,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。