一种确定目标对象的方法和装置制造方法及图纸

技术编号:32454981 阅读:12 留言:0更新日期:2022-02-26 08:31
本发明专利技术实施例公开了一种确定目标对象的方法和装置,以及存储介质和电子设备,其中方法包括:获取当前舆情内容;确定与所述当前舆情内容相关联的当前对象;获取预设时间段内与所述当前对象相关联的舆情内容;基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列;确定所述待检测序列与预先生成的模板序列的匹配值,根据所述匹配值确定所述当前对象是否为目标对象。由此,本发明专利技术实施例通过生成能够适应更多的确定目标对象的场景的模板序列,提高了针对舆情内容识别目标对象的准确性,大大节省了用户筛选目标对象的时间,提高了用户决策的效率。了用户决策的效率。了用户决策的效率。

【技术实现步骤摘要】
一种确定目标对象的方法和装置


[0001]本专利技术涉及数据挖掘
,并且更具体地,涉及一种确定目标对象的方法和装置,以及存储介质和电子设备。

技术介绍

[0002]目前,每天都会有大量的新闻舆情产生,不同的舆情内容关联的对象也不相同,而且网络用户对不同舆情内容的关注程度也不相同。对于海量舆情内容涉及的对象,有些用户会希望从当前舆情内容中寻找到需要关注的对象,然后根据需要关注的对象在一定时间内的舆情内容,对所述需要关注的对象的状态进行检测,从而能够在需要关注的对象中挖掘出在一段时间内舆情内容的数量,或者受关注程度有显著变化的对象作为目标对象,并根据目标对象的信息快速地发现有关目标对象的重要动态,为及时做出决策提供重要依据。但由于舆情内容的数量庞大以及内容繁杂,导致有决策需求的用户无法从众多的数据内容中及时高效地挖掘出目标对象,因此无法满足用户后续针对目标对象的舆情内容挖掘和辅助决策的需求。

技术实现思路

[0003]本专利技术要解决的问题为从舆情内容中挖掘出目标对象,从而为有决策需求的用户推断目标对象当前的动态,及时做出决策提供参考。然而,由于舆情内容的数量庞大和内容繁杂,目前尚缺乏有效地识别目标对象的技术手段。
[0004]为了解决现有技术中对于有决策需求的用户无法对众多的舆情内容中及时高效地确定目标对象的技术问题,本专利技术的实施例提供一种确定目标对象的方法和装置,以及存储介质和电子设备。
[0005]根据本专利技术实施例的一个方面,提供了一种确定目标对象的方法,所述方法包括:
[0006]获取当前舆情内容;
[0007]确定与所述当前舆情内容相关联的当前对象;
[0008]获取预设时间段内与所述当前对象相关联的舆情内容;其中,所述与当前对象相关联的舆情内容包括所述当前对象的信息项;
[0009]基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列;
[0010]确定所述待检测序列与预先生成的模板序列的匹配值,根据所述匹配值确定所述当前对象是否为目标对象。
[0011]可选地,在本专利技术上述各方法实施例中,所述确定与所述当前舆情内容相关联的当前对象,包括:
[0012]采用预先建立的对象实体字典,将所述当前舆情内容与所述对象实体字典中的对象进行匹配,基于匹配结果确定与所述当前舆情内容相关联的当前对象。
[0013]可选地,在本专利技术上述各方法实施例中,其中基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列,包括:
[0014]确定所述预设时间段包括的多个时间单元;
[0015]确定各个所述当前对象的信息项的发布时间;
[0016]按照所述发布时间将各个所述当前对象的信息项划分到各自对应的时间单元内,并确定所述当前对象在每个时间单元内的信息项的数量;
[0017]按照时间顺序,基于所述当前对象在每个时间单元内的信息项的数量确定所述当前对象的待检测序列。
[0018]可选地,在本专利技术上述各方法实施例中,其中基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列包括:
[0019]确定所述预设时间段包括的多个时间单元;
[0020]确定各个所述当前对象的信息项的发布时间和数据来源,其中,不同的数据来源具有不同的权重;
[0021]按照所述发布时间将各个所述当前对象的信息项划分到各自对应的时间单元内;
[0022]对每个所述时间单元内的当前对象的信息项进行分组,并统计每个所述时间单元内每组当前对象的信息项的数量;
[0023]根据每个所述时间单元内每组当前对象的信息项的数量和信息项的数据来源的权重,确定所述当前对象在每个所述时间单元内的热值;
[0024]按照时间顺序,基于所述当前对象在每个所述时间单元内的热值确定所述当前对象的待检测序列。
[0025]可选地,在本专利技术上述各方法实施例中,所述根据所述匹配值确定所述当前对象是否为目标对象,包括:
[0026]当所述匹配值小于或等于匹配阈值时,确定所述当前对象为目标对象。可选地,在本专利技术上述各方法实施例中,所述确定所述待检测序列与预先生成的模板序列的匹配值,包括:
[0027]计算所述待检测序列与所述模板序列中各个元素之间的距离,生成距离矩阵(a
ij
)
n
×
n

[0028]确定从所述距离矩阵(a
ij
)
n
×
n
的元素a
11
至元素a
nn
的最佳路径,其中,所述最佳路径上的元素和最小,i,j,n为自然数,1≤i,j≤n;
[0029]将所述最佳路径上的元素和作为所述待检测序列与所述模板序列的匹配值。
[0030]可选地,在本专利技术上述各方法实施例中,在获取所述当前舆情内容之前,还包括:
[0031]获取热门话题,确定与所述热门话题相关联的历史对象;
[0032]获取预设时间段内与所述历史对象相关联的舆情内容,基于预设时间段内的舆情内容确定所述模板序列,其中,与所述历史对象相关联的舆情内容包括所述历史对象的信息项。
[0033]可选地,在本专利技术上述各方法实施例中,所述获取热门话题,确定与所述热门话题相关联的历史对象,包括:
[0034]采用预先建立的对象实体字典,将所述热门话题与所述对象实体字典中的对象进行匹配,基于匹配结果确定与所述热门话题相关联的历史对象。
[0035]可选地,在本专利技术上述各方法实施例中,所述基于预设时间段内的舆情内容确定所述模板序列包括:
[0036]确定所述预设时间段包括的多个时间单元;
[0037]确定各个所述历史对象的信息项的发布时间;
[0038]按照所述发布时间将各个所述历史对象的信息项划分到各自对应的时间单元内,并确定所述历史对象在每个所述时间单元内的信息项的数量;
[0039]按照时间顺序,基于所述历史对象在每个时间单元内的信息项的数量确定模板序列。
[0040]可选地,在本专利技术上述各方法实施例中,所述基于预设时间段内的舆情内容确定所述模板序列包括:
[0041]确定所述预设时间段包括的多个时间单元;
[0042]确定各个所述历史对象的信息项的发布时间和数据来源,其中,不同的数据来源具有不同的权重;
[0043]按照所述发布时间将各个所述历史对象的信息项划分到各自对应的时间单元内;
[0044]对每个所述时间单元内的历史对象的信息项进行分组,并统计每个所述时间单元内每组历史对象的信息项的数量;
[0045]根据每个所述时间单元内每组历史对象的信息项的数量和信息项的数据来源的权重,确定所述历史对象在每个时间单元内的热值;
[0046]按照时间顺序,基于所述历史对象在每个时间单元内的热值确定模板序列。
[0047]根据本专利技术实施例的另一个方面,本专利技术提供一种确定目标对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定目标对象的方法,其特征在于,所述方法包括:获取当前舆情内容;确定与所述当前舆情内容相关联的当前对象;获取预设时间段内与所述当前对象相关联的舆情内容;其中,与所述当前对象相关联的舆情内容包括所述当前对象的信息项;基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列;确定所述待检测序列与预先生成的模板序列的匹配值,根据所述匹配值确定所述当前对象是否为目标对象。2.根据权利要求1所述的方法,其特征在于,所述确定与所述当前舆情内容相关联的当前对象,包括:采用预先建立的对象实体字典,将所述当前舆情内容与所述对象实体字典中的对象进行匹配,基于匹配结果确定与所述当前舆情内容相关联的当前对象。3.根据权利要求1所述的方法,其特征在于,其中基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列,包括:确定所述预设时间段包括的多个时间单元;确定各个所述当前对象的信息项的发布时间;按照所述发布时间将各个所述当前对象的信息项划分到各自对应的时间单元内,并确定所述当前对象在每个时间单元内的信息项的数量;按照时间顺序,基于所述当前对象在每个时间单元内的信息项的数量确定所述当前对象的待检测序列。4.根据权利要求1所述的方法,其特征在于,其中基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列包括:确定所述预设时间段包括的多个时间单元;确定各个所述当前对象的信息项的发布时间和数据来源,其中,不同的数据来源具有不同的权重;按照所述发布时间将各个所述当前对象的信息项划分到各自对应的时间单元内;对每个所述时间单元内的当前对象的信息项进行分组,并统计每个所述时间单元内每组当前对象的信息项的数量;根据每个所述时间单元内每组当前对象的信息项的数量和信息项的数据来源的权重,确定所述当前对象在每个所述时间单元内的热值;按照时间顺序,基于所述当前对象在每个所述时间单元内的热值确定所述当前对象的待检测序列。5.根据权利要求1所述的方法,其特征在于,根据所述匹配值确定所述当前对象是否为目标对象,包括:当所述匹配值小于或等于匹配阈值时,确定所述当前对象为目标对象。6.根据权利要求1所述的方法,其特征在于,所述确定所述待检测序列与预先生成的模板序列的匹配值,包括:计算所述待检测序列与所述模板序列中各个元素之间的距离,生成距离矩阵(a
ij
)
n
×
n
;确定从所述距离矩阵(a
ij
)
n
×
n
的元素a
11
至元素a<...

【专利技术属性】
技术研发人员:李凯周晗
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1