【技术实现步骤摘要】
一种舆情数据推送方法、装置、存储介质和终端设备
本专利技术涉及网络信息处理
,尤其涉及一种舆情数据推送方法、装置、计算机可读存储介质和终端设备。
技术介绍
随着互联网技术的飞速发展,网络已经成为反映社会舆情的主要载体之一,越来越多的用户通过互联网来表达观点、看法、态度、意见和情绪等等,为及时、准确了解民众的思想动态,掌握大众需求,舆情监测系统应运而生。舆情监测系统是指利用信息爬取技术和信息挖掘技术,获取网络上的舆情数据,并通过对舆情数据进行统计分析,来得到具体的舆情简报或者分析报告等,以方便人们全面掌握舆情动态,从而做出正确的舆情引导。而现有的舆情监测系统大多只能通过不定向的抓取舆情数据来形成对应的舆情简报或者分析报告,无法方便用户快速、全面地了解其所感兴趣或者所关注的舆情事件。
技术实现思路
本专利技术实施例提供了一种舆情数据推送方法、装置、计算机可读存储介质和终端设备,能够根据用户的行为数据自动进行舆情数据的推送,并能够确保舆情数据推送的准确性和有效性。本专利技术实施例的第一方面,提供了一种舆情数据推送方法,包括:获取指定用户的网络行为数据,并从所述网络行为数据中提取与所述指定用户相关的第一舆情数据;确定所述第一舆情数据对应的第一舆情类型;抓取与所述第一舆情类型相关的第二舆情数据,并确定所述第二舆情数据与所述第一舆情数据的第一舆情相似度;获取所述第二舆情数据中第一舆情相似度大于或者等于第一预设相似度阈值的第三舆情数据;确定所述第三舆情数据的第二舆情类型,并确定所述第二舆情类型与所述第一舆情类型的第二舆情相似度;将第二舆情相似度大于或者等于第二预设相似 ...
【技术保护点】
1.一种舆情数据推送方法,其特征在于,包括:获取指定用户的网络行为数据,并从所述网络行为数据中提取与所述指定用户相关的第一舆情数据;确定所述第一舆情数据对应的第一舆情类型;抓取与所述第一舆情类型相关的第二舆情数据,并确定所述第二舆情数据与所述第一舆情数据的第一舆情相似度;获取所述第二舆情数据中第一舆情相似度大于或者等于第一预设相似度阈值的第三舆情数据;确定所述第三舆情数据的第二舆情类型,并确定所述第二舆情类型与所述第一舆情类型的第二舆情相似度;将第二舆情相似度大于或者等于第二预设相似度阈值的第三舆情数据推送至所述指定用户。
【技术特征摘要】
1.一种舆情数据推送方法,其特征在于,包括:获取指定用户的网络行为数据,并从所述网络行为数据中提取与所述指定用户相关的第一舆情数据;确定所述第一舆情数据对应的第一舆情类型;抓取与所述第一舆情类型相关的第二舆情数据,并确定所述第二舆情数据与所述第一舆情数据的第一舆情相似度;获取所述第二舆情数据中第一舆情相似度大于或者等于第一预设相似度阈值的第三舆情数据;确定所述第三舆情数据的第二舆情类型,并确定所述第二舆情类型与所述第一舆情类型的第二舆情相似度;将第二舆情相似度大于或者等于第二预设相似度阈值的第三舆情数据推送至所述指定用户。2.根据权利要求1所述的舆情数据推送方法,其特征在于,所述确定所述第一舆情数据对应的第一舆情类型,包括:将所述第一舆情数据输入至预设概率主题模型中,得到所述第一舆情数据在各主题中的第一概率值,所述主题为舆情数据的舆情内容所表达的主旨;将第一概率值大于或者等于预设概率阈值的主题确定为所述第一舆情数据对应的第一舆情类型。3.根据权利要求2所述的舆情数据推送方法,其特征在于,所述确定所述第三舆情数据的第二舆情类型,并确定所述第二舆情类型与所述第一舆情类型的第二舆情相似度,包括:将所述第三舆情数据输入至所述预设概率主题模型中,得到所述第三舆情数据在各主题中的第二概率值;基于所述第二概率值确定所述第三舆情数据的第二舆情类型;根据所述第一舆情类型对应的第一概率值和所述第二舆情类型对应的第二概率值,确定所述第二舆情类型与所述第一舆情类型的第二舆情相似度。4.根据权利要求2所述的舆情数据推送方法,其特征在于,所述预设概率主题模型通过以下步骤训练得到:预先收集样本舆情数据,所述样本舆情数据为与各舆情事件相关的舆情数据,并统计各样本舆情数据中各词语所对应的主题;根据各词语所对应的主题预先标记各样本舆情数据在各主题中的标准概率值;将各样本舆情数据输入至初始的预设概率主题模型,得到各样本舆情数据在各主题中的训练概率值;计算所述训练概率值与所述标准概率值之间的概率误差;若所述概率误差不满足预设条件,则调整所述预设概率主题模型的模型参数,并将模型参数调整后的预设概率主题模型作为初始的预设概率主题模型,返回执行将各样本舆情数据输入至初始的预设概率主题模型,得到各样本舆情数据在各主题中的训练概率值的步骤以及后续步骤;直到所述概率误差满足预设条件时,确定所述预设概率主题模型训练完成。5.根据权利要求1至4中任一项所述的舆情数据推送方法,其特征在于,所述确定所述第二舆情数据与所述第一舆情数据的第一舆情相似度,包括:获取所述第二舆情数据的第二关键词和获取所述第一舆情数据的第一关键词;根据所述第一关键词和所述第二关键词,确定所述第二舆情数据与所述第一舆情数据的第一舆情相似...
【专利技术属性】
技术研发人员:吴壮伟,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。