【技术实现步骤摘要】
一种微博数据处理方法及系统
本专利技术属于计算机
,尤其涉及一种微博数据处理方法及系统。
技术介绍
微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及 获取平台,用户可以通过WEB、(Wireless Application Protocol, WAP)以及各种客户端组 建个人社区,以140字左右的文字更新信息,并实现即时分享。 微博以短小精湛的特点,不浪费阅读者的时间,让快节奏的人们能够看进去你的 文章,通过微博,可以宣传自己,也可以写上自己某一时刻的心情、遭遇等,微博里有很多有 趣的人和事,可以方便关注时事、民生、娱乐、学习、生活、潮流等各方面的事情,微博已经成 为个人通往世界各个方面的一个平台,通过简短而内容充实的文字等表达个人的境遇、情 感、兴趣、见闻、思想、态度等。然而,在众多的微博信息中,难免有一些负面的信息,例如,对 产品的批评、投诉、恶意评价等信息,这些信息可能对人们产生误导,产生负面影响,因此, 需要及时对微博中的这些信息进行处理,现有技术处理方法是由操作人员手工根据关键字 去微博搜索相关的微博信息,并逐条筛选,从而采取相应的措施。 综上,现有技术对微博数据中的负面信息,需要操作人员手工根据关键字去微博 搜索相关的微博信息,并逐条筛选,操作麻烦、且浪费了大量人力资源。
技术实现思路
本专利技术实施例的目的在于提供一种微博数据处理方法,旨在解决现有技术对微博 数据中的负面信息,需要操作人员手工根据关键字去微博搜索相关的微博信息,并逐条筛 选,操作麻烦、且 ...
【技术保护点】
一种微博数据处理方法,其特征在于,所述方法包括:抓取预设微博平台的微博数据;对所述微博数据进行过滤及分类;分类存储过滤后的微博数据;根据查询指令查询分类存储后的微博数据;根据处理指令对所述查询到的微博数据进行处理。
【技术特征摘要】
1. 一种微博数据处理方法,其特征在于,所述方法包括: 抓取预设微博平台的微博数据; 对所述微博数据进行过滤及分类; 分类存储过滤后的微博数据; 根据查询指令查询分类存储后的微博数据; 根据处理指令对所述查询到的微博数据进行处理。2. 如权利要求1所述的方法,其特征在于,所述根据查询指令查询分类存储后的微博 数据包括: 根据查询指令查询并显示查询到的分类存储后的微博数据; 所述根据处理指令对所述查询到的微博数据进行处理包括: 根据处理指令对所述查询到的微博数据进行处理,并显示对所述微博数据进行处理的 处理状态信息。3. 如权利要求1所述的方法,其特征在于,所述抓取预设微博平台的微博数据包括: 通过微博爬虫,抓取预设微博平台的微博数据。4. 如权利要求1所述的方法,其特征在于,所述抓取预设微博平台的微博数据包括: 向所述预设微博平台发送微博数据请求消息,所述请求消息包含预设业务关键字,所 述预设业务关键字为表示业务类型的字段; 接收并解析所述预设微博平台根据所述请求消息返回的微博数据。5. 如权利要求1所述的方法,其特征在于,所述对所述微博数据进行过滤及分类包括: 根据预设监控关键字列表,确定所述微博数据中每一条微博数据的权重值以及所属分 类,所述监控关键字列表包括多个监控关键字、每个监控关键字对应的权重值以及每个监 控关键字所属的类别,所述监控关键字为需要监控的字段; 判断每一条微博数据的权重值是否大于预设权重阈值,若大于,分类存储过滤后的微 博数据,若小于,则删除所述微博数据。6. 如权利要求5所述的方法,其特征在于,所述根据预设的监控关键字列表,确定所述 微博数据中每一条微博数据的权重值以及所属分类包括: 将每一条微博数据中监控关键字的权重值求和,得到每一条微博数据的权重值; 统计每一条微博数据中监控关键字的类别,将所述微博数据中最多监控关键字所属的 类别作为所述微博数据的分类。7. 如权利要求5所述的方法,其特征在于,所述根据预设监控关键字列表,确定所述微 博数据中每一条微博数据的权重值以及所属分类之后,所述方法还包括: 判断发布每一条微博数据的用户的ID是否在预设监控用户集合中,所述预设监控用 户集合包括待监控用户的ID信息,若是,则对所述微博数据的权重值进行调整,调整后判 断每一条微博数据的权重值是否大于预设权重阈值,若否,则判断每一条微博数据的权重 值是否大于预设权重阈值。8. 如权利要求1所述的方法,其特征在于,所述分类存储过滤后的微博数据包括: 根据发布每一条微博数据的用户ID及URL地址,判断数据库中是...
【专利技术属性】
技术研发人员:叶凯,刘东升,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。