一种微博数据处理方法及系统技术方案

技术编号:10468081 阅读:98 留言:0更新日期:2014-09-24 19:30
本发明专利技术适用于计算机技术领域,提供了一种微博数据处理方法及系统,所述方法包括:抓取预设微博平台的微博数据;对所述微博数据进行过滤及分类;分类存储过滤后的微博数据;根据查询指令查询分类存储后的微博数据;根据处理指令对所述查询到的微博数据进行处理。本发明专利技术实现了系统自动搜索、分类和处理微博数据,节省了大量的人力资源,大幅提升了工作效率。

【技术实现步骤摘要】
一种微博数据处理方法及系统
本专利技术属于计算机
,尤其涉及一种微博数据处理方法及系统。
技术介绍
微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及 获取平台,用户可以通过WEB、(Wireless Application Protocol, WAP)以及各种客户端组 建个人社区,以140字左右的文字更新信息,并实现即时分享。 微博以短小精湛的特点,不浪费阅读者的时间,让快节奏的人们能够看进去你的 文章,通过微博,可以宣传自己,也可以写上自己某一时刻的心情、遭遇等,微博里有很多有 趣的人和事,可以方便关注时事、民生、娱乐、学习、生活、潮流等各方面的事情,微博已经成 为个人通往世界各个方面的一个平台,通过简短而内容充实的文字等表达个人的境遇、情 感、兴趣、见闻、思想、态度等。然而,在众多的微博信息中,难免有一些负面的信息,例如,对 产品的批评、投诉、恶意评价等信息,这些信息可能对人们产生误导,产生负面影响,因此, 需要及时对微博中的这些信息进行处理,现有技术处理方法是由操作人员手工根据关键字 去微博搜索相关的微博信息,并逐条筛选,从而采取相应的措施。 综上,现有技术对微博数据中的负面信息,需要操作人员手工根据关键字去微博 搜索相关的微博信息,并逐条筛选,操作麻烦、且浪费了大量人力资源。
技术实现思路
本专利技术实施例的目的在于提供一种微博数据处理方法,旨在解决现有技术对微博 数据中的负面信息,需要操作人员手工根据关键字去微博搜索相关的微博信息,并逐条筛 选,操作麻烦、且浪费了大量人力资源的问题。 为了实现上述目的,本专利技术实施例提供如下技术方案: 本专利技术实施例是这样实现的,一种微博数据处理方法,所述方法包括: 抓取预设微博平台的微博数据; 对所述微博数据进行过滤及分类; 分类存储过滤后的微博数据; 根据查询指令查询分类存储后的微博数据; 根据处理指令对所述查询到的微博数据进行处理。 本专利技术实施例还提供了一种微博数据处理系统,所述系统包括: 数据抓取单元,用于抓取预设微博平台的微博数据; 数据过滤单元,用于对所述微博数据进行过滤及分类; 数据存储单元,用于分类存储过滤后的微博数据; 数据查询单元,用于根据查询指令查询分类存储后的微博数据; 数据处理单元,还用于根据处理指令对所述查询到的微博数据进行处理。 本专利技术实施例与现有技术相比,有益效果在于:抓取预设微博平台的微博数据,对 所述微博数据进行过滤及分类,分类存储过滤后的微博数据,根据查询指令查询分类存储 后的微博数据,根据处理指令对所述查询到的微博数据进行处理。实现了系统自动搜索、分 类和处理微博数据,节省了大量的人力资源,大幅提升了工作效率。 【附图说明】 为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的 附图。 图1是本专利技术实施例一提供的微博数据处理方法的实现的流程图; 图2是本专利技术实施例二提供的微博数据处理方法的实现的流程图; 图3是本专利技术实施例二提供的微博数据查询界面的示意图; 图4是本专利技术实施例二提供的微博数据显示界面的示意图; 图5是本专利技术实施例二提供的微博数据处理界面的示意图; 图6是本专利技术实施例三提供的微博数据处理系统的结构图; 图7是本专利技术实施例四提供的微博数据处理系统的结构图。 【具体实施方式】 为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并 不用于限定本专利技术。 本实施例中,抓取预设微博平台的微博数据,对所述微博数据进行过滤及分类,分 类存储过滤后的微博数据,根据查询指令查询分类存储后的微博数据,根据处理指令对所 述查询到的微博数据进行处理,实现自动的对微博数据进行处理。 以下结合具体实施例进行详细描述: 实施例一 图1示出了本专利技术实施例一提供的微博数据处理方法的实现的流程图,详述如 下: 在S101中,抓取预设微博平台的微博数据; 本实施例中,可以按照预设时间不间断地定时抓取预设微博平台的微博数据,从 而保证及时的获取更新的微博数据,可选的,通过微博爬虫,抓取预设微博平台的微博数 据,当预设抓取数据的微博平台没有开放接口时,通过微博爬虫,可以有效的对该平台的数 据进行抓取。 本实施例中,所述微博平台可以为新浪微博平台、腾讯微博平台等。 在S102中,对所述微博数据进行过滤及分类; 本实施例中,对所述微博数据进行分类并过滤,获取需要的微博数据。 在S103中,分类存储过滤后的微博数据; 本实施例中,按照分类的结果对分类后的微博数据进行存储,具体的存储方式可 以列表的方式进行存储,以方便对每一条微博数据进行查看或者处理。 在S104中,根据查询指令查询分类存储后的微博数据; 本实施例中,具体可以在接收到用户的查询指令时,根据查询指令查询分类存储 后的微博数据,优选的,在接收到查询指令时,还同时接收到查询参数,则根据所述查询指 令及查询参数,确定需要显示的微博数据,根据查询指令查询分类存储后的微博数据,其 中,所述查询参数可以包括:需要查询的业务类型,查询的时间,查询的类型等。 本实施例中,可以通过列表根据查询指令查询分类存储后的微博数据,为了使得 处理人员可以方便、快速的获取需要查看的微博数据,还可以同时显示每条微博数据的详 细信息,例如,发布微博用户的ID信息、链接地址信息等。 在S105中,根据处理指令对所述查询到的微博数据进行处理。 本实施例中,当接收到用户对所述微博数据中的某条微博数据进行处理的指令 时,显示该条微博数据的详细信息界面,以方便用户获取该条微博数据的详细信息并进行 相应的处理,当用户处理完该条微博数据时,接收用户输入的处理状态信息,并显示所述处 理状态信息,从而方便其他处理人员及时了解到该条微博数据的处理状态。 本专利技术实施例中,抓取预设微博平台的微博数据,对所述微博数据进行过滤及分 类,分类存储过滤后的微博数据,根据查询指令查询分类存储后的微博数据,根据处理指令 对所述查询到的微博数据进行处理。实现了系统自动搜索、分类和处理微博数据,节省了大 量的人力资源,大幅提升了工作效率。 实施例二 图2示出了本专利技术实施例二提供的微博数据处理方法的实现的流程图,详述如 下: 在S201中,向预设微博平台发送微博数据请求消息,所述请求消息包含预设业务 关键字,所述预设业务关键字为表示业务类型的字段; 本实施例中,所述业务关键字根据实际需要输入确定,例如,可以对微博数据中关 于易迅的微博数据进行处理,则业务关键字为易迅,进而,业务关键字还可以为拍 拍、QQ网购等。 在S202中,接收并解析所述预设微博平台根据所述请求消息返回的微博数据。 本实施例中,预设微博平台根据所本文档来自技高网...

【技术保护点】
一种微博数据处理方法,其特征在于,所述方法包括:抓取预设微博平台的微博数据;对所述微博数据进行过滤及分类;分类存储过滤后的微博数据;根据查询指令查询分类存储后的微博数据;根据处理指令对所述查询到的微博数据进行处理。

【技术特征摘要】
1. 一种微博数据处理方法,其特征在于,所述方法包括: 抓取预设微博平台的微博数据; 对所述微博数据进行过滤及分类; 分类存储过滤后的微博数据; 根据查询指令查询分类存储后的微博数据; 根据处理指令对所述查询到的微博数据进行处理。2. 如权利要求1所述的方法,其特征在于,所述根据查询指令查询分类存储后的微博 数据包括: 根据查询指令查询并显示查询到的分类存储后的微博数据; 所述根据处理指令对所述查询到的微博数据进行处理包括: 根据处理指令对所述查询到的微博数据进行处理,并显示对所述微博数据进行处理的 处理状态信息。3. 如权利要求1所述的方法,其特征在于,所述抓取预设微博平台的微博数据包括: 通过微博爬虫,抓取预设微博平台的微博数据。4. 如权利要求1所述的方法,其特征在于,所述抓取预设微博平台的微博数据包括: 向所述预设微博平台发送微博数据请求消息,所述请求消息包含预设业务关键字,所 述预设业务关键字为表示业务类型的字段; 接收并解析所述预设微博平台根据所述请求消息返回的微博数据。5. 如权利要求1所述的方法,其特征在于,所述对所述微博数据进行过滤及分类包括: 根据预设监控关键字列表,确定所述微博数据中每一条微博数据的权重值以及所属分 类,所述监控关键字列表包括多个监控关键字、每个监控关键字对应的权重值以及每个监 控关键字所属的类别,所述监控关键字为需要监控的字段; 判断每一条微博数据的权重值是否大于预设权重阈值,若大于,分类存储过滤后的微 博数据,若小于,则删除所述微博数据。6. 如权利要求5所述的方法,其特征在于,所述根据预设的监控关键字列表,确定所述 微博数据中每一条微博数据的权重值以及所属分类包括: 将每一条微博数据中监控关键字的权重值求和,得到每一条微博数据的权重值; 统计每一条微博数据中监控关键字的类别,将所述微博数据中最多监控关键字所属的 类别作为所述微博数据的分类。7. 如权利要求5所述的方法,其特征在于,所述根据预设监控关键字列表,确定所述微 博数据中每一条微博数据的权重值以及所属分类之后,所述方法还包括: 判断发布每一条微博数据的用户的ID是否在预设监控用户集合中,所述预设监控用 户集合包括待监控用户的ID信息,若是,则对所述微博数据的权重值进行调整,调整后判 断每一条微博数据的权重值是否大于预设权重阈值,若否,则判断每一条微博数据的权重 值是否大于预设权重阈值。8. 如权利要求1所述的方法,其特征在于,所述分类存储过滤后的微博数据包括: 根据发布每一条微博数据的用户ID及URL地址,判断数据库中是...

【专利技术属性】
技术研发人员:叶凯刘东升
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1