网络数据处理方法及装置制造方法及图纸

技术编号:10994140 阅读:97 留言:0更新日期:2015-02-04 13:16
本发明专利技术公开了一种网络数据处理方法及装置,该网络数据处理方法包括:获取来自网络的图片;获取图片关联的文字;判断文字中是否包含预设关键词;以及如果判断出文字包含预设关键词,则关联图片与预设关键词。通过本发明专利技术,解决了网络数据分析准确率低的问题,进而达到了提高网络数据分析准确率的效果。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种网络数据处理方法及装置,该网络数据处理方法包括:获取来自网络的图片;获取图片关联的文字;判断文字中是否包含预设关键词;以及如果判断出文字包含预设关键词,则关联图片与预设关键词。通过本专利技术,解决了网络数据分析准确率低的问题,进而达到了提高网络数据分析准确率的效果。【专利说明】网络数据处理方法及装置
本专利技术涉及互联网领域,具体而言,涉及一种网络数据处理方法及装置。
技术介绍
现有的网络数据分析大多数是基于网络文本进行分析,以网络舆论情报分析为例,网络舆论情报分析基本都是通过抓取网络上的文本内容,再对文本内容进行情绪、内容、主题等多方面的分析。但是,随着各种社交媒体的发展,例如,微博、微信等,用户可以通过多种方式分享自己的想法,例如,语音、视频、图片等。因此,仅仅通过分析网络文本不能准确的分析出用户的想法。 针对相关技术中网络数据分析准确率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网络数据处理方法及装置,以解决相关技术中网络数据分析准确率低问题。 为了实现上述目的,根据本专利技术的一个方面,提供了一种网络数据处理方法。 根据本专利技术的网络数据处理方法包括:获取来自网络的图片;获取图片关联的文字;判断文字中是否包含预设关键词;以及如果判断出文字包含预设关键词,则关联图片与预设关键词。 进一步地,获取来自网络的图片包括:从第一预设数据库中获取图片,其中,在第一预设数据库中存储有预先从网络爬取的图片,获取图片关联的文字包括:从第一预设数据库中获取图片关联的文字,其中,在第一预设数据库中还存储有与图片关联的文字。 进一步地,预设关键词包括多个预设关键词,判断文字中是否包含预设关键词包括:遍历第二预设数据库,从第二预设数据库中依次取出多个预设关键词,其中,在第二预设数据库中存储有多个预设关键词;分别判断文字是否包含多个预设关键词;获取文字中所包含的预设关键词;以及将文字关联的图片与文字中所包含的预设关键词建立关联。 进一步地,在获取图片关联的文字之后,该方法还包括:确定图片关联的文字的特征属性;以及关联图片和特征属性。 进一步地,确定图片关联的文字的特征属性包括:遍历第三预设数据库,从第三预设数据库中依次取出多个预设特征关键词,其中,第三预设数据库种存储有多个预设特征关键词,预设特征关键词包括第一类特征关键词和第二类特征关键词;分别判断文字是否包含多个预设特征关键词;计算文字包含的第一类特征关键词的个数和文字包含的第二类特征关键词的个数;以及由第一类特征关键词的个数和第二类特征关键词的个数得到图片关联的文字的特征属性。 进一步地,在关联网络图片与预设关键词之后,该方法还包括:存储图片、图片与预设关键字的关联关系,以及图片和特征属性的关联关系。 为了实现上述目的,根据本专利技术的另一方面,提供了一种网络数据处理装置。 根据本专利技术的网络数据处理装置包括:第一获取单元,用于获取来自网络的图片;第二获取单元,用于获取图片关联的文字;判断单元,用于判断文字中是否包含预设关键词;以及第一关联单元,用于在判断出文字包含预设关键词时,关联图片与预设关键词。 进一步地,预设关键词包括多个预设关键词,判断单元包括:第一遍历模块,用于遍历第二预设数据库,从第二预设数据库中依次取出多个预设关键词,其中,在第二预设数据库中存储有多个预设关键词;第一判断模块,用于分别判断文字是否包含多个预设关键词;获取模块,用于获取文字中所包含的预设关键词;以及关联模块,用于将文字关联的图片与文字中所包含的预设关键词建立关联。 进一步地,该装置还包括:确定单元,用于确定图片关联的文字的特征属性;以及第二关联单元,用于关联图片和特征属性。 进一步地,确定单元包括:第二遍历模块,用于遍历第三预设数据库,从第三预设数据库中依次取出多个预设特征关键词,其中,第三预设数据库种存储有多个预设特征关键词,预设特征关键词包括第一类特征关键词和第二类特征关键词;第二判断模块,用于分别判断文字是否包含多个预设特征关键词;计算模块,用于计算文字包含的第一类特征关键词的个数和文字包含的第二类特征关键词的个数;以及确定模块,用于由第一类特征关键词的个数和第二类特征关键词的个数得到图片关联的文字的特征属性。 进一步地,该装置还包括:存储单元,用于存储图片、图片与预设关键字的关联关系,以及图片和特征属性的关联关系。 通过本专利技术,采用对图片和图片关联的文字进行分析,解决了网络数据分析准确率低的问题,进而达到了提高网络数据分析准确率的效果。 【专利附图】【附图说明】 构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1是根据本专利技术实施例的网络数据处理方法的流程图;以及 图2是根据本专利技术实施例的网络数据处理装置的示意图。 【具体实施方式】 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。 为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。 需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。 根据本专利技术实施例,提供了一种网络数据处理方法。图1是根据本专利技术实施例的网络数据处理方法的流程图。 如图1所示,该方法包括如下的步骤S102至步骤S108: 步骤S102:获取来自网络的图片。 来自网络的图片十分多样,例如,微博博文上的图片、微信公众文章中附带的图片、一些图片分享网站的图片等。获取的来自网络的图片可以是一张,也可以是多张。随着各种社交网站的发展,图片的分享变得越来越便捷,同时也越来越受到用户的喜爱。用户通过图片可以鲜明直观的表达自己的看法,例如,某用户在微博上发布了一张某个餐厅的图片,同时附上文字“这家餐厅的菜味道很美味哦”。因此,通过网络上的图片可以分析某个品牌、某个产品的口碑,或是某个活动的用户参与度等。 步骤S104:获取图片关联的文字。 图片关联的文字是指与图片同时发布的一段文字。用户在发布图片时,往往会同时附上一段简略的文字,如上述用户在微博上发布某个餐厅的图片同时附上文字“这家餐厅的菜味道很美味哦”,通过这段文字可以了解用户对这家餐厅的看法。这些文字与图片相关联,通常分布在图片的周围,例如,前后位置,左右本文档来自技高网
...

【技术保护点】
一种网络数据处理方法,其特征在于,包括:获取来自网络的图片;获取所述图片关联的文字;判断所述文字中是否包含预设关键词;以及如果判断出所述文字包含所述预设关键词,则关联所述图片与所述预设关键词。

【技术特征摘要】

【专利技术属性】
技术研发人员:祁国晟陈俊宏黄勇坚崔维福
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1