本发明专利技术适用于云计算领域,提供了一种基于云计算的数据获取方法及系统,所述方法包括:根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次序中的词语;当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据。本发明专利技术相对于现有技术来说更智能,更能满足用户需求。
【技术实现步骤摘要】
一种基于云计算的数据获取方法及系统
本专利技术属于云计算领域,尤其涉及一种基于云计算的数据获取方法及系统。
技术介绍
云计算需要对大量数据(包括网页、文档、音频、视频、图片等)进行存储、分析和处理,数据是云计算的前提和基础,随着云计算的发展,数据也显得越来越重要,因此数据的获取技术成为一个很重要的课题。云计算中所需的数据通常需要由云服务器从终端或互联网上获取,但是现有技术中的数据获取方法还不够智能,通常都只是笼统地把相应路径下的所有数据都进行获取。例如把终端中相应目录下的所有数据,或者把跟云服务器互联的所有网页上的数据都进行获取,但这些数据的量通常十分庞大,尤其是互联网上的数据更是海量,这些数据可能绝大部分都不是用户所需要的数据,不能满足用户的需求。
技术实现思路
本专利技术实施例的目的在于提供一种基于云计算的数据获取方法,旨在解决现有技术云计算的数据获取方法不够智能、不能满足用户需求的问题。本专利技术实施例是这样实现的,一种基于云计算的数据获取方法,所述方法包括:根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次序中的词语;当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据。本专利技术实施例的另一目的在于提供一种基于云计算的数据获取系统,所述系统包括:向量分析模型建立模块,用于根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;排序模块,用于按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次中的词语;获取模块,用于当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据。在本专利技术中,由于采用了向量分析模型,并按词语出现的次数进行排序,云服务器根据排序结果对数据进行再获取,由于再获取时只获取排序在前面预设次序中的词语相应的数据,这些数据通常也是用户最想要的数据,因此本专利技术相对于现有技术来说更智能,更能满足用户需求。附图说明图1是本专利技术实施例提供的云服务器从互联网和终端上获取数据的示意图。图2是本专利技术实施例一提供的基于云计算的数据获取方法的流程图。图3是本专利技术实施例一提供的基于云计算的数据获取方法中步骤S103以后的流程图。图4是本专利技术实施例一提供的基于云计算的数据获取方法中n叉树的存储结构示意图。图5是本专利技术实施例二提供的基于云计算的数据获取系统的功能模块框图。具体实施方式为了使本专利技术的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。本专利技术实施例提供的云服务器从互联网和终端上获取数据的示意图如图1所示。云服务器的数据获取系统从互联网和终端上获取所需的数据,对获取到的数据进行智能处理,将处理完成后的数据同步至云服务器的数据库中,以满足云计算需要大量数据进行存储、分析和处理的需求。本专利技术实施例主要是对云服务器的数据获取系统的数据获取方法进行改进。实施例一:请参阅图2,本专利技术实施例一提供的基于云计算的数据获取方法包括以下步骤:S101、根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数。在本专利技术实施例一中,终端包括智能电视、智能移动终端、其他智能家电等智能终端。在本专利技术实施例一中,数据包括网页、文档、音频、视频、图片等。在本专利技术实施例一中,对于视频、音频和图片,数据中的词语是指文件名称中包含的词语;在本专利技术实施例一中,所述预先从终端和/或互联网中获取并存储在云服务器中的数据具体为:预先在预设的时间段内(例如三天内,该时间根据获取的数据量来决定,只要获取的数据量达到预定的数量时即可)从与云服务器互联的所有终端和/或互联网中获取并存储在云服务器中的数据。在本专利技术实施例一中,步骤S101具体包括以下步骤:对预先从终端和/或互联网中获取并存储在云服务器中的数据中包含的每个词语生成一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;将所有映射对存于向量当中,生成向量分析模型。S102、按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次序中的词语;例如,在预先从终端和/或互联网中获取并存储在云服务器中的所有数据中,共有四个词语:张三、李四、王五和郑六,其中,张三出现的次数是51次,李四出现的次数是60次,王五出现的次数是1次,郑六出现的次数是2次,假设希望得到的是排在前2位的词语,即得到词语张三和李四;S103、当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据。例如,步骤S102得到词语张三和李四,则步骤S103中,再次从终端和/或互联网获取数据时,仅从终端和/或互联网中获取包含词语张三或李四的数据。在本专利技术实施例一中,所述从终端和/或互联网获取相应的数据具体为:通过爬虫(Spider)获取互联网上与云服务器互联的服务器的数据和终端的除图片之外的数据,通过终端的DDMS(DalvikDebugMonitorService,Android开发环境中的Dalvik虚拟机调试监控服务)获取终端的图片数据。在本专利技术实施例一中,所述DDMS是通过以下方式实现的:通过调用终端的DDMS接口,在Android终端中开发与DDMS对应的Android安装包,并封装为APK(AndroidPackage,安卓安装包)形式,集成到Android终端系统中。在本专利技术实施例一中,由于采用了向量分析模型,并按词语出现的次数进行排序,云服务器根据排序结果对数据进行再获取,由于再获取时只获取排序在前面预设次序中的词语相应的数据,这些数据通常也是用户最想要的数据,因此本专利技术相对于现有技术来说更智能,更能满足用户需求。请参阅图3,在本专利技术实施例一中,步骤S103以后,所述方法还可以包括以下步骤:S104、统计所述排序在前面预设次序中的词语分别在再次从终端和/或互联网获取的每个数据中出现的次数;S105、根据每个词语在不同的数据中出现的次数来确定不同的数据之间的匹配度;S106、按照匹配度的值进行排序,将所述步骤S103中再次从终端和/或互联网获取的数据按序显示给用户,以获取用户的反馈。例如,如果一个词语在两个数据(例如两个网页)中出现的次数相同,则得分10,如果次数差5-10,则减1分,即得9分,如果没有出现,则该项得0分。在本专利技术实施例一中,步骤S106以后,所述方法还可以包括以下步骤:S107、接收用户的反馈,建立本文档来自技高网...
【技术保护点】
一种基于云计算的数据获取方法,其特征在于,所述方法包括:根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次中的词语;当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据。
【技术特征摘要】
1.一种基于云计算的数据获取方法,其特征在于,所述方法包括:根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型,其中向量分析模型中的向量是由多个分量组成,每个分量为一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;按每个词语在所有数据中一共出现的次数由高至低进行排序,得到排序在前面预设次序中的词语;当再次从终端和/或互联网获取数据时,根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据;统计所述排序在前面预设次序中的词语分别在再次从终端和/或互联网获取的每个数据中出现的次数;根据每个词语在不同的数据中出现的次数来确定不同的数据之间的匹配度;按照匹配度的值进行排序,将获取的数据按序显示给用户,以获取用户的反馈;接收用户的反馈,建立用户反馈行为表;根据用户反馈行为表建立用户行为链接关系表;通过用户行为链接关系表来建立向量之间的映射关系,以向量之间的映射关系作为查询模型,通过所述查询模型来不断查询用户感兴趣的内容,最终以包含映射关系的向量分析模型为获取数据的最终模型。2.如权利要求1所述的方法,其特征在于,所述根据预先从终端和/或互联网中获取并存储在云服务器中的数据建立向量分析模型具体包括:对预先从终端和/或互联网中获取并存储在云服务器中的数据中包含的每个词语生成一个映射对,每个映射对包含一个词语及该词语在所有数据中一共出现的次数;将所有映射对存于向量当中,生成向量分析模型。3.如权利要求1所述的方法,其特征在于,所述从终端和/或互联网获取相应的数据具体为:通过爬虫Spider获取互联网上与云服务器互联的服务器的数据和终端的除图片之外的数据,通过终端的Dalvik虚拟机调试监控服务DDMS获取终端的图片数据。4.如权利要求1所述的方法,其特征在于,所述方法还包括:对于根据向量分析模型中排序在前面预设次序中的词语对应的分量从终端和/或互联网获取相应的数据采用n叉树的存储结构进行存储。5.如权利要求1所述的方法,其特征在于,所述方法还包括:将所述再次从终端和/或互联网获取的所有数据分成多个数据包,每一个数据包包含预定数据的数据,每个数据包内的数据采用一个n叉树的存储结构进行存储,对于多个数据包,采用一个中央服务器作为并发查询,供查阅每个数据包下的数据,利用云计算的映射合并功能分发合并查询结果。6.一种基于云计算的数据获取系统,其特征在于,所述系统包括:向量分析模型建立...
【专利技术属性】
技术研发人员:温陇德,刘涛,柳行刚,
申请(专利权)人:TCL集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。