一种数据分类方法及系统技术方案

技术编号:14774638 阅读:64 留言:0更新日期:2017-03-09 12:08
本发明专利技术公开了一种数据分类方法及系统,所述方法包括:在项目数据中增加关键字列;将数据分类标志写入所述关键字列;根据所述关键字列的内容分类所述项目数据。本发明专利技术实施例的方案,能够通过在项目数据中增加关键字列,通过关键字列写入分类标志,当获取关键字列后,即可根据其中的分类标志对数据进行分类,方案简单,可操作性强,同时可以保证分类效果,极大的提高了用户体验度。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别涉及一种数据分类方法及系统
技术介绍
随着互联网的发展,越来越多的数据累计起来。对于一个运营中的用户平台,会出现海量的数据需要处理和分析。这就需要数据的导入导出以及备份等工作。通常的数据导出是在数据库层面进行的。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。数据分类就是将不同的项目数据根据一定的标准分为多个数据类别,这个分类的依据可以是多样的,可以根据需要将不同的数据区别开来,以便后续的数据统计等操作。目前存在多种数据分类方案,可以根据数据类型、数据来源、数据大小等等,不同的应用场景应用不同的数据分类,不同的分类标准又会带来不同的分类方式和结果。各种数据分类各自有各自的应用环境的目的,分类方法也各不相同。现有技术中,各种数据分类方案均可以解决数据分类的问题,但是,效果不一而足。同时,针对具体应用环境而产生的数据分类机制目前均有不完善之处。尤其是对于用户项目数据的分类问题,目前的方案多过于繁琐,操作复杂,不利于应用。尚没有一种可以有效解决数据分类问题,同时又能够提高效率,操作简便的方案。
技术实现思路
本专利技术提供一种数据分类方法及系统,用以解决现有技术中数据分类方案过于复杂不易操作的问题。本专利技术提供一种数据分类方法,包括:在项目数据中增加关键字列;将数据分类标志写入所述关键字列;根据所述关键字列的内容分类所述项目数据。所述方法还包括:所述项目数据中增加多个关键字列,每个关键字列写入一种或多种分类标志。所述方法还包括:所述关键字列中没有分类标志时,将所述项目数据单独分为一类。所述方法还包括:所述关键字列中分类标志为第一次出现时,建立新的分类项目分类所述项目数据。所述方法还包括:根据所述分类后的项目数据进行分类统计。所述方法还包括:预设分类标志,根据所述分类标志设定统计分类。一种数据分类系统,包括:关键字列设定单元,用于在项目数据中增加关键字列;分类标志写入单元,用于将数据分类标志写入所述关键字列;项目数据分类单元,用于根据所述关键字列的内容分类所述项目数据。所述项目数据分类单元还用于在所述关键字列中没有分类标志时,将所述项目数据单独分为一类。所述项目数据分类单元还用于在所述关键字列中分类标志为第一次出现时,建立新的分类项目分类所述项目数据。所述关键字列设定单元还用于在所述项目数据中增加多个关键字列;所述分类标志写入单元还用于在每个关键字列写入一种或多种分类标志。本专利技术实施例中,通过在项目数据中增加关键字列;将数据分类标志写入所述关键字列;根据所述关键字列的内容分类所述项目数据。本专利技术实施例的方案,能够通过在项目数据中增加关键字列,通过关键字列写入分类标志,当获取关键字列后,即可根据其中的分类标志对数据进行分类,方案简单,可操作性强,同时可以保证分类效果,极大的提高了用户体验度。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例1提供的一种数据分类方法原理流程图;图2为本专利技术实施例2提供的一种数据分类系统结构示意图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。如图1所示,为本专利技术实施例1提供的一种数据分类方法原理流程图,其中,步骤11,在项目数据中增加关键字列。项目数据即为一般的数据库表单中的数据,可以是项目产生的数据,也可以是用户项目数据等。项目数据在数据库中以表单形式存储,每个项目数据为一行,其中每列均有实际的内容,因而可以在数据中加入一列用以标示专门的内容。本实施例中,在项目数据中增加关键字列,用以标示数据分类的关键字。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。数据库指的是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度的特点、是与应用程序彼此独立的数据集合。在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。有了这个\数据仓库\我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种\数据库\,使其可以利用计算机实现财务、仓库、生产的自动化管理。数据库的基本结构分三个层次,反映了观察数据库的三种本文档来自技高网
...
一种数据分类方法及系统

【技术保护点】
一种数据分类方法,其特征在于,包括:在项目数据中增加关键字列;将数据分类标志写入所述关键字列;根据所述关键字列的内容分类所述项目数据。

【技术特征摘要】
1.一种数据分类方法,其特征在于,包括:在项目数据中增加关键字列;将数据分类标志写入所述关键字列;根据所述关键字列的内容分类所述项目数据。2.如权利要求1所述的方法,其特征在于,所述方法还包括:所述项目数据中增加多个关键字列,每个关键字列写入一种或多种分类标志。3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:所述关键字列中没有分类标志时,将所述项目数据单独分为一类。4.如权利要求3所述的方法,其特征在于,所述方法还包括:所述关键字列中分类标志为第一次出现时,建立新的分类项目分类所述项目数据。5.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述分类后的项目数据进行分类统计。6.如权利要求5所述的方法,其特征在于,所述方法还包括:预设分类标...

【专利技术属性】
技术研发人员:田长连
申请(专利权)人:天脉聚源北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1