一种数据分析方法和数据分析平台以及服务器技术

技术编号：15329612 阅读：116 留言：0更新日期：2017-05-16 13:15

本申请提供一种数据分析方法和数据分析平台以及服务器，该数据分析平台包括：数据源，与数据源连接的Elasticsearch索引模块以及与Elasticsearch索引模块连接的Spark SQL处理模块和与Spark SQL处理模块连接的数据呈现模块，其中，数据源，用于提供数据；Elasticsearch索引模块，用于通过数据搜索接口从数据源获取搜索的数据，并对数据进行预处理，并将预处理后的数据发送至Spark SQL处理模块；Spark SQL处理模块，用于对预处理后的数据进行数据分析，并将数据分析后的数据发送至数据呈现模块；数据呈现模块，用于呈现数据分析后的数据。本申请能够解决现有数据分析平台在进行数据分析时实现较为复杂的问题。

Data analysis method and data analysis platform and server

The invention provides a method of data analysis and data analysis platform and server, the data analysis platform includes data source, Elasticsearch index module is connected with the data source and connected with the Elasticsearch module of the Spark index SQL processing module and data processing module is connected with the Spark SQL presentation module, which is used to provide data sources. Data; Elasticsearch index module, used to obtain the search data from the data source through the data search interface, and data preprocessing, and the pre processed data is sent to the Spark SQL Spark processing module; SQL module, used for data analysis to the pre processed data, and data analysis after the data is transmitted to the data presentation module; data presentation module for presenting data analysis data. This application can solve the complex problem of data analysis in the existing data analysis platform.

全部详细技术资料下载

【技术实现步骤摘要】
一种数据分析方法和数据分析平台以及服务器
本申请涉及数据处理领域，尤其涉及一种数据分析方法和数据分析平台以及服务器。
技术介绍
在海量数据处理中，数据的实时处理一直是业界聚焦的重点。数据的处理不仅仅在于数据的计算，更要考虑诸如数据存储能力、数据计算能力、水平扩展能力等多个方面。在大数据存储方面，如何存储海量数据是目前较为前言的一个问题。HDFS等分布式文件系统以及HBase分布式数据库等技术的发展，在一定程度上很好地解决了这个问题，但基于Hadoop生态环境的分布式存储在部署、管理上较为复杂，在数据计算方面，Hadoop生态环境提出了MapReduce等分布式计算框架，但其编程较为复杂，因此，可以看出，现有的数据分析平台在进行数据分析时，实现较为复杂。
技术实现思路
有鉴于此，本申请提供一种数据分析方法和数据分析平台以及服务器，能够解决现有数据分析平台在进行数据分析时实现较为复杂的问题。具体地，本申请是通过如下技术方案实现的：一方面，提供一种数据分析平台，包括：数据源，与所述数据源连接的Elasticsearch索引模块以及与所述Elasticsearch索引模块连接的SparkSQL处理模块和与所述SparkSQL处理模块连接的数据呈现模块，其中，所述数据源，用于提供数据；所述Elasticsearch索引模块，用于通过数据搜索接口从所述数据源获取搜索的数据，并对所述数据进行预处理，并将预处理后的数据发送至所述SparkSQL处理模块；所述SparkSQL处理模块，用于对所述预处理后的数据进行数据分析，并将数据分析后的数据发送至所述数据呈现模块；所述数据呈现...
一种数据分析方法和数据分析平台以及服务器

【技术保护点】
一种数据分析平台，其特征在于，包括：数据源，与所述数据源连接的Elasticsearch索引模块以及与所述Elasticsearch索引模块连接的Spark SQL处理模块和与所述Spark SQL处理模块连接的数据呈现模块，其中，所述数据源，用于提供数据；所述Elasticsearch索引模块，用于通过数据搜索接口从所述数据源获取搜索的数据，并对所述数据进行预处理，并将预处理后的数据发送至所述Spark SQL处理模块；所述Spark SQL处理模块，用于对所述预处理后的数据进行数据分析，并将数据分析后的数据发送至所述数据呈现模块；所述数据呈现模块，用于呈现所述数据分析后的数据。

【技术特征摘要】
1.一种数据分析平台，其特征在于，包括：数据源，与所述数据源连接的Elasticsearch索引模块以及与所述Elasticsearch索引模块连接的SparkSQL处理模块和与所述SparkSQL处理模块连接的数据呈现模块，其中，所述数据源，用于提供数据；所述Elasticsearch索引模块，用于通过数据搜索接口从所述数据源获取搜索的数据，并对所述数据进行预处理，并将预处理后的数据发送至所述SparkSQL处理模块；所述SparkSQL处理模块，用于对所述预处理后的数据进行数据分析，并将数据分析后的数据发送至所述数据呈现模块；所述数据呈现模块，用于呈现所述数据分析后的数据。2.根据权利要求1所述的数据分析平台，其特征在于，所述Elasticsearch索引模块与所述SparkSQL处理模块通过JSON结构进行数据交互。3.根据权利要求1或2所述的数据分析平台，其特征在于，所述Elasticsearch索引模块，用于生成倒排索引、进行中文分词、完成自动分布式存储和备份。4.一种数据分析方法，其特征在于，应用于数据分析平台，所述数据分析平台包括数据源，与所述数据源连接的Elasticsearch索引模块以及与所述Elasticsearch索引模块连接的SparkSQL处理模块和与所述...

【专利技术属性】
技术研发人员：柳廷娜，王茂帅，高峰，甄教明，王明君，
申请(专利权)人：浪潮软件股份有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人