本发明专利技术涉及一种应用于电子商务的数据分析方法及系统,其方法包括:获取待分析处理数据,对待分析处理数据进行抽样处理;将抽样处理后的待分析处理数据存储于数据库中;根据用户策略为待分析处理数据选择对应的预置数学模型;根据对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;将计算分析处理结果进行商务智能展示。本发明专利技术应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌入式计算分析处理,并采用嵌入式技术将计算中心固化成高速计算的专用芯片,不需进行数据库的全库统计,降低计算资源成本,同时大大缩短数据从分析到应用的周期。
【技术实现步骤摘要】
本专利技术涉及电子商务
,尤其涉及一种应用于电子商务的数据分析方法及 系统。
技术介绍
目前,在互联网产业高速发展的大环境下,行业间以及行业内的竞争日益激烈,互 联网企业运营中的数据以爆炸的速度产生,其中信息的含金量越来越影响到企业的生存, 而依靠传统数据库或者数据仓库软件来对数据进行常规分析的成本越来越昂贵,同时其实 时性也无法得到保障,在现代社会,过时的信息不但不能给企业带来利益,反而可能会误导 决策给企业造成危害。现有技术中,基于Web的数据挖掘是指使用数据挖掘技术在Web数据中发现潜在 的、有用的模式或信息。关于Web数据挖掘的应用包括三个主要方向一、面向商业智能的网站日志挖掘随着Internet的迅速发展,越来越多的企业 和个人在Internet上建立了网站,通过其网站实现关键任务的Internet应用来获得战略 性优势。Web站点服务器每天产生大量的日志,其中蕴涵了用户在网站上的行为,分析这些 数据可以找出用户的访问模式,确定产品的市场战略,提高商业活动的效率。二、面向复杂系统研究的Web结构挖掘基于Web结构的数据挖掘是对Web页面超 链关系、文档内部结构、文档URL中的目录路径结构等的挖掘。对于基于Web结构的数据挖 掘而言,一个重要的问题是获得有关不同网页间相似度及关联度的信息有助于用户找到相 关主题的权威站点。三、面向社会信息分析的网页内容挖掘Web内容挖掘的对象包括文本、图象、音 频、视频、多媒体和其他各种类型的数据。现有技术中常见的数据挖掘方案包括使用已有的大型数据库或者数据仓库管理 软件(如0racle/DB2)充当存储管理资源,采用通用的PC SERVER或者小型机充当计算资 源,通过已有的数据ETL(数据提取清洗加载)工具进行流程控制,最终得到分析结果。然而,现有技术存在以下缺点对于互联网而言,数据的非结构化和无序性非常严 重,在海量数据的情况下,分析得到有用信息的成本过于昂贵,且实时性无法得到保障。
技术实现思路
本专利技术的主要目的在于提供一种应用于电子商务的数据分析方法及系统,旨在降 低数据计算资源成本并缩短数据从分析到应用的周期。本专利技术提出一种应用于电子商务的数据分析方法,包括获取待分析处理数据,对所述待分析处理数据进行抽样处理;将抽样处理后的所述待分析处理数据存储于数据库中;根据用户策略为所述待分析处理数据选择对应的预置数学模型;根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;将所述计算分析处理结果进行商务智能展示。优选地,所述待分析处理数据包括站点访问数据、站内营销行为数据、站外市场 分析数据、Web页面超级链接关系数据和/或SNS数据。优选地,所述对待分析处理数据进行抽样处理具体包括将分布的、异构数据源中 的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。优选地,所述计算分析处理具体为嵌入式计算分析处理。优选地,所述将抽样处理后的所述待分析处理数据存储于数据库中的步骤之前还 包括对抽样处理后的待分析处理数据进行缓存。优选地,所述获取待分析处理数据的步骤之前还包括根据业务规则和数据结构建立相应的预置数学模型。本专利技术还提出一种应用于电子商务的数据分析系统,包括ETL控制器,用于获取待分析处理数据,对所述待分析处理数据进行抽样处理;数据库服务器,用于将抽样处理后的所述待分析处理数据存储于数据库中;数学模型控制中心,用于根据用户策略为所述待分析处理数据选择对应的预置数 学模型;计算中心,用于根据所述对应的预置数学模型对所述待分析处理数据进行计算分 析处理,得到计算分析处理结果;商务智能展示中心,用于将所述计算分析处理结果进行商务智能展示;作业控制器,用于控制上述各功能服务器或中心工作以完成相应的数据流向与作 业流程。优选地,所述ETL控制器,还用于将分布的、异构数据源中的待分析处理数据抽取 到临时中间层后进行清洗、转换、集成和加载。优选地,所述系统还包括分布式缓存服务器,连接在所述ETL控制器与数据库服 务器之间,用于对抽样处理后的待分析处理数据进行缓存。优选地,所述系统还包括创建模块,与所述ETL控制器连接,用于根据业务规则和 数据结构建立相应的预置数学模型。本专利技术提出一种应用于电子商务的数据分析方法及系统,针对电子商务的 CRM (Customer Relationship Management,客户关系管理)领域,分析出通用的客户行为模 型,具体通过提取站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接 关系数据和/或SNS数据等待分析处理数据,应用现代数据挖掘的成熟算法,对待分析处 理数据进行嵌入式计算分析处理,并采用嵌入式技术将计算中心固化成高速计算的专用芯 片,不需进行数据库的全库统计,降低计算资源成本,同时大大缩短数据从分析到应用的周 期。附图说明图1是本专利技术应用于电子商务的数据分析系统一实施例结构示意图;图2是本专利技术应用于电子商务的数据分析系统另一实施例结构示意图;图3是本专利技术应用于电子商务的数据分析方法一实施例流程示意图4是本专利技术应用于电子商务的数据分析方法另一实施例流程示意图。为了使本专利技术的技术方案更加清楚、明了,下面将结合附图作进一步详述。具体实施例方式本专利技术实施例解决方案主要是对获取的站点访问数据、站内营销行为数据、站外 市场分析数据、Web页面超级链接关系数据和/或SNS(SocialNetworking Services,社交 网络服务)等待分析处理数据,应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌 入式计算分析处理,并根据嵌入式分析处理结果进行商务智能展示。如图1所示,本专利技术一实施例提出一种应用于电子商务的数据分析系统,包括ET L(Extraction-Transformation-Loading,数据提取、转换和加载)控制器101、数据库服务 器102、数学模型控制中心103、计算中心104、商务智能展示中心105以及作业控制器106, 其中ETL控制器101,用于获取待分析处理数据,对待分析处理数据进行抽样处理;在本实施例中,ETL控制器101对待分析处理数据进行抽样处理可以具体为将分 布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成,最后加 载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。本实施例待分析处理数据包括站点访问数据、站内营销行为数据、站外市场分析 数据、Web页面超级链接关系数据和/或SNS数据等。其中站点访问数据,是指当客户访问站点时会在Web服务器上留下相应的日志数据, 这些日志数据通常以文本文件的形式存储在服务器上。一般包括SeVerl0gS、err0r logs、 cookie logs等。*. log文件是日志文件,里面主要记录了系统、硬件、软件等的使用记录。 日志数据是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜 索一些产品或某些广告信息,这些搜索查询信息就通过cookie或是登记信息连接到服务 器的访问日志上。站内营销行为数据,主要是传统关系数据库里存储的本站站点客户资料、客户消 费情况、商品信息等数据。站外市场分析数据,主要是指关联企业的公开信息管理,例如可能本文档来自技高网...
【技术保护点】
一种应用于电子商务的数据分析方法,其特征在于,包括:获取待分析处理数据,对所述待分析处理数据进行抽样处理;将抽样处理后的所述待分析处理数据存储于数据库中;根据用户策略为所述待分析处理数据选择对应的预置数学模型;根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;将所述计算分析处理结果进行商务智能展示。
【技术特征摘要】
【专利技术属性】
技术研发人员:张津铭,
申请(专利权)人:深圳市她秀时尚电子商务有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。