一种数据分析方法及装置制造方法及图纸

技术编号:18527030 阅读:48 留言:0更新日期:2018-07-25 13:12
本发明专利技术实施例公开了一种数据分析方法及装置,方法包括:采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,目标渠道为用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对用户数据、内容数据和渠道数据进行分析,确定用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定目标平台在线人数变化的原因数据集合。利用本发明专利技术实施例,确定了平台在线人数变化的原因。

【技术实现步骤摘要】
一种数据分析方法及装置
本专利技术涉及运维
,特别涉及一种数据分析方法及装置。
技术介绍
在当今信息时代,各种互联网应用层出不穷,人们的娱乐生活方式也开始变得越来越丰富,例如,人们可以使用手机或电脑在游戏平台上进行游戏娱乐,在直播平台上观看直播并进行互动,等等。随着互联网技术的发展,在运维自动化领域中,以游戏平台为例,现有的数据分析方法仅仅是利用游戏用户的相关数据,分析得出游戏在线人数数据,但并没有深入研究游戏平台在线人数发生变化时的原因所在,导致无法为游戏运维提供进一步的参考,游戏运营商也无法为用户提供更好的服务和游戏体验。
技术实现思路
本专利技术实施例的目的在于提供一种数据分析方法及装置,以确定平台在线人数变化的原因,对运维提供参考。为达到上述目的,本专利技术实施例公开了一种数据分析方法,方法包括:采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。较佳的,所述采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,包括:利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。较佳的,所述方法还包括:采集包含目标平台对应的多媒体信息的非结构化数据;所述对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据,包括:对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。较佳的,所述对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,包括:利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤,并将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中,对所述关系数据库中的数据进行分析。较佳的,所述对所述关系数据库中的数据进行分析,包括:在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计所述得到目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。较佳的,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。较佳的,所述对目标平台用户进行分类,包括:利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类。较佳的,所述方法还包括:展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。较佳的,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。较佳的,所述方法还包括:根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图。为达到上述目的,本专利技术实施例提供了一种数据分析装置,装置包括:第一采集模块,用于采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;判断模块,用于判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;分析模块,用于在人数变化程度达到预设值的情况下,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;确定模块,用于根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。较佳的,所述第一采集模块,具体用于:利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。较佳的,所述装置还包括:第二采集模块,用于采集包含目标平台对应的多媒体信息的非结构化数据;所述分析模块,包括:分析单元,用于对所述用户数据、内容数据、渠道数据和非结构化数据进行分析;确定单元,用于确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。较佳的,所述分析单元,包括:过滤子单元,用于利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤;存储子单元,用于将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中;分析子单元,用于对所述关系数据库中的数据进行分析。较佳的,所述分析子单元,具体用于:在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;所述确定单元,具体用于:根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。较佳的,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。较佳的,所述分析子单元,具体用于:在预先配置的计算结点上,结合所述关系数据库中存储的数据,利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据。较佳的,所述装置还包括:展示模块,用于展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。较佳的,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;所述确定单元,具体用于:确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。较佳的,所述装置还包括:生成模块,用于根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目本文档来自技高网...

【技术保护点】
1.一种数据分析方法,其特征在于,所述方法包括:采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。2.根据权利要求1所述的方法,其特征在于,所述采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,包括:利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:采集包含目标平台对应的多媒体信息的非结构化数据;所述对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据,包括:对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。4.根据权利要求3所述的方法,其特征在于,所述对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,包括:利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤,并将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中,对所述关系数据库中的数据进行分析。5.根据权利要求4所述的方法,其特征在于,所述对所述关系数据库中的数据进行分析,包括:在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。6.根据权利要求5所述的方法,其特征在于,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。7.根据权利要求5或6所述的方法,其特征在于,所述对目标平台用户进行分类,包括:利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类。8.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。9.根据权利要求3所述的方法,其特征在于,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的...

【专利技术属性】
技术研发人员:孙楠侯婉瑾
申请(专利权)人:北京金山云网络技术有限公司北京金山云科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1