本发明专利技术实施例涉及一种基于电信数据建设人口分析平台的方法和装置,包括步骤:从运营商获取用户日志数据;采用数据分析组件对用户日志数据进行预处理,建立用户数据;根据业务需求对用户数据进行筛选分析处理,得到人口可视化分析结果;通过显示终端对人口可视化分析结果显示,该方法和装置能够通过数据采集模块对电信数据的应用,得到的人口可视化分析结果通过显示终端实现人员与数据之间的交互;大数据背景下知晓地区的人口密度、区域人口热力图以及区域人口迁移的信息平台,获取的人口可视化分析结果的准确性高、效率高,也有利于政府部门的人员知晓区域人口情况,并通过对实时获取电信数据的充分利用,得到人口可视化分析结果的实时性强。
【技术实现步骤摘要】
基于电信数据建设人口分析平台的方法和装置
本专利技术涉及人口分析
,尤其涉及一种基于电信数据建设人口分析平台的方法和装置。
技术介绍
随着城镇化进程的不断加快,人员大量涌入城镇,各地区人口数量发生较大变化,各地区人口数量、人口流动趋势等数据也在不断变化。传统的人口统计通常通过入户调查、各部门上门调研,录入使用结构化数据,对结构化数据进行统计分析,采访调方式查耗费大量人力和资源,容易遗漏且不便于收据整理和分析,而个地区人口数据数量庞大、较为分散难以完整收集和分析,导致现有人口分析的便捷性、准确性和工作效率不佳。
技术实现思路
本专利技术实施例提供了一种基于电信数据建设人口分析平台的方法和装置,用于解决传统的人工分口统计分析通过入户调查、调研获得的,因人口数据数量庞大、较为分散,人口统计难以完整收集和分析,导致现有人口分析的便捷性、准确性和工作效率不佳的技术问题。为了实现上述目的,本专利技术实施例提供如下技术方案:一种基于电信数据建设人口分析平台的方法,包括以下步骤:从运营商获取用户日志数据;采用数据分析组件对所述用户日志数据进行预处理,建立用户数据;根据业务需求对所述用户数据进行筛选分析处理,得到人口可视化分析结果;通过显示终端对所述人口可视化分析结果显示。优选地,所述语音通话数据包括用户电话号码、时间戳、通话时长和基站位置坐标;所述流量数据包括用户电话号码、时间戳、上网时长、基站位置坐标、上行流量和下行流量。优选地,在所述运营商中采用Logstash技术同时对所述用户日志数据的语音通话数据和流量数据进行数据采集,得到采集数据。优选地,采用大数据的数据分析处理组件Flink对所述采集数据进行清洗,得到所述用户数据;清洗的过程包括删除包含格式不正确字段的数据;所述不正确字段的数据是指字段中出现null、电话号码位数不对和或时间戳的位数不正确的数据。优选地,筛选分析处理的过程包括对所述用户数据筛选出有效字段,根据人口密度分布、人口密度热力图、人口迁移的业务需求对所述有效字段进行分析划分得到人口可视化分析结果。其中,所述有效字段包含有用户号码、时间戳和基站地理坐标。优选地,所述显示终端上设置有用于显示人口可视化分析结果的人机互动APP。优选地,采用Logstash组件从所述运营商获取用户日志数据。本专利技术还提供一种基于电信数据建设人口分析平台的装置,包括数据采集模块、预处理模块、分析模块和显示模块;所述数据采集模块,用于从运营商获取用户日志数据;所述预处理模块,用于采用数据分析组件对所述用户日志数据进行预处理,建立用户数据;所述分析模块,用于根据业务需求对所述用户数据进行筛选分析处理,得到人口可视化分析结果;所述显示模块,用于通过显示终端对所述人口可视化分析结果显示;其中,所述用户日志数据包括用户的语音通话数据以及流量数据。优选地,所述数据采集模块还用于采用Logstash同时从所述运营商中对所述用户日志数据的语音通话数据和流量数据同时进行采集,得到采集数据;所述预处理模块,采用大数据的数据分析处理组件Flink对所述采集数据进行清洗,得到所述用户数据;清洗的过程包括删除包含格式不正确字段的数据;所述分析模块的筛选分析处理的过程包括对所述用户数据筛选出有效字段,根据人口密度分布、人口密度热力图、人口迁移的业务需求对所述有效字段进行分析划分得到人口可视化分析结果;其中,所述不正确字段的数据是指字段中出现null、电话号码位数不对和或时间戳的位数不正确的数据;所述有效字段包含有用户号码、时间戳和基站地理坐标。优选地,所述基于电信数据建设人口分析平台的装置还包括存储模块,所述存储模块用于存储所述人口可视化分析结果中的筛选分析后的用户数据以及所述预处理模块处理后的数据。从以上技术方案可以看出,本专利技术实施例具有以下优点:1.该基于电信数据建设人口分析平台的方法通过从运营商获取用户日志数据;对用户日志数据进行预处理,建立用户数据;根据业务需求对用户数据进行筛选分析处理,得到人口可视化分析结果;通过显示终端对人口可视化分析结果显示,该基于电信数据建设人口分析平台的方法能够通过数据采集模块对电信数据的应用,得到的人口可视化分析结果通过显示终端实现人员与数据之间的交互;大数据背景下知晓地区的人口密度、区域人口热力图以及区域人口迁移的信息平台,获取的人口可视化分析结果的准确性高、效率高,也有利于政府部门的人员知晓区域人口情况,并通过对实时获取电信数据的充分利用,得到人口可视化分析结果的实时性强。解决了传统的人工分口统计分析通过入户调查、调研获得的,因人口数据数量庞大、较为分散,人口统计难以完整收集和分析,导致现有人口分析的便捷性、准确性和工作效率不佳的技术问题;2.该基于电信数据建设人口分析平台的装置通过数据采集模块、预处理模块、分析模块获得人口可视化分析结果并通过显示模块显示,该基于电信数据建设人口分析平台的装置能够通过对电信数据中的用户日志数据的应用,得到的人口可视化分析结果通过显示终端实现人员与数据之间的交互;大数据背景下知晓地区的人口密度、区域人口热力图以及区域人口迁移的信息平台,获取的人口可视化分析结果的准确性高、效率高,也有利于政府部门的人员知晓区域人口情况,并通过对实时获取电信数据的充分利用,得到人口可视化分析结果的实时性强。解决了传统的人工分口统计分析通过入户调查、调研获得的,因人口数据数量庞大、较为分散,人口统计难以完整收集和分析,导致现有人口分析的便捷性、准确性和工作效率不佳的技术问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例所述的基于电信数据建设人口分析平台的方法的步骤流程图。图2为本专利技术实施例所述的基于电信数据建设人口分析平台的装置的框架图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。目前也存在人口数据分析平台,该人口数据分析平台是根据人员往来的机票、火车票等交通数据进行统计分析,其统计结果延迟较大,人口流动情况无法动态显示。而通信技术的进步为人们的信息交流提供了极大的便利,但通信数据除了为用户提供查询服务以及为运营商提供一定的用户使用情况外并没有得到充分的利用,通信数据的各字段信息并没有被充分挖掘;利用运营商提供的通信数据,可以本文档来自技高网...
【技术保护点】
1.一种基于电信数据建设人口分析平台的方法,其特征在于,包括以下步骤:/n从运营商获取用户日志数据;/n采用数据分析组件对所述用户日志数据进行预处理,建立用户数据;/n根据业务需求对所述用户数据进行筛选分析处理,得到人口可视化分析结果;/n通过显示终端对所述人口可视化分析结果显示;/n其中,所述用户日志数据包括用户的语音通话数据以及流量数据。/n
【技术特征摘要】
1.一种基于电信数据建设人口分析平台的方法,其特征在于,包括以下步骤:
从运营商获取用户日志数据;
采用数据分析组件对所述用户日志数据进行预处理,建立用户数据;
根据业务需求对所述用户数据进行筛选分析处理,得到人口可视化分析结果;
通过显示终端对所述人口可视化分析结果显示;
其中,所述用户日志数据包括用户的语音通话数据以及流量数据。
2.根据权利要求1所述的基于电信数据建设人口分析平台的方法,其特征在于,所述语音通话数据包括用户电话号码、时间戳、通话时长和基站位置坐标;所述流量数据包括用户电话号码、时间戳、上网时长、基站位置坐标、上行流量和下行流量。
3.根据权利要求1所述的基于电信数据建设人口分析平台的方法,其特征在于,在所述运营商中采用Logstash同时对所述用户日志数据的语音通话数据和流量数据进行数据采集,得到采集数据。
4.根据权利要求3所述的基于电信数据建设人口分析平台的方法,其特征在于,采用大数据的数据分析处理组件Flink对所述采集数据进行清洗,得到所述用户数据;
清洗的过程包括删除包含格式不正确字段的数据;所述不正确字段的数据是指字段中出现null、电话号码位数不对和或时间戳的位数不正确的数据。
5.根据权利要求1所述的基于电信数据建设人口分析平台的方法,其特征在于,筛选分析处理的过程包括对所述用户数据筛选出有效字段,根据人口密度分布、人口密度热力图、人口迁移的业务需求对所述有效字段进行分析划分得到人口可视化分析结果;
其中,所述有效字段包含有用户号码、时间戳和基站地理坐标。
6.根据权利要求1所述的基于电信数据建设人口分析平台的方法,其特征在于,所述显示终端上设置有用于显示人口可视化分析结果的人机互动APP。
【专利技术属性】
技术研发人员:王洪岭,杨志伟,肖丽,
申请(专利权)人:广州泰尔智信科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。