当前位置: 首页 > 专利查询>廖彩红专利>正文

基于时空域特征的业务大数据采集方法及服务器技术

技术编号:30543825 阅读:16 留言:0更新日期:2021-10-30 13:21
本发明专利技术实施例提供一种基于时空域特征的业务大数据采集方法及服务器,通过获取业务数据采集范围中的多个时域节点业务数据和多个空域节点业务数据、多个时域节点业务数据之间的时域关联参数和时域特征差异、以及多个空域节点业务数据之间的空域关联参数和空域特征差异,对多个时域节点业务数据进行组合,得到业务数据采集范围中的时域数据拓扑分布;然后,根据空域关联参数和空域特征差异,对多个空域节点业务数据进行组合,得到业务数据采集范围中的空域数据拓扑分布。如此,可通过时、空域两个数据维度对业务数据进行采集,并通过两个维度的相关性使得数据采集得到的业务数据流及相关信息能够更精准的反应业务数据的相关数据特征。关数据特征。关数据特征。

【技术实现步骤摘要】
基于时空域特征的业务大数据采集方法及服务器
[0001]本申请是申请号为202110077131.X、申请日为2021年01月20日、专利技术名称为“用于人工智能机器学习的业务大数据采集方法及服务器”的专利技术专利申请的分案申请。


[0002]本专利技术涉及人工智能及大数据
,具体而言,涉及一种用于人工智能机器学习的业务大数据采集方法及服务器。

技术介绍

[0003]人工智能(Artificial Intelligence,缩写为AI)是对人的意识、思维过程进行模拟的一门学科。机器学习(Machine Learning)和深度学习(Deep Learning)作为人工智能的技术核心,也已经取得重大的突破,机器被赋予强大的认知和预测能力。机器学习以及深度学习需要使用大量的采集样本数据进行模型训练,以利于后期的应用。然而,经过研究发现,在一些领域,例如互联网、数字金融、电子商务平台等,在进行数据采集的过程中可能会因为数据采集的精准度不够或者数据特征的采集误差等因素导致模型训练失败或者训练之后的模型在后期的应用效果不佳等问题。

技术实现思路

[0004]为解决上述问题,本专利技术实施例提供一种用于人工智能机器学习的业务大数据采集方法,包括:针对预先设定的用于进行业务大数据采集的业务数据采集范围中产生的业务数据分别进行时域节点以及空域节点的节点数据采集,得到时空域节点数据;所述时空域节点数据包括所述业务数据采集范围中产生的业务数据对应的时域节点数据和空域节点数据;对所述时空域节点数据进行拓扑融合分析,得到所述业务数据采集范围中的多个业务数据流和所述业务数据流对应的业务特征信息,并根据所述业务数据流和对应的业务特征信息得到业务数据流样本集合,以用于作为人工智能机器学习的业务数据学习样本进行机器学习。
[0005]在本专利技术实施例中,所述对所述时空域节点数据进行拓扑融合分析,得到所述业务数据采集范围中的多个业务数据流和所述业务数据流对应的业务特征信息包括:分别将所述时空域节点数据中的时域节点数据和空域节点数据形成多个时域数据拓扑分布和多个空域数据拓扑分布;根据时域数据拓扑分布和空域数据拓扑分布之间的业务拓扑关系,对所述业务数据采集范围中产生的各时域数据拓扑分布和各空域数据拓扑分布进行拓扑融合,得到多个拓扑分布融合组;每个拓扑分布融合组中的空域数据拓扑分布分别包括所述业务数据采集范围中的第二空域节点业务数据;将未进行拓扑融合的空域数据拓扑分布确定为待处理空域数据拓扑分布,根据所
述待处理空域数据拓扑分布包含的第一空域节点业务数据,获取所述待处理空域数据拓扑分布的第一拓扑分布描述信息;所述第一空域节点业务数据包含于所述业务数据采集范围;根据所述每个拓扑分布融合组包括的第二空域节点业务数据,分别获取所述每个拓扑分布融合组中的空域数据拓扑分布的第二拓扑分布描述信息;获取所述第一拓扑分布描述信息分别与所述每个拓扑分布融合组对应的第二拓扑分布描述信息之间的特征差异;根据所述每个拓扑分布融合组对应的特征差异,确定所述每个拓扑分布融合组中的空域数据拓扑分布分别与所述待处理空域数据拓扑分布之间的拓扑关联参数;统计拓扑关联参数不小于预设关联参数阈值的目标拓扑分布融合组,将所述目标拓扑分布融合组中的时域数据拓扑分布所包含的业务特征信息,确定为与所述待处理空域数据拓扑分布关联的业务特征信息;对与所述待处理空域数据拓扑分布关联的业务特征信息和所述待处理空域数据拓扑分布进行拓扑融合,得到特征拓扑融合组;根据所述特征拓扑融合组和所述多个拓扑分布融合组,确定所述业务数据采集范围中的业务数据流和所述业务数据流对应的业务特征信息。
[0006]此外,本专利技术实施例还提供一种服务器,包括处理器和机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以实现上述的用于人工智能机器学习的业务大数据采集方法。
[0007]相较于现有技术,本专利技术实施例提供的用于人工智能机器学习的业务大数据采集方法及服务器,针对预先设定的用于进行业务大数据采集的业务数据采集范围中产生的业务数据分别进行时域节点以及空域节点的节点数据采集,得到时空域节点数据,然后对所述时空域节点数据进行拓扑融合分析,得到所述业务数据采集范围中的多个业务数据流和所述业务数据流对应的业务特征信息,以用于作为人工智能机器学习的业务数据学习样本进行机器学习。如此,可通过时、空域两个数据维度对业务数据进行采集,并通过两个维度的相关性使得数据采集得到的业务数据流及相关信息能够更精准的反应业务数据的相关数据特征,有利于提升后期进行机器学习或人工智能模型训练的学习效果及应用效果。
附图说明
[0008]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,针对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0009]图1是本专利技术实施例提供的一种大数据采集系统的网络架构的结构示意图。
[0010]图2是本专利技术实施例提供的服务器的示意图。
[0011]图3是本专利技术实施例提供的于人工智能机器学习的业务大数据采集方法的流程示意图。
[0012]图4是图3中的步骤S32的子步骤流程示意图。
[0013]具体实施方式
[0014]下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都包含于本专利技术保护的范围。
[0015]请参见图1,图1是本专利技术实施例提供的一种大数据采集系统的网络架构的结构示意图。如图1所示,所述大数据采集系统可以包括服务器100和业务数据终端集群,业务数据终端集群可以包括多个业务数据终端200。所述服务器100与所述业务数据终端200通信连接,用于从所述业务数据终端200采集各业务数据终端200产生的业务数据,实现大数据的采集。这里将不对业务数据终端200的数量进行限制,各业务数据终端200均可以与服务器100进行通信连接,以便于与服务器100之间进行数据交互。
[0016]如图1所示的服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,也可以是提供云服务、云存储、云计算、云通信、云安全服务、以及大数据和人工智能平台等云计算服务的云服务器。业务数据终端可以是智能手机、平板电脑、笔记本电脑、个人计算机等能够使用所述服务器100或其他第三方平台提供的服务而产生的相应的业务数据的智能终端。
[0017]请参阅图2,图2是所述服务器100的示意图。本实施例中,所述服务器100用于实现本专利技术实施例提供的用于人工智能机器学习的业务大数据采集方法。本实施例中,所述服务器100可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空域特征的业务大数据采集方法,其特征在于,包括:获取业务数据采集范围中的多个时域节点业务数据和多个空域节点业务数据;获取所述多个时域节点业务数据之间的时域关联参数和时域特征差异,获取所述多个空域节点业务数据之间的空域关联参数和空域特征差异;根据所述时域关联参数和所述时域特征差异,对所述多个时域节点业务数据进行组合,得到所述业务数据采集范围中的时域数据拓扑分布;其中,一个时域数据拓扑分布包括至少一个时域节点业务数据;根据所述空域关联参数和所述空域特征差异,对所述多个空域节点业务数据进行组合,得到所述业务数据采集范围中的空域数据拓扑分布;其中,一个空域数据拓扑分布包括至少一个空域节点业务数据;其中,所述时域数据拓扑分布以及所述空域数据拓扑分布用于进行拓扑融合以得到用于作为人工智能机器学习的业务数据流样本集合。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述时域数据拓扑分布和空域数据拓扑分布之间的业务拓扑关系,对所述业务数据采集范围中产生的各时域数据拓扑分布和各空域数据拓扑分布进行拓扑融合,得到多个拓扑分布融合组;每个拓扑分布融合组中的空域数据拓扑分布分别包括所述业务数据采集范围中的第二空域节点业务数据;将因未匹配到时域数据拓扑分布而未进行拓扑融合的空域数据拓扑分布确定为待处理空域数据拓扑分布,根据所述待处理空域数据拓扑分布包含的第一空域节点业务数据,获取所述待处理空域数据拓扑分布的第一拓扑分布描述信息;所述第一空域节点业务数据包含于所述业务数据采集范围;根据所述每个拓扑分布融合组包括的第二空域节点业务数据,分别获取所述每个拓扑分布融合组中的空域数据拓扑分布的第二拓扑分布描述信息;获取所述第一拓扑分布描述信息分别与所述每个拓扑分布融合组对应的第二拓扑分布描述信息之间的特征差异;根据所述每个拓扑分布融合组对应的特征差异,确定所述每个拓扑分布融合组中的空域数据拓扑分布分别与所述待处理空域数据拓扑分布之间的拓扑关联参数;统计拓扑关联参数不小于预设关联参数阈值的目标拓扑分布融合组,将所述目标拓扑分布融合组中的时域数据拓扑分布所包含的业务特征信息,确定为与所述待处理空域数据拓扑分布关联的业务特征信息;将与所述待处理空域数据拓扑分布关联的业务特征信息和所述待处理空域数据拓扑分布进行拓扑融合,得到特征拓扑融合组;根据所述特征拓扑融合组和所述多个拓扑分布融合组,确定所述业务数据采集范围中的业务数据流和所述业务数据流对应的业务特征信息,并根据所述业务数据流和对应的业务特征信息得到所述业务数据流样本集合。3.根据权利要求2所述的方法,其特征在于,所述根据所述时域数据拓扑分布和空域数据拓扑分布之间的业务拓扑关系,对所述业务数据采集范围中产生的各时域数据拓扑分布和各空域数据拓扑分布进行拓扑融合,得到多个拓扑分布融合组,包括:将所述业务数据采集范围中产生的各空域数据拓扑分布确定为局部空域拓扑分布,将
所述业务数据采集范围中产生的各时域数据拓扑分布确定为局部时域拓扑分布;所述局部空域拓扑分布中的空域节点业务数据是针对所述业务数据采集范围的目标业务节点进行数据采集得到的;获取所述目标业务节点中的时域节点业务数据; 计算所述目标业务节点中的时域节点业务数据与所述局部时域拓扑分布中的各时域节点业务数据之间的业务数据关联参数,并根据计算得到的业务数据关联参数确定所述局部空域拓扑分布与所述局部时域拓扑分布之间的业务拓扑关系;当所述业务数据关联参数不小于预设关联参数阈值时,对所述局部空域拓扑分布和所述局部时域拓扑分布进行拓扑融合,得到所述多个拓扑分布融合组。4.根据权利要求2所述的方法,其特征在于,所述第一空域节点业务数据的业务数据片段为多个; 所述根据所述待处理空域数据拓扑分布包含的第一空域节点业务数据,获取所述待处理空域数据拓扑分布的第一拓扑分布描述信息,包括:获取多个第一空域节点业务数据中的每个第一空域节点业务数据分别对应的业务数据描述信息;根据所述每个第一空域节点业务数据分别对应的业务数据描述信息,获取所述多个第一空域节点业务数据对应的第一全局业务特征信息;将所述第一全局业务特征信息,确定为所述第一拓扑分布描述信息。5.根据权利要求2所述的方法,其特征在于,所述多个拓扑分布融合组包括拓扑分布融合组Ri,i不大于所述多个拓扑分布融合组的总数量;所述拓扑分布融合组Ri包括的第二空域节点业务数据的业务数据片段为多个; 所述根据所述每个拓扑分布融合组包括的第二空域节点业务数据,分别获取所述每个拓扑分布融合组中的空域数据拓扑分布的第二拓扑分布描述信息,包括:获取所述拓扑分布融合组Ri包括的多个第二空域节点业务数据中的每个第二空域节点...

【专利技术属性】
技术研发人员:廖彩红
申请(专利权)人:廖彩红
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1