一种壁湍流冗余数据剔除方法、装置、设备及介质制造方法及图纸

技术编号:37493657 阅读:20 留言:0更新日期:2023-05-07 09:31
本申请公开了一种壁湍流冗余数据剔除方法、装置、设备及介质,涉及人工智能湍流建模领域,所述方法包括:构造与壁湍流流场对应的数据集,所述数据集中包括由各网格单元对应的流场变量组合得到的数据对,并确定各数据对的无量纲壁面距离;基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间;基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对,可见,本申请首先将数据对进行快速聚类,然后通过递归法剔除冗余数据对,如此一来,提高了机器学习模型训练的效率。效率。效率。

【技术实现步骤摘要】
一种壁湍流冗余数据剔除方法、装置、设备及介质


[0001]本专利技术涉及人工智能湍流建模
,特别涉及一种壁湍流冗余数据剔除方法、装置、设备及介质。

技术介绍

[0002]高效的样本选择方法对人工智能湍流建模研究具有重要意义。随着人工智能技术的迅速发展,基于高可信度数值计算数据的机器学习湍流建模研究获得广泛研究。由于数值计算是基于网格拓扑开展的,所生成的数据量往往十分庞大,因此有必要采取样本选择方法减少样本量。现有技术中通过选取时间快照、空间截面、在结构网格中间隔取点的数据快速降维方式,在一定程度上缺乏对流场特征的考虑;递归法通过相关系数衡量数据间的相似性,能有效辨识远场以及邻居网格的所包含的冗余流场信息,但其计算代价随数据量的大小陡增。
[0003]为此,如何快速剔除冗余数据对,降低计算代价以提高机器学习模型训练的效率是本领域亟待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种壁湍流冗余数据剔除方法,能够快速剔除冗余数据对,降低计算代价以提高机器学习模型训练的效率,其具体方案如下:第一方面,本申请公开了一种壁湍流冗余数据剔除方法,包括:构造与壁湍流流场对应的数据集,所述数据集中包括由各网格单元对应的流场变量组合得到的数据对,并确定各数据对的无量纲壁面距离;基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间;基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对。
[0005]可选的,所述确定各数据对的无量纲壁面距离,包括:基于各数据对的壁面法向距离以及预设的公式确定各数据对的无量纲壁面距离;所述预设的公式为:;;其中,为无量纲壁面距离;为距壁面法向距离;为壁面摩擦速度;下标表示壁面;为壁面处分子运动粘性;为壁面摩擦应力;为壁面处密度;为壁面
处动力粘性系数;为流向速度;为壁面处速度梯度。
[0006]可选的,所述基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间,包括:对所述各数据对进行处理,得到处理后的数据对;基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间,并基于预设步长将所述目标变化区间划分为若干个变化子区间;基于所述各数据对的无量纲壁面距离的自然对数,将处理后的所述数据对归类至相应的变化子区间,以得到聚类后的各个数据区间。
[0007]可选的,所述对所述各数据对进行处理,得到处理后的数据对,包括:对所述各数据对进行标准化,并对标准化后数值大于预设标准化阈值的数据对进行剔除,然后对剔除后的数据对进行归一化,得到归一化后的数据对。
[0008]可选的,所述基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间,包括:基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面距离的自然对数中的最大自然对数以及最小自然对数;其中,所述最小自然对数不小于零;根据所述最大自然对数以及最小自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间;相应的,所述基于预设步长将所述目标变化区间划分为若干个变化子区间,包括:确定所述最大自然对数以及所述最小自然对数的差值;基于预设步长以及所述差值,将所述目标变化区间划分为若干个变化子区间;第第个所述变化子区间为:,其中,为所述最小自然对数;为步长。
[0009]可选的,所述基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对,包括:确定标准相关系数;将当前所述数据区间中的第一个数据对作为目标样本数据对,并确定当前所述数据区间中的下一个数据对与当前所述数据区间中当前所有样本数据对之间的各相关系数;确定所述各相关系数的最大值,并判断所述相关系数的最大值是否小于所述标准相关系数,如果是,则将所述下一个数据对确定为目标样本数据对,如果不是,则将所述下一个数据对剔除;判断所述下一个数据对是否为当前所述数据区间的最后一个数据对,如果所述下一个数据对是当前所述数据区间的最后一个数据对,则判断当前所述数据区间是否为最后一个所述数据区间,如果当前所述数据区间为最后一个所述数据区间,则将剔除后的所有所述数据区间中的数据对进行汇总,得到所有所述目标样本数据对。
[0010]可选的,所述判断所述下一个数据对是否为当前所述数据区间的最后一个数据对
之后,还包括:如果所述下一个数据对不是当前所述数据区间的最后一个数据对,则重新执行所述确定当前所述数据区间中的下一个数据对与当前所述数据区间中当前所有样本之间的各相关系数的步骤;相应的,所述判断当前所述变化子区间是否为最后一个所述变化子区间之后,还包括:如果当前所述数据区间不为最后一个所述数据区间,则确定当前所述数据区间的下一个所述数据区间为新的当前所述数据区间,并重新跳转至所述将当前所述数据区间中的第一个数据对作为样本的步骤。
[0011]第二方面,本申请公开了一种壁湍流冗余数据剔除装置,包括:无量纲壁面距离确定模块,用于构造与壁湍流流场对应的数据集,所述数据集中包括由各网格单元对应的流场变量组合得到的数据对,并确定各数据对的无量纲壁面距离;聚类模块,用于基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间;剔除模块,用于基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对。
[0012]第三方面,本申请公开了一种电子设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现前述公开的壁湍流冗余数据剔除方法。
[0013]第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的壁湍流冗余数据剔除方法。
[0014]可见,本申请提出一种壁湍流冗余数据剔除方法,包括:构造与壁湍流流场对应的数据集,所述数据集中包括由各网格单元对应的流场变量组合得到的数据对,并确定各数据对的无量纲壁面距离;基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间;基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对。由此可见,本申请通过对数据对进行快速聚类,然后通过递归法剔除冗余数据对,由此实现了对冗余数据对的快速剔除,如此一来,降低了计算代价并提高了机器学习模型训练的效率。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种壁湍流冗余数据剔除方法,其特征在于,包括:构造与壁湍流流场对应的数据集,所述数据集中包括由各网格单元对应的流场变量组合得到的数据对,并确定各数据对的无量纲壁面距离;基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间;基于递归法对每一所述数据区间中不满足预设条件的数据对进行剔除,然后将剔除后的所有所述数据区间中的数据对进行汇总,得到目标样本数据对。2.根据权利要求1所述的壁湍流冗余数据剔除方法,其特征在于,所述确定各数据对的无量纲壁面距离,包括:基于各数据对的壁面法向距离以及预设的公式确定各数据对的无量纲壁面距离;所述预设的公式为:;;其中,为无量纲壁面距离;为距壁面法向距离;为壁面摩擦速度;下标表示壁面;为壁面处分子运动粘性;为壁面摩擦应力;为壁面处密度;为壁面处动力粘性系数;为流向速度;为壁面处速度梯度。3.根据权利要求1或2所述的壁湍流冗余数据剔除方法,其特征在于,所述基于所述各数据对的无量纲壁面距离对所述各数据对进行聚类处理,以得到聚类后的各个数据区间,包括:对所述各数据对进行处理,得到处理后的数据对;基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间,并基于预设步长将所述目标变化区间划分为若干个变化子区间;基于所述各数据对的无量纲壁面距离的自然对数,将处理后的所述数据对归类至相应的变化子区间,以得到聚类后的各个数据区间。4.根据权利要求3所述的壁湍流冗余数据剔除方法,其特征在于,所述对所述各数据对进行处理,得到处理后的数据对,包括:对所述各数据对进行标准化,并对标准化后数值大于预设标准化阈值的数据对进行剔除,然后对剔除后的数据对进行归一化,得到归一化后的数据对。5.根据权利要求3所述的壁湍流冗余数据剔除方法,其特征在于,所述基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间,包括:基于所述各数据对的无量纲壁面距离的自然对数,确定出所述各数据对的无量纲壁面
距离的自然对数中的最大自然对数以及最小自然对数;其中,所述最小自然对数不小于零;根据所述最大自然对数以及最小自然对数,确定出所述各数据对的无量纲壁面距离的自然对数的目标变化区间;相应的,所述基于预设步长将所述目标变化区间划分为若干个变化子区间,包括:确定所述最大自然对数以及所述最小自然对数的差值;基于预设步长以及所述差值,将所述目标变化区间划分为若干个变化子区间;第个所述变化子区间为:,其中,为所述最小自然对数...

【专利技术属性】
技术研发人员:朱林阳王天张伟伟袁先旭
申请(专利权)人:中国空气动力研究与发展中心计算空气动力研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1