System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及成矿预测,尤其涉及一种未见矿样本选择方法、系统、存储介质、电子设备。
技术介绍
1、在矿产资源勘探领域,准确预测潜在成矿区对于优化勘探效率和降低勘探成本具有重要意义。传统的成矿预测方法大多依赖于见矿样本(即通过钻孔验证的样本),而未见矿样本(即未经钻孔验证的样本)往往通过随机欠采样的方法选取。然而,随机欠采样存在样本选择不准确和数据不平衡的问题,可能导致未见矿样本集中包含错误数据,影响预测模型的性能。如何在未见矿区域内选取可靠且代表性的样本,并减少数据冗余,已成为成矿预测领域的一个重要研究课题。
技术实现思路
1、本专利技术的目的在于:为了解决未见矿样本选择时数据不可靠、数据冗余的问题,提出一种未见矿样本选择方法,包括以下步骤:
2、s1、收集未见矿样本;
3、s2、使用深度支持向量数据描述算法对未见矿样本进行异常检测,得到异常得分;
4、s3、设定异常得分阈值,选择异常得分低于阈值的未见矿样本作为未见矿样本的预选集;
5、s4、使用k-means聚类算法,将未见矿样本的预选集划分为多个聚类簇;
6、s5、通过集群中心欠采样技术,保留每个聚类簇的聚类中心样本作为未见矿样本的最终选择集。
7、进一步地,在深度支持向量数据描述算法训练阶段的损失函数为:
8、
9、其中,loss为深度支持向量数据描述算法训练阶段的损失函数,r表示球体半径,ν∈(0,1]表示控制异常值比例的权重参
10、进一步地,所述异常得分计算公式为:
11、
12、其中,s(xi)表示xi的异常得分,xi表示第i个未见矿样本,φ(xi;w*)表示深度支持向量数据描述算法的参数为xi和w*的神经网络,w*表示经过训练后的深度支持向量数据描述算法获取的最优连接权重,c表示超球体球心。
13、进一步地,根据异常得分的正态分布情况设定异常得分阈值。
14、进一步地,将未见矿样本的预选集划分为多个聚类簇,首先初始化k个聚类中心,计算未见矿样本的预选集中每个未见矿样本到每个聚类中心的距离:
15、d(xi,μk)=‖xi-μk‖2,
16、其中,d(xi,μk)表示未见矿样本的预选集中第i个未见矿样本xi到第k个聚类中心的距离;
17、根据所述距离,将每个样本分配到最近的聚类中心,更新每个簇的聚类中心,重复迭代,直到聚类中心位置收敛,得到所述聚类簇。
18、本专利技术还提出一种未见矿样本选择系统,包括:
19、样本收集模块,用于收集未见矿样本;
20、异常检测模块,用于使用深度支持向量数据描述算法对未见矿样本进行异常检测,得到异常得分;
21、样本选择模块,用于设定异常得分阈值,选择异常得分低于阈值的未见矿样本作为未见矿样本的预选集;
22、样本聚类模块,用于使用k-means聚类算法,将未见矿样本的预选集划分为多个聚类簇;
23、样本确定模块,用于通过集群中心欠采样技术,保留每个聚类簇的聚类中心样本作为未见矿样本的最终选择集,将未见矿样本的最终选择集用于成矿预测。
24、本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的未见矿样本选择方法。
25、本专利技术还提出一种电子设备,包括处理器和存储器,所述处理器与所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括计算机可读指令,所述处理器被配置用于调用所述计算机可读指令,执行上述的未见矿样本选择方法。
26、本专利技术提供的技术方案带来的有益效果是:
27、本专利技术首先采用深度支持向量数据描述算法对未见矿样本进行异常检测,将异常得分高的样本剔除,保留异常得分低的样本进行聚类,确保未见矿样本预选集中样本的可靠性,通过集群中心欠采样技术,保留每个聚类簇的集群中心样本作为最终未见矿样本,剔除聚类簇内其他样本,这样可以减少冗余样本,保证未见矿样本的代表性。本专利技术可以提高未见矿样本的可靠性,同时缓解随机欠采样导致的信息量大量丢失,从而保证选择的未见矿样本具有代表性。
本文档来自技高网...【技术保护点】
1.一种未见矿样本选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,在深度支持向量数据描述算法训练阶段的损失函数为:
3.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,所述异常得分计算公式为:
4.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,根据异常得分的正态分布情况设定异常得分阈值。
5.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,将未见矿样本的预选集划分为多个聚类簇,首先初始化K个聚类中心,计算未见矿样本的预选集中每个未见矿样本到每个聚类中心的距离:
6.一种未见矿样本选择系统,其特征在于,包括:
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的方法。
8.一种电子设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括计算机可读指令,所述处理器被配置用于
...【技术特征摘要】
1.一种未见矿样本选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,在深度支持向量数据描述算法训练阶段的损失函数为:
3.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,所述异常得分计算公式为:
4.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,根据异常得分的正态分布情况设定异常得分阈值。
5.根据权利要求1所述的一种未见矿样本选择方法,其特征在于,将未见矿样本的预选集划分为多个聚类簇,首先初始化k个聚类中心,...
【专利技术属性】
技术研发人员:孔春芳,李必亿,徐凯,吴冲龙,田宜平,李岩,张军强,董洋,翁正平,张志庭,向世泽,武永进,
申请(专利权)人:武汉地大坤迪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。