本发明专利技术针对现有地球化学数据分析容易出现主观偏差问题,提出了一种能够准确分析地球化学数据基于信息增益率元素地球化学勘探数据优选方法:获取调查区内地球化学数据;在调查区构建空白空间网格矩阵并绘制相应的计算网格矩阵;对数据进行筛选,剔除错误数据,将剩余数据通过插值投影到计算网格矩阵中;将已知矿产地坐标投影到计算网格矩阵中,在对应知矿产地的计算网格中将矿产品位采用相应标记表示,在对应未知矿产地计算网格中填写表示未知标记;随机选取若干含矿网格和若干未知网格作为训练数据;计算各元素与对应含矿性信息增益率,选取成矿有利元素;成矿有利元素对调查地区地球化学数据进行优选。本发明专利技术能够准确的对地球化学数据进行分析。
【技术实现步骤摘要】
本专利技术涉及一种基于信息增益率的元素地球化学勘探数据优选方法。
技术介绍
地球化学勘探数据的分析是对矿产勘查的过程中非常重要的一个环节,现有勘探地球化学数据分析方法为将测试后的水系沉积物/土壤/地气样品数据投影到平面直角坐标系内,制成等值线图或以异常下限作为边界圈定单元素的高值区,对数据的分析主要依靠工作者凭借经验人工完成。这种数据分析方法对勘察工作人员经验要求非常高,而且这种数据分析方法也不能形成系统的方法进行交流和传授,导致每个工作者只能通过以往的经验进行主观的分析和判断。由于不同工作人员知识经验水平不同,这种依靠主观分析和判断的数据分析方法在不同的工作人员对同一地区的矿产进行判断时出现差异。而且在选择一个区域内成矿有利元素评价标准不统一,直接影响了矿产勘查与评价效果,因此亟需一种对于勘探地球化学数据的量化优选方法。
技术实现思路
针对上述问题,本专利技术提供一种准确判断成矿因素的基于信息增益率的元素地球化学勘探数据优选方法。为达到上述目的,本专利技术基于信息增益率的元素地球化学勘探数据优选方法包括如下步骤:步骤1:选定调查区,获取调查区内的地球化学数据;步骤2:在调查区构建空白的空间网格矩阵;按照所述空间网格矩阵绘制计算网格矩阵;步骤3:对步骤1中获取的数据进行筛选,剔除错误的数据;将剩余的数据 通过插值投影到步骤2中构建的计算网格矩阵中,形成元素属性网格矩阵步骤4:将已知的矿产地坐标投影到步骤3中的元素属性网格矩阵中,将已知的矿产地的矿产品位分为若干级别,在对应已知矿产地的计算网格中填写表示矿产品位级别的标记,在对应未知矿产地的计算网格中填写表示未知标记,形成矿产品位网格矩阵;步骤5:从步骤4的矿产品位网格矩阵中随机选取若干对应矿产地的含矿网格和若干对应未知矿产地的未知网格作为训练数据;步骤6:计算各元素与对应含矿性的信息增益率,选取信息增益率在前30%的元素作为成矿有利元素;步骤7:根据步骤6中选取的成矿有利元素对调查地区地球化学数据进行优选。进一步地,所述步骤1中获取地球化学数据的方法如下:选择1:20万-1:5万比例尺在调查区布置地球化学测网,依据所述化学测网采集调查区内的水系沉积物或土壤地球化学样品,对所述水系沉积物或土壤地球化学样品进行检测,得到地球化学数据。进一步地,在所述步骤3之前或之后还包括数据转换步骤;所述数据转换步骤将全部数据通过数据变换转换成为服从正态分布的数据。进一步地,所述步骤2中构建的空白的空间网格矩阵的网格大小为10m*10m~1000m*1000m。进一步地,所述步骤5中的含矿网格单元与未知网格单元的比例为1:5~5:1,所述含矿网格单元与未知网格单元优选的比例为1:1。进一步地,所述数据变换采用Box-Cox变换,所述Box-Cox变换方法如下:Yi为原始数据中的第i个数据,变换后的第i个数据为Yi(λ);当λ大于0或小于0时,所述当λ等于0时,所述Yi(λ)=ln(Yi);其中, 所述λ是使似然函数最大的常数。进一步地,所述步骤6中的信息增益率的计算方法如下:其中,所述所述所述上述公式中,|D|表示数据集D中的元组个数,m表示属性A的取值个数,Di表示属性A的第i个取值对应的元组集合,v为表示类属性的取值个数,pj表示元组是j类的概率。进一步地,步骤7之后还包括成矿品位判断步骤,所述成矿品位判断步骤包括如下工序:1、提取成矿有利元素的数据,绘制成矿有利元素的等值线图;2、根据各成矿有利因素的等值线图的交叉情况判断成矿位置以及成矿品位。本专利技术基于信息增益率的元素地球化学勘探数据优选方法,采用计算信息增益率的方法判断各元素对成矿品位的影响,能够简单直观的做出判断。本专利技术基于信息增益率的元素地球化学勘探数据优选方法形成了一套系统的计算方法和数据处理方法,便于工作人员的交流和传授,在一定程度上能够提高地球化学勘探的效率。本专利技术基于信息增益率的元素地球化学勘探数据优选方法,通过对各个元素的综合计算,筛选出成矿有利因素,全面考虑了各个元素的影响,因此,有效性高、适用性强、准确性好。通过基于信息增益率的元素地球化学数据优选方法,为地球化学矿产勘查提供了简洁直接的成矿有利元素优选方法,降低了对工作人员个人经验的依赖和不同个体主观意识对成矿有利元素评价带来的影响,做到客观真实的评价各元素在勘查区内的成矿有利性,进行找矿指示元素的优选。凭借计算机代替人工选择勘查区地球化学数据的优选与评价,增强评价的客观性,提高了数据处理的效率和质量,实用性强,准确度高,实现方便,处理快速。附图说明图1是本专利技术基于信息增益率的地球化学勘探数据优选方法的操作步骤;图2为本专利技术基于信息增益率的地球化学勘探数据优选方法的实施例1中填写有矿产品位级别标记和未知标记的计算网格矩阵;图3是图2的局部放大图;图4是本专利技术基于信息增益率的地球化学勘探数据优选方法的实施例1中的各个元素的信息增益率的排序。图5是计算网格矩阵的分布方式。具体实施方式下面结合说明书附图对本专利技术做进一步的描述。实施例1如图1-4所示,本实施例的基于信息增益率的地球化学勘探数据优选方法的操作过程如下:1、搜集甘肃省某金矿区1:50000水系沉积物地球化学数据,共包含18种元素:Ag、As、Au、Bi、Cd、Co、Cr、Cu、Hg、Mo、Ni、Pb、Rb、Sb、Sn、Ti、W、Zn,覆盖264平方千米勘查区面积。2、按照100m*100m构建空白的空间网格矩阵,覆盖勘查区空间范围;按照空间网格矩阵绘制计算网格矩阵M。计算网格矩阵如图5所示。3、检验1中获取的地球化学数据,剔除错误的数据,剩余待计算地球化学数据,通过对各单元素数据进行空间克里金插值,将待计算地球化学数据投影到计算网格矩阵中,形成元素属性网格矩阵,元素属性网格矩阵中每个单元格为包含每种元素属性的18维属性向量;用mi,j表示元素属性网格矩阵中的单元格;mi,j=|Agi,j Asi,j Aui,j Bii,j … Sni,j Tii,j Wi,j Zni,j|;4、将已知的矿产地坐标投影到3中的元素属性网格矩阵中,按照已知矿产地含矿品位高低,在对应元素属性网格内填写3、2、1,将未知矿产地对应的元素属性网格内填写0,并将此值附到网格矩阵的向量mi,j中,作为第19个属性, 这样,元素属性网格矩阵就形成了矿产品位网格矩阵。未知矿产地是指该位置是否含有矿产处于未知状态的地方。5、如图2和图3所示,从4的矿产品位网格矩阵中随机选取60个对应矿产地的含矿网格单元和60个对应未知矿产地的未知网格单元作为训练数据;在计算中,未知矿产地视为不含矿产。6、计算各元素与对应含矿性的信息增益率,计算各元素与对应含矿性的信息增益率的方法如下:所述步骤6中的信息增益率的计算方法如下:其中,所述所述所述上述公式中,|D|表示数据集D中的元组个数,m表示属性A的取值个数,Di表示属性A的第i个取值对应的元组集合,v为表示类属性的取值个数,pj表示元组是j类的概率。计算完毕的各元素与对应含矿性的信息增益率排序如图4所示。选取信息增益率在前30%的元素作为成矿有利元素。7、根据信息增益率排序结果,选择前30%为成矿有利元素,在18种元素中优选了W、Au、Sb、Sn、Ag、Hg六种元素作为此区域勘探工作中本文档来自技高网...
【技术保护点】
一种基于信息增益率的元素地球化学勘探数据优选方法,其特征在于:所述方法包括如下步骤:步骤1:选定调查区,获取调查区内的地球化学数据;步骤2:在调查区构建空白的空间网格矩阵;按照所述空间网格矩阵绘制计算网格矩阵;步骤3:对步骤1中获取的数据进行筛选,剔除错误的数据;将剩余的数据通过插值投影到步骤2中构建的计算网格矩阵中,形成元素属性网格矩阵步骤4:将已知的矿产地坐标投影到步骤3中的元素属性网格矩阵中,将已知的矿产地的矿产品位分为若干级别,在对应已知矿产地的计算网格中填写表示矿产品位级别的标记,在对应未知矿产地的计算网格中填写表示未知标记,形成矿产品位网格矩阵;步骤5:从步骤4的矿产品位网格矩阵中随机选取若干对应矿产地的含矿网格和若干对应未知矿产地的未知网格作为训练数据;步骤6:计算各元素与对应含矿性的信息增益率,选取信息增益率在前30%的元素作为成矿有利元素;步骤7:根据步骤6中选取的成矿有利元素对调查地区地球化学数据进行优选。
【技术特征摘要】
1.一种基于信息增益率的元素地球化学勘探数据优选方法,其特征在于:所述方法包括如下步骤:步骤1:选定调查区,获取调查区内的地球化学数据;步骤2:在调查区构建空白的空间网格矩阵;按照所述空间网格矩阵绘制计算网格矩阵;步骤3:对步骤1中获取的数据进行筛选,剔除错误的数据;将剩余的数据通过插值投影到步骤2中构建的计算网格矩阵中,形成元素属性网格矩阵步骤4:将已知的矿产地坐标投影到步骤3中的元素属性网格矩阵中,将已知的矿产地的矿产品位分为若干级别,在对应已知矿产地的计算网格中填写表示矿产品位级别的标记,在对应未知矿产地的计算网格中填写表示未知标记,形成矿产品位网格矩阵;步骤5:从步骤4的矿产品位网格矩阵中随机选取若干对应矿产地的含矿网格和若干对应未知矿产地的未知网格作为训练数据;步骤6:计算各元素与对应含矿性的信息增益率,选取信息增益率在前30%的元素作为成矿有利元素;步骤7:根据步骤6中选取的成矿有利元素对调查地区地球化学数据进行优选。2.如权利要求1所述基于信息增益率的元素地球化学勘探数据优选方法,其特征在于:所述步骤1中获取地球化学数据的方法如下:选择1:20万-1:5万比例尺在调查区布置地球化学测网,依据所述化学测网采集调查区内的水系沉积物或土壤地球化学样品,对所述水系沉积物或土壤地球化学样品进行检测,得到地球化学数据。3.如权利要求1所述基于信息增益率的元素地球化学勘探数据优选方法,其特征在于:在所述步骤3之前或之后还包括数据转换步骤;所述数据转换步骤将全部数...
【专利技术属性】
技术研发人员:王新华,
申请(专利权)人:中国地质大学北京,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。