粤西庞西垌地区非结构化地质信息机器可读表达与致矿异常区域智能预测

王堃屹 ,  周永章

地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 47 -57.

PDF (6558KB)
地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 47 -57. DOI: 10.13745/j.esf.sf.2024.5.5
大数据算法与图形大数据

粤西庞西垌地区非结构化地质信息机器可读表达与致矿异常区域智能预测

作者信息 +

Machine-readable expression of unstructured geological information and intelligent prediction of mineralization associated anomaly areas in Pangxidong District, Guangdong, China

Author information +
文章历史 +
PDF (6715K)

摘要

大数据挖掘与机器学习算法应用已成为成矿预测研究的重要趋势,但如何使非结构化地质数据进行机器可读表达成为需要克服的难点。本研究针对粤西庞西垌矿集区开展地层、岩性、断裂等非结构化地质信息面向机器可读的转换处理,并进而应用机器学习算法对水系沉积物地球化学测试数据和构造、地层等综合地质信息进行挖掘,提取致矿异常特征,最终实现智能圈定致矿异常找矿靶区。独热编码算法与空间加权主成分分析中的权重变量方法组合应用,实现了地层、岩性和断裂构造等非结构化地质信息的结构化转化,并最大限度地保留其所包含的地质信息。单分类支持向量机和自编码网络异常检测算法的应用,解决了研究区已知矿点与非矿点数据不平衡问题。对多源地质数据的集成和综合生成的预测结果与研究区铅锌矿床的空间分布和实际的地质构造情况相对一致,表明上述算法能够有效识别找矿潜力区并寻找潜在的矿床。与传统的勘查地球化学方法相比,本研究中的分析方法能够处理和集成多源的地质致矿信息,可应用于尚未发现矿床的找矿潜力区,提高发现矿床的可能性和找矿工作的效率。

关键词

大数据挖掘 / 机器可读表达 / 独热编码算法 / 单分类支持向量机 / 自编码网络 / 庞西垌矿区 / 钦杭成矿带

Key words

big data mining / machine-readable expression / One-Hot Encoder / One-Class Support Vector Machine / Auto-Encoder Network / Pangxidong ore district / Qinzhou-Hangzhou metallogenic belt

引用本文

引用格式 ▾
王堃屹,周永章. 粤西庞西垌地区非结构化地质信息机器可读表达与致矿异常区域智能预测[J]. 地学前缘, 2024, 31(4): 47-57 DOI:10.13745/j.esf.sf.2024.5.5

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

长期以来的地质研究和基础调查积累形成了海量的地学数据,包括地质、矿产、遥感、物探和化探数据等,引发了地质大数据挖掘和机器学习专家的重视[1-3]。他们应用机器学习算法的优越性与地质学研究的需要结合,在交叉融合研究方面取得了突破[4-6]

地质数据类型多样性特点明显,地层、岩性和断裂等基础地质数据往往以非结构化形式存在,计算机无法直接应用。因此,如何使非结构化地质数据进行机器可读表达就成为需要攻克的难点。

作者团队曾在钦杭成矿带南段庞西垌地区开展深入的地质矿产远景调查工作,积累较为丰富的第一手资料[7-9]。这为在该区开展地质大数据挖掘和机器学习算法应用提供了便利的条件。

本研究以粤西庞西垌地区为对象,探讨非结构化地质信息面向机器可读的转换处理,并进而应用机器学习算法对综合地质信息进行挖掘,提取致矿异常特征,智能圈定致矿异常找矿靶区。

1 地质背景

庞西垌矿集区位于粤西云开地台的南缘,属于钦杭成矿带南段的矿集区域[10-13]。研究区由文地、石角、塘篷和河唇4个图幅构成(图1)[8],总面积约为1 880 km2。区内金属矿产类型丰富,包括铅、锌、金和硫铁等多金属矿床,是钦杭成矿带南段较为重要的铅锌多金属矿床成矿区。根据前人的野外地质调查及地质剖面测量情况[7-9,13],研究区出露的地层主要为新元古界塘蓬群、泥盆纪老虎头组、信都组、东岗岭组、天子岭组、帽子峰组和石炭纪孟公坳组地层。庞西垌地区中生代地层缺失严重,仅有白垩系罗文组地层出露。研究区经历过多期次的构造运动,断裂和褶皱构造均有发育,研究区内褶皱构造与内生矿产的分布存在明显的空间相关关系,矿床分布多位于北东向及北西向断裂破碎带中或其附近区域,抑或两组断裂交汇处。庞西垌地区岩浆岩广泛发育,出露面积很广,横跨该区4个图幅,侵入岩主要有塘蓬岩体和英桥岩体,主要为加里东、印支期和燕山期产物,呈岩基或岩株状产出,以及星散分布的花岗斑岩脉。

前人研究显示[7-9],庞西垌地区的铅锌矿床主要包括两种类型,即沉积-热液改造型铅锌矿床和热液蚀变夕卡岩型铅锌矿床,研究区内的丰村铅锌矿床以及和寮铅锌矿床分别是这两种类型矿床的代表。

2 研究方法

2.1 单分类支持向量机

本研究中应用了两种异常检测算法。第一种算法为单分类支持向量机(One-Class Support Vector Machine, OCSVM),它是一种无监督分类算法,经常用于解决异常检测和极度不平衡的数据挖掘两方面的问题[14-15]。与经典支持向量机的不同之处在于,单分类支持向量机属于无监督学习,并且其所要分类的类别只有一类。

由于是无监督学习,因此单分类支持向量机不需要对训练样本标记输入标签的[16]。由于只有一类数据的特征信息,与传统支持向量机寻找超平面对数据进行分类的思路不同,它采用支持向量数据描述(Support Vector Data Description, SVDD)。图2[17]展示了SVDD的二维原理。SVDD本质上属于基于边界数据特征的描述方法,其基本思想和理论基础源于支持向量机的经典理论[18-19]

SVDD模型可以描述如下[18]:对于样本数据集N={xi|xiRd,i=1,2,…,N},求N经过非线性映射到高维空间中的,且能够包含N中全部或绝大多数样本的最优超球体F的中心a和半径R,用公式可以表示为

F m i n ( R , a , ξ i ) = R 2 + C i = 1 n ξ i , i = 1 , , n

超球面Fmin满足:

(xi-a)T(xi-a)≤R2+ξi,ξi≥0

式中:ξi为松弛变量,它可以起到避免模型过拟合的作用,当ξi>0时所对应的数据点xi即为异常点;常数C表示调节松弛变量的影响量,它的作用是平衡错分样本的比重大小。

该问题的实质是凸优化问题,可以转化为求拉格朗日极值问题[18],根据建立的超球面函数F,利用拉格朗日乘子法构建拉格朗日函数进行参数Ra的求解:

L ( R , a i , ξ , α , γ i ) = R 2 + C i = 1 n ξ i - i = 1 n a i [ R 2 + ξ i - ( x i - a ) · ( x i - a ) ] - i = 1 n γ i ξ i

式中,ai≥0,ξi≥0,这两个变量为拉格朗日系数。使函数L关于a,R,ξi的偏导数为0并将结果代入式(3)可得

L ( R , a i , ξ , a , γ i ) = i = 1 n a i ( x i · x i ) - i = 1 , j = 1 n a i a j ( x i · x j )

对式(4)进行求解可获得ai的值,训练样本xi与对应的ai可能的关系包括以下3种:

(1)(xi-a)T(xi-a)<R2ai=0;

(2)(xi-a)T(xi-a)=R2⇒0<ai<C;

(3)(xi-a)T(xi-a)>R2ai=C

式中,ai>0的向量称为支持向量(Support Vector, SV)。超球体的构建是基于所有支持向量进行的,超球体的半径R为任何一边界支持向量xm到球心a的距离,用公式表示为[18]

R 2 = ( x m · x m ) - 2 i = 1 n a i ( x i · x m ) + i = 1 , j = 1 n a i a j ( x i · x j )

获得了超球体的中心a与半径R之后,便可对新样本进行测试,根据新样本t到超球体中心的距离进行测试,若新样本t到球心a的距离小于或等于超球体的半径R,则新样本t被标记为正常点,反之,则被标记为异常点。

2.2 自编码网络

自编码网络是本研究中使用的第二种算法。它是一种基于神经网络的无监督分类方法[20],它通过对原始输入进行训练和学习,使其重建的结构接近原始输入[21],其本质是一个信息压缩的过程,通过使用神经网络将高维数据进行编码压缩,进而产生一个高维输入的低维度表示。根据数据压缩前后的重构误差作为异常评价的指标,重构误差大的数据被判定为异常点。

自编码网络包含两个重要的工具模块,分别是编码器和解码器,其模型结构和运行原理如图3[22]所示。

编码过程和解码过程的公式[23]表示如下:

e=σe(Wexx+bex)
d=σd(Wdxe+bdx)

式(6)是编码过程,其中Wexbex为编码过程神经网络的权重和偏置;式(7)表示的是解码过程,Wdx和bdx为解码过程神经网络对应的权重和偏置;σeσd分别表示编码和解码过程中相应的非线性变换函数。

原始输入数据x和经过压缩重构后的输出z之间的差异被称为重构误差,对于样本特征为数值型的变量,可以用平均绝对误差(MAE)来衡量重构误差,其公式可以表示为:

f M A E ( W , b ) = 1 n i = 1 n x i - z i

自编码网络的最终目的是在理想条件下将经过压缩重建后的输出数据z与输入数据x保持一致,而在实际应用中,重建后的输出z与输入数据x并不是完全一致的,原因在于异常样本点与正常样本服从不同的分布,正常样本的重构误差较小,自编码网络能够将正常样本重建还原,而异常样本的重构误差较大,无法将其较好地还原。当重构误差大于某个阈值时,该样本被识别为异常,可以通过重构误差的大小,实现异常的检测与区分。

3 研究区综合地质特征数据处理

3.1 非结构化数据机器可读表达处理结果

3.1.1 地层岩性特征

根据庞西垌地区典型铅锌矿床的成矿地质背景,研究区内的铅锌矿床主要为热液蚀变夕卡岩型和沉积-热液改造型铅锌矿床,矿床的形成主要受到3个条件控制,即围岩条件、岩浆岩条件和构造条件。

对于沉积-热液改造型Pb-Zn矿床,其矿体的形成与分布受泥盆纪含碳质片理化灰岩的影响较大,泥盆系地层是赋矿、容矿的主体。对于热液蚀变夕卡岩型Pb-Zn矿床,新元古代混合岩中所夹薄层状或透镜状大理岩、绢云母石英片岩是其成矿的较理想的围岩,同时矿区花岗岩及其派生的岩脉与成矿关系密切。花岗斑岩和石英斑岩的活动造就成矿,使含矿热液上升交代,在有利地段使铅锌等有用金属富集成矿。

综合以上有利成矿条件,选取新元古界塘蓬群地层、泥盆系帽子峰组、天子岭组、东岗岭组、信都组、老虎头组地层、燕山早期侵入岩、燕山晚期两期侵入岩和新元古代混合岩9种与研究区铅锌矿床成矿密切相关的地层岩性数据。

对研究区内的地层岩性数据,由于其属于地质文本信息,需要转换成结构化的定量数据,这是数学地球科学的基础研究课题,许多学者对其开展过深入的研究工作[24-27]。本研究通过使用特征工程中的独热编码方法对这些文本信息进行编码,将所选取的9种地层岩性信息转化为向量实现结构化处理。经过独热编码转化后的地层岩性信息如表1所示。

3.1.2 断裂构造特征

庞西垌地区铅锌矿床的形成与分布明显受到断裂影响。对于沉积-热液改造型Pb-Zn矿床,矿体的分布受北西向区域断裂控制,远离断裂带矿化减弱,直至无矿化。断裂构造为矿区热液、成矿元素的运移、富集提供了良好的条件,构成了矿区主要的导矿通道。对于热液蚀变夕卡岩型Pb-Zn矿床,矿体的形成受NW向构造线的控制,而更大规模的NE向断裂构造切割了NW向构造,含矿热液便沿NE向构造上升,在次一级的NW向构造中成矿。

对于断裂构造的结构化转换,综合研究区铅锌矿床的控矿构造特征,选取NW向断裂构造作为该区铅锌矿床主要的致矿因素,并对断裂控矿的空间相关性特征进行结构化转换,使其能够更好地表征与研究区内铅锌矿床的联系。首先,以主要控矿断裂的影响范围为自变量建立不同距离的缓冲区进行缓冲区分析;然后根据证据权重模型中的t-统计量来确定研究区中最佳的缓冲区距离和最大缓冲区距离;最后采用空间加权主成分分析中的空间权重变量计算模型计算出变量w的空间权重系数[28-30],定量地约束该区主要的控矿断裂构造对致矿的响应。

具体的步骤为:

(1)根据采样点的采样布局和采样密度以及NW向断裂构造同铅锌矿床(点)之间的空间关系,选取250 m为间隔构建缓冲区;

(2)利用GIS软件从庞西垌区域地质图中提取出NW向断裂,然后进行缓冲区分析,以250 m为间隔构建12个等间隔缓冲区;

(3)引入证据权方法,将所构建的缓冲区与研究区内已知的铅锌矿床(点)进行综合,根据证据权重法的t-统计量指标来衡量所构建的每个累计缓冲区与已知矿床(点)之间的空间相关性,t-统计量的值越大,说明两者间的空间相关性越强,根据前人研究[31-32]可知,当t >1.96时,可认为空间相关性较强,具有显著的统计意义;

(4)根据每个累计缓冲区的t-统计量值确定最佳和最大缓冲区距离d最佳d最大,进而计算出每个累计缓冲区的空间权重变量w

根据构建的庞西垌地区NW向断裂缓冲区距离与区内已知铅锌矿床(点)的t-统计量之间的对应关系(图4),当t=3时,空间相关性最大,对应的缓冲区距离即为最佳缓冲区距离。当距离为2 250 m时,t=2>1.96,依然显示出较强的空间相关性。而当距离介于2 250~3 000 m范围内时,t值均小于1.96,且随距离的增大逐渐减小,指示空间相关性逐渐转为不显著状态,表明随着远离NW向断裂距离的增大,其控矿作用逐渐减弱。根据上述缓冲区距离与t-统计量值的变化趋势,可以确定计算空间权重变量w的关键参数:最佳缓冲区距离d最佳=750 m,最大缓冲区距离d最大=3 000 m,β=1(使得d=2 250 m时的空间权重变量w=0.5,指示中等程度的控矿作用),将这些参数代入空间权重变量计算模型[30]中即可获得不同距离NW向断裂缓冲区的空间权重变量w

将不同缓冲距离的空间权重系数w赋给落在缓冲区内的采样点,实现断裂构造信息的结构化转化,经过转化后的断裂构造信息如表1所示,通过空间分析进行投图可获得庞西垌地区NW向断裂构造的空间权重系数图(图5)。

3.2 水系沉积物地球化学信息

研究区共采集水系沉积物样品7 236个,平均采样密度为4.27个/km2,水系沉积物的采样点分布于水系较发育且无人为污染的一级水系口,对于水系不发育的洼地或山前平地等区域则采用土壤样代替[8]。水系沉积物测量样品的分析项目包括Cu、Pb、Zn、Mn、Sn、W、Ag、Au、As、Sb、Bi、Mo、Hg、F、Ba和B共计16种化学元素。

利用分层聚类对庞西垌地区16种化学元素IDW插值后的数据进行分析,聚类依据是Pearson相关系数。根据聚类结果选取与Pb-Zn相关性较强的元素组合。图6展示了聚类后的结果。可见,元素Pb、Hg和Sb组合在一起,随后又与As组合,元素Ag、Au和Zn被组合在一起。根据前人研究[8],这7种元素组合与研究区内典型的Pb-Zn矿床的矿石矿物及其伴生矿物的元素组成具有一定程度的相关性,其组合与含量的空间分布很可能反映了该区铅锌矿床的分布形式和成矿相关作用,因此选取Ag、Au、Zn等7种元素组合作为主要的地球化学致矿因素,并对其进行Z-score标准化处理。

4 致矿异常区域智能预测

4.1 模型构建

上述地球化学、构造、岩性等地质信息已是机器可读。本研究基于它们进行致矿异常分类模型的构建。采用的算法均为无监督分类算法,无须在训练时进行数据标注。在将数据输入算法运行之前,将数据集划分为训练集和测试集,以避免构建的模型过拟合,同时能更好地进行参数调整与修正,使模型分类的效果更好。

从全部的数据集中随机抽取80%的数据进行训练,模型构建完成后利用剩余的20%数据进行分类模型的效果验证。根据分类的结果绘制出受试者工作特征曲线(Receiver Operator Characteristic Curve,ROC曲线),并以ROC曲线下方的面积(AUC值)作为评价算法模型致矿异常识别效果的量化指标。

对于单分类支持向量机模型而言,其致矿异常识别模型的构建是以超球平面为基础的。将随机抽取的训练集数据进行非线性映射,使其映射到高维空间中,根据高维空间的数据分布寻找一个面积最小的包含绝大多数样本的最优超球面,并以各个样本在高维空间中距离最优超球面中心a的距离作为分类依据进行模型的构建与调整。

对于自编码网络而言,首先对训练集数据进行编码的压缩工作,利用编码器将地球化学、岩性、地层、NW向断裂构造等共计17维数据压缩为4维的潜在空间表征,然后利用解码器对所获得的4维潜在空间表征进行重构还原,最终对重构数据相对原始输入的平均绝对误差(MAE)进行计算,并以MAE的结果作为分类依据进行模型构建和调整。

4.2 模型分类结果

将上述异常检测算法对研究区与铅锌矿床有关的综合地质信息进行处理,获得的致矿异常分类结果如图78所示。

根据训练生成的分类模型,以剩余20%的未训练数据作为验证集检验模型的分类效果。图9展示了根据其结果绘制出单分类支持向量机和自编码网络的ROC曲线。这里引入ROC曲线,并以ROC曲线下方的面积AUC值作为衡量模型稳定性和可信度的量化指标。通常认为,AUC值越高表示模型的性能越好。

4.3 模型结果分析

对于单分类支持向量机的分类结果,红色区域代表异常值较高的区域,表示该区域可能存在潜在的致矿异常,具有一定的成矿潜力。从图7可以看出,综合异常值较高的区域附近往往存在已知的铅锌矿床(点),且有在NW向断裂较密集发育的区域集中分布的趋势。通过与前人研究[33-34]对比发现,在空间分布上,单分类支持向量机的预测结果与前人研究具有良好的一致性,在高异常(红色)区域与该区部分银金矿床的分布吻合。与使用传统勘查方法圈定的地化异常相比,本研究结合了岩性、地层、构造等多源成矿相关信息,识别和提取的致矿异常与成矿作用存在更显著的关系,在未发现矿床的地区可能有更大概率找到潜在的矿床。

单分类支持向量机的ROC曲线下部面积的统计结果(AUC值)为0.77,大于0.75,说明该算法生成的致矿异常预测模型具有较好的稳定性和预测效果。

自编码网络的分类结果是编码和解码之后的重构误差,即两者的平均绝对误差(MAE),误差较大的表示为红色区域,误差较小的表示为蓝色区域。从图8中可以看出,异常的整体分布趋势与前人研究和单分类支持向量机的结果有较强的一致性,且异常高值区附近存在多个已知的铅锌矿床(点)。对比单分类支持向量机对该区域致矿异常的预测,两种方法的预测中共同出现异常的区域可作为发现潜在矿床的高概率区。自编码网络的预测结果相对更为集中,说明该方法识别到的致矿异常特征确实与背景区存在差异,结合该模型所采用的与成矿相关的多源地质特征,这种异常可能综合反映了该区的地化异常以及与成矿相关地质特征(岩性、地层和断裂)的特殊性。

自编码网络预测模型的ROC曲线下部面积的统计结果(AUC值)为0.81,大于0.75,表明该算法具有较好的预测效果,能够对多种来源的综合地质信息进行数据挖掘与集成分析,并能准确识别出其中绝大部分的致矿异常信息,最终将其应用于找矿预测研究。

整体而言,两种算法模型生成的综合异常与研究区内已知铅锌矿床(点)有较强的空间相关关系。两种算法预测的致矿异常区域分布趋势具有较高的一致性和重合度,在之前未发现矿床的区域也圈定出了较好的异常区域。

这两种方法在庞西垌地区铅锌矿床的找矿预测研究方面取得了较为满意的结果,表明本研究所采用的大数据机器学习算法与找矿预测研究相结合是可行的,具有实际应用价值,有助于提高找矿的准确度和工作效率。

5 结论

(1)通过独热编码以及空间加权主成分分析中的权重变量方法的组合应用可以有效实现地层、岩性、断裂构造等地质文本信息的结构化转化。它们与实际地质情况相一致,最大限度地保留了其所包含的地质信息,同时可以更好地应用于空间分析和机器学习算法处理。

(2)研究区内矿点与非矿点数量存在严重的不平衡,通过单分类支持向量机和自编码网络这两种机器学习算法能够有效解决。它们可以对与成矿相关的多源地质数据进行集成与综合,生成的预测结果与研究区铅锌矿床的空间分布以及实际的地质构造情况相对一致,能够有效识别找矿潜力区并寻找潜在的矿床。

(3)与传统的勘查地球化学方法相比,本研究中的分析方法能够处理和集成多源的地质致矿信息,最终的致矿异常识别结果与实际矿床的空间分布吻合较好,并且在之前未发现矿床的地区圈定出较好的异常区域,可作为未来的重点找矿靶区。

参考文献

[1]

周永章, 张良均, 张奥多, 地球科学大数据挖掘与机器学习[M]. 广州: 中山大学出版社, 2018.

[2]

翟明国, 杨树锋, 陈宁华, 大数据时代: 地质学的挑战与机遇[J]. 中国科学院院刊, 2018, 33(8): 825-831.

[3]

成秋明. 什么是数学地球科学及其前沿领域?[J]. 地学前缘, 2021, 28(3): 6-25.

[4]

左仁广. 勘查地球化学数据挖掘与弱异常识别[J]. 地学前缘, 2019, 26(4): 67-75.

[5]

刘艳鹏, 朱立新, 周永章. 卷积神经网络及其在矿床找矿预测中的应用: 以安徽省兆吉口铅锌矿床为例[J]. 岩石学报, 2018, 34(11): 3217-3224.

[6]

周永章, 王俊, 左仁广, 地质领域机器学习、 深度学习及实现语言[J]. 岩石学报, 2018, 34(11): 3173-3178.

[7]

周永章, 李兴远, 郑义, 钦杭结合带成矿地质背景及成矿规律[J]. 岩石学报, 2017, 33(3): 667-681.

[8]

周永章, 张国桓, 吴勇庆, 广东庞西垌地区矿产远景调查报告(文地幅、 石角幅、 塘蓬幅、 河唇幅, 1∶50000)[R]. 北京: 中国地质调查局, 2016.

[9]

周永章, 曾长育, 李红中, 钦州湾-杭州湾构造结合带(南段)地质演化和找矿方向[J]. 地质通报, 2012, 31(2/3): 486-491.

[10]

广东省地质矿产局704地质大队. 中华人民共和国区域地质调查报告1∶50000塘蓬幅[R]. 湛江: 广东省地质矿产局 704地质大队, 1987.

[11]

广东省地质矿产局704地质大队. 中华人民共和国区域地质调查报告1∶50000河唇幅[R]. 湛江: 广东省地质矿产局 704地质大队, 1994.

[12]

广东省地质矿产局. 广东省区域地质志[R]. 北京: 地质出版社, 1988, 941.

[13]

战明国, 彭松柏, 蔡明海, 云开地区重要成矿区带金、 银、 铜、 铅、 锌成矿地质背景及找矿靶区优选研究[M]. 海口: 海南出版社, 2006.

[14]

DAVY M, GODSILL S. Detection of abrupt spectral changes using support vector machines: an application to audio signal segmentation[C]// Proceedings of IEEE international conference on acoustics speech and signal processing. Orlando: IEEE, 2002: 1313-1316.

[15]

LECOMTE S, LENGELLE R, RICHARD C, et al. Abnormal events detection using unsupervised One-Class SVM - Application to audio surveillance and evaluation[C]// Proceedings of 2011 8th IEEE international conference on advanced video and signal based surveillance (AVSS). Klagenfurt: IEEE, 2011: 124-129.

[16]

SCHÖLKOPF B, PLATT J C, SHAWE-TAYLOR J C, et al. Estimating the support of a high-dimensional distribution[J]. Neural Computation, 2001, 13(7): 1443-1471.

[17]

吴定海, 张培林, 任国全, 基于支持向量的单类分类方法综述[J]. 计算机工程, 2011, 37(5): 187-189.

[18]

TAX D M J, DUIN R P W. Support vector data description[J]. Machine Learning, 2004, 54(1): 45-66.

[19]

VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer, 1995.

[20]

RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

[21]

AN J, CHO S. Variational autoencoder based anomaly detection using reconstruction probability[J]. Special Lecture on IE, 2015, 2(1): 1-18.

[22]

VALENTINE A P, TRAMPERT J. Data space reduction, quality assessment and searching of seismograms: autoencoder networks for waveform data[J]. Geophysical Journal International, 2012, 189(2): 1183-1202.

[23]

RIFAI S, VINCENT P, MULLER X, et al. Contractive auto-encoders: explicit invariance during feature extraction[C]// Proceedings of the 28th international conference on machine learning. Bellevue: ACM, 2011: 833-840.

[24]

吴冲龙, 刘刚, 张夏林, 地质科学大数据及其利用的若干问题探讨[J]. 科学通报, 2016, 61(16): 1797-1807.

[25]

王成彬, 马小刚, 陈建国. 数据预处理技术在地学大数据中应用[J]. 岩石学报, 2018, 34(2): 303-313.

[26]

张雪英, 叶鹏, 王曙, 基于深度信念网络的地质实体识别方法[J]. 岩石学报, 2018, 34(2): 343-351.

[27]

张雪英, 张春菊, 汪陈, 面向中文文本的地质语义信息标注与语料库构建[J]. 高校地质学报, 2023, 29(3): 429-438.

[28]

CHENG Q M, BONHAM-CARTER G, WANG W L, et al. A spatially weighted principal component analysis for multi-element geochemical data for mapping locations of felsic intrusions in the Gejiu mineral district of Yunnan, China[J]. Computers and Geosciences, 2011, 37(5): 662-669.

[29]

XIAO F, CHEN J G, ZHANG Z Y, et al. Singularity mapping and spatially weighted principal component analysis to identify geochemical anomalies associated with Ag and Pb-Zn polymetallic mineralization in Northwest Zhejiang, China[J]. Journal of Geochemical Exploration, 2012, 122: 90-100.

[30]

肖凡, 陈建国, 侯卫生, 钦-杭结合带南段庞西垌地区Ag-Au致矿地球化学异常信息识别与提取[J]. 岩石学报, 2017, 33(3): 779-790.

[31]

AGTERBERG F P, BONHAM-CARTER G F, WRIGHT D F. Statistical pattern integration for mineral exploration[M]// Computer applications in resource estimation. Amsterdam: Elsevier, 1990: 1-21.

[32]

BONHAM-CARTER G F. Geographic information systems for geoscientists: modelling with GIS[M]. Amsterdam: Elsevier, 1994.

[33]

YU X T, XIAO F, ZHOU Y Z, et al. Application of hierarchical clustering, singularity mapping, and Kohonen neural network to identify Ag-Au-Pb-Zn polymetallic mineralization associated geochemical anomaly in Pangxidong district[J]. Journal of Geochemical Exploration, 2019, 203: 87-95.

[34]

余晓彤, 肖凡, 周永章, 粤西庞西垌地区银金地球化学异常信息挖掘与提取[J]. 地质与勘探, 2019, 55(1): 77-86.

基金资助

国家重点研发计划项目(2022YFF0801201)

国家自然科学基金重点项目(U1911202)

广东省重点领域研发计划项目(2020B1111370001)

AI Summary AI Mindmap
PDF (6558KB)

426

访问

0

被引

详细

导航
相关文章

AI思维导图

/