基于机器学习的贵州省萤石矿稀土元素判别模型

吕代和 ,  田倩 ,  刘雨 ,  刘刚 ,  周琦 ,  祁连素

地球科学 ›› 2026, Vol. 51 ›› Issue (03) : 1093 -1109.

PDF (2694KB)
地球科学 ›› 2026, Vol. 51 ›› Issue (03) : 1093 -1109. DOI: 10.3799/dqkx.2026.053

基于机器学习的贵州省萤石矿稀土元素判别模型

作者信息 +

Machine Learning-Based Discrimination Model for Rare Earth Elements of Fluorite Deposits in Guizhou Province

Author information +
文章历史 +
PDF (2758K)

摘要

贵州西部萤石矿集区内新识别出的隐爆角砾岩型萤石矿具有巨大的找矿潜力.然而该类型萤石矿角砾状构造、热液蚀变等特征易与其他热液角砾岩型矿床或强烈构造改造的脉型矿床相混淆,如何准确识别研究区内隐爆角砾岩型和与盆地卤水相关热液填充型萤石矿是实现贵州省萤石矿找矿突破的关键科学问题之一.本文通过对系统收集的隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型三种成因类型萤石矿的稀土元素数据进行支持向量机和随机森林机器学习分类模型对比研究,并结合基于主成分分析的统计分析、降维可视化和稀土元素分离度评分体系定量评估进行综合研究.结果显示支持向量机构建的判别模型准确率与稳定性均显著优于随机森林,可以更加有效地判别这三种成因类型萤石矿,并识别出可用于区分三种成因类型萤石矿的关键元素精炼候选池,构建出了新的Tb/Dy-Sm/Yb、δCe-Sm/Yb、δCe-Sm/Tm、δEu-Sm/Lu判别图,后续实验也验证了该方法可以有效区分隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型萤石矿.

Abstract

The newly identified cryptic explosive breccia-type fluorite deposits in the western Guizhou fluorite ore concentration area possess significant prospecting potential. However, the brecciated textures, hydrothermal alteration, and other characteristics of this type of fluorite deposit are easily confused with those of other hydrothermal breccia-type deposits or intensely structurally altered vein-type deposits. Therefore, accurately distinguishing between cryptic explosive breccia-type fluorite deposits and basin brine-related hydrothermal filling-type fluorite deposits in the study area is one of the key scientific challenges for achieving breakthroughs in fluorite prospecting in Guizhou Province. This paper conducts a comparative study of Support Vector Machine (SVM) and Random Forest machine learning classification models using systematically collected rare earth element (REE) data from three genetic types of fluorite deposits: cryptic explosive breccia-type, magmatic hydrothermal-related filling-type, and basin brine-related hydrothermal filling-type, which is combined with comprehensive analysis, including statistical analysis based on Principal Component Analysis (PCA), dimensionality reduction visualization, and quantitative evaluation using an REE separation scoring system. The results indicate that the discriminant model constructed by SVM exhibits significantly higher accuracy and stability compared to Random Forest, enabling more effective discrimination among these three genetic types of fluorite deposits. Furthermore, it identifies a refined candidate pool of key elements that can be used to distinguish them. Newly constructed discriminant diagrams (Tb/Dy vs Sm/Yb, δCe vs Sm/Yb, δCe vs Sm/Tm, δEu vs Sm/Lu) have been developed, which effectively differentiate among cryptic explosive breccia-type, magmatic hydrothermal-related hydrothermal filling-type, and basin brine-related hydrothermal filling-type fluorite deposits.

Graphical abstract

关键词

隐爆角砾岩型萤石矿 / 稀土元素 / 地球化学数据 / 机器学习 / 矿床成因类型 / 贵州.

Key words

cryptoexplosive breccia⁃type fluorite deposits / rare earth elements / geochemical data / machine learning / genetic types of mineral deposits / Guizhou.

引用本文

引用格式 ▾
吕代和,田倩,刘雨,刘刚,周琦,祁连素. 基于机器学习的贵州省萤石矿稀土元素判别模型[J]. 地球科学, 2026, 51(03): 1093-1109 DOI:10.3799/dqkx.2026.053

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

萤石作为关键的战略性非金属矿产资源,是现代氟化工产业的基石,被广泛应用于冶金、新能源、半导体、航空航天及国防工业等关键领域.根据美国地质调查局(USGS)最新发布的《矿物商品概要》,萤石的全球供需格局日趋紧张,其战略价值在各主要经济体中愈发凸显(U.S. Geological Survey, 2024).在此背景下,中国作为全球最大的萤石生产国与消费国,其资源安全态势尤为引人关注.然而,中国萤石矿资源正面临富矿资源逐渐枯竭、找矿勘查难度增大的严峻挑战.保障国家资源安全,实现萤石矿找矿突破已成为当前最紧迫的任务之一.贵州西部地处扬子地块西南缘,属特提斯与环太平洋两大成矿域的交汇部位,区内深大断裂发育,中生代岩浆活动频繁,为萤石成矿提供了优越的地质条件,是华南重要的萤石矿集区之一(周祖虎等, 2024;图1).根据陈毓川院士的系列成矿理论,综合考虑萤石矿床的成因类型和工业类型,王吉平等(2014)将中国萤石矿床划分为沉积改造型、热液充填型和伴生型3种矿床类型.近期研究显示贵州萤石矿以与盆地卤水相关热液填充型为主(郭宇等,2023),但在该类型萤石矿传统成矿理论的指导下,贵州省萤石矿找矿勘查工作一直未有大的突破.近年来,贵州西部一种与隐伏中‒酸性岩体密切相关的隐爆角砾岩型萤石矿逐渐被识别和重视,该类型萤石矿具有巨大找矿潜力(祁连素等,2025).此类矿床常形成于浅成‒超浅成环境,其形成机制与液压致裂、流体超压等作用密切相关,并常与火山‒岩浆弧环境中的角砾岩型矿床具有相似的成因.在宏观上,其角砾状构造、热液蚀变等特征又易与其他热液角砾岩型矿床或强烈构造改造的脉型矿床相混淆.因此,发展一种能够精准判别萤石矿成因类型,特别是有效识别隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型萤石矿的新方法,对于实现贵州省萤石矿找矿突破具有十分重要的意义.

萤石的稀土元素(REE)和钇(Y)含量及其配分模式,对其形成环境的物理化学条件(如温度、氧逸度、流体组成)具有高度敏感性,因而被广泛用作示踪其成因的“地球化学指纹”.为系统判别萤石的成因类型,研究者们自20世纪70年代起建立了一系列行之有效的地球化学指标.经典的地球化学判别工作主要侧重于利用稀土元素比值进行鉴别,例如Möller et al.(1976)提出的Tb/Ca⁃Tb/La图解,以及后续发展的Y/Ho比值和Eu异常等参数(Bau and Möller, 1992),被成功用于区分沉积型、热液型及与花岗岩相关的萤石矿床.然而,随着地球化学数据的海量积累与对地质系统复杂性认知的深化,传统判别图解的局限性日益凸显.首先,这些方法本质上是信息降维工具,将高维的元素组合关系压缩至二维平面,不可避免地导致关键地球化学信息的损失,难以捕捉多变量协同演化的内在规律;要解决这一问题,亟须引入能够处理高维、非线性关系的新分析方法(Carniel and Guzman, 2021).其次,图解中的判别边界多依赖于经验性划定,存在显著的主观性,当应用于新的地质背景时,其稳定性和普适性常面临挑战(Wang and Glover, 1992).尤为关键的是,地质过程普遍具有非线性与多期次叠加的复杂特征,其产生的地球化学响应无法被简单的线性边界有效分割.Petrelli et al.(2017)在复杂火山区的年代学研究中引入了能够处理复杂非线性关系的机器学习方法,从宏大的地球化学数据集中有效厘清多期地质事件的叠加印记,而这已完全超出了传统图解法的能力范围.

为了克服这些基于经验图解的局限性,机器学习作为能够从高维、复杂数据中挖掘隐藏模式的强大工具,为地球化学成因判别提供了新范式.特别是在利用地球化学数据进行地质体与矿床类型的智能分类方面,机器学习已展现出超越传统方法的显著优势.这类研究通常遵循相似的技术路径:即基于已知成因类型的样本地球化学数据(如主微量元素、稀土元素),训练监督学习模型,以实现对未知样本的成因判别.例如,在岩石成因分类方面,Huang et al. (2019)基于铁氧化物的微量元素数据,采用偏最小二乘判别分析(PLS⁃DA)方法,成功区分了IOCG与IOA矿床及对应的热液蚀变类型,展示了统计判别方法处理矿物地球化学数据、实现矿床亚型区分的潜力,这一特性对于样本收集困难的矿床研究尤为重要.在矿床类型区分方面,Hu et al. (2022) 应用机器学习分析方法,基于高钛磁铁矿的微量元素组成有效区分其成因类型,并利用模型分析,揭示了关键判别元素特征.类似地,Hong et al. (2021) 则利用磁铁矿成分数据,通过随机森林算法对IOCG、IOA等不同矿床类型进行了高精度分类.近期,这一方法被进一步推广到对成矿系统中有重要指示意义的蚀变矿物研究中.例如,侯霖莉等(2024)直接聚焦于热液矿床中常见的绿泥石,系统比较了多种机器学习算法,并基于其微量元素数据成功实现了对斑岩型、矽卡岩型等不同矿床类型的判别,为利用单矿物开展矿床成因智能识别提供了新的范例.这些研究共同表明,以SVM、RF为代表的机器学习方法,能够有效捕捉多元素协同演化的复杂非线性关系,从而超越传统二元图解的经验性线性边界,实现更精细、更客观的成因识别.尤其值得注意的是,近期研究进一步表明,即便在训练样本有限的情况下,SVM与RF仍能保持出色的性能(Lachaud et al., 2023),这为将此类方法应用于类似萤石矿等样本量常受局限的矿床研究提供了关键信心.Zuo and Carranza(2023)也指出,基于机器学习的地球化学智能分类方法在矿产勘查研究中正发挥着日益重要的作用.

机器学习技术在处理高维、非线性地球化学数据方面展现出巨大优势,然而在萤石矿成因研究中该技术的应用仍存在空白.萤石矿的成因判别亟须从传统的二元图解迈向多变量综合建模,但目前绝大多数研究停留在“纯数据驱动”的层面,未能将深刻的地质成因知识(如隐爆角砾岩型矿床独特的形成机制)系统地嵌入到机器学习模型的构建与解释中.未来矿产预测的方向是构建“数据‒知识双驱动”模型,以耦合人工智能的强大计算能力与成矿系统理论的因果框架(Zuo et al.,2025).因此,在非金属矿产领域,特别是在贵州西部这一典型萤石矿矿集区,探索一种以地质知识为指导、以数据算法为引擎的双驱动判别模型,不仅具有方法论的创新性,更是实现找矿突破的迫切需求.

为达成上述目标,本研究设计了一套系统的研究方案(图2),其核心在于遵循“探索、预测、验证”的递进逻辑,将数据驱动发现与地球化学机理阐释深度融合.研究将以一个涵盖全国典型矿床的146件样品的标准化稀土元素数据集为基础.首先,运用主成分分析(Principal Component Analysis,PCA)对高维数据进行无监督探索,揭示控制矿床类型分异的主要元素组合与宏观成因空间结构,为后续分析提供降维特征与结构洞察.继而,以此为基础引入支持向量机与随机森林的机器学习算法,构建高精度成因分类模型,并通过特征重要性分析,从全局视角智能筛选出对判别决策贡献最大的关键地球化学指标.最终,基于机器学习所揭示的关键指标,进行系统性的地球化学比值投图与定量分离度评估,一是验证模型所发现关键元素在二维空间中的实际判别效能;二是将数据驱动的智能模型结果转化为地质学家可直观理解与应用的高效判别图解.

1 萤石矿数据集构建

为系统对比隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型萤石矿的地球化学特征,本研究整合构建了一个包含146个萤石样品稀土元素(REE)数据的专用数据集.所有数据均来源于已公开发表的学术文献,涵盖了来自中国24个典型矿床的样品,具有良好的区域代表性和成因类型代表性.其中,研究涉及5个隐爆角砾岩型萤石矿床,均集中于黔西南矿集区;11个与盆地卤水相关的热液填充型矿床,广泛分布于黔东北、塔里木盆地西缘、川西南、渝东南、浙东及皖南等多个地区;8个与岩浆热液相关的热液充填型矿床,主要分布于闽北、内蒙古(大兴安岭成矿带)及浙中地区(表1).

本数据集所采用的具体地球化学指标包括:15个稀土元素含量:La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、Y;4个关键地球化学参数:ΣREE、LREE/HREE、δEu、δCe.

本数据集系统性地汇集了三种主要成因类型的代表性样本,其稀土元素组成显示出较大的成分变化范围,为从地球化学行为上揭示三种萤石矿的成因差异提供了可靠的数据支撑.

2 实验方法

2.1 数据预处理

为确保后续分析的可靠性,对原始数据集进行了系统预处理,包括数据质量评估、基于地质约束的缺失值填补及结果验证.原始数据集包含146件样品,涵盖三种成因类型:与岩浆热液相关热液充填型(49件)、与盆地卤水相关热液填充型(48件)及隐爆角砾岩型(49件).初步评估显示,所有稀土元素(La~Lu)数据完整,但Y元素存在20个缺失值(缺失率13.70%).

为解决Y元素的缺失问题,本文采用了类型特异性的比值关系填补策略.基于Y与Ho在球粒陨石中具相近丰度且在流体中地球化学行为相似这一原理(Bau and Dulski, 1995),分别从三类矿床的完整样本中,计算出其特有的Y/Ho比值中位数(隐爆角砾岩型为79.8,与岩浆热液相关热液充填型为40.3,与盆地卤水相关热液填充型为91.1).这一显著的比值差异,为在填补过程中保持不同类型矿床的固有地球化学特征提供了关键依据.随后,基于下式对缺失的Y值进行填补:

           Y填补=HO×YHO类型中位 .

在数据填补的基础上,本研究系统计算了系列关键地球化学参数.所有参数计算均以Boynton(1984)球粒陨石标准化值为基础,以消除原始丰度差异,凸显地球化学分异特征.计算参数主要包括以下三类:

(1)稀土元素总量表征总体富集程度:

           ΣREE = Lan-Lun .

(2)轻重稀土分异程度通过下式量化:

LREEHREE = Lan+Cen+Prn+Ndn+Smn+EunGdn+Tbn+Dyn+Hon+Ern+Tmn+Ybn+Lun .

(3)异常参数体系包含两个关键指标:

           δEu =EunSmn × Gdn
           δCe =CenLan × Prn .

填补完成后的数据集经验证,其统计特征与各自矿床类型的已知地球化学背景一致,数据完整率达100%,为后续多维分析奠定了可靠的数据基础.

2.2 主成分分析(PCA)

为从无监督学习的视角,全局性地探索高维地球化学数据的内部结构、识别主导变异模式并评估矿床类型的自然可分性,本研究采用了PCA这一经典的多元统计方法(Jolliffe and Cadima, 2016).

分析共纳入19个地球化学变量,包括15个稀土元素,以及ΣREE、LREE/HREE、δEu、δCe这4个衍生参数.在分析前,所有变量均经过Z⁃score标准化以消除量纲影响.分析基于变量的相关矩阵进行,并依据广泛使用的Kaiser准则(保留特征值大于1的主成分)提取关键主成分.第i个主成分(PCi)是原始变量的线性组合:

           PCi=ai1X1+ai2X2++aipXp

其中,PCi代表第i个主成分,X1,X2,,Xp代表标准化后的上述19个地球化学变量,ai1,ai2,,aip是第i个主成分对应于各原始变量的系数,也称为载荷,它们构成了该主成分的方向.载荷向量满足单位化条件,即ai12+ai22++aip2=1.

此变换要求满足以下条件:第一主成分(PC1)的方差最大,即保留了原始数据中最多的变异信息;后续的每个主成分均在与前面所有主成分正交(不相关)的方向上,拥有剩余变异中的最大方差.各主成分的方差贡献率计算如下:

           方差贡献PCi=λik=1pλk

其中,λi是第i个主成分对应的特征值,其大小正比于该主成分所承载的原始数据变异量.

对PCA结果的解读主要围绕两个方面:(1)通过审视关键主成分上具有高载荷的变量组合,可以识别出控制三类萤石矿地球化学分异的主导因子;(2)通过计算并可视化样本在主成分空间中的得分,可以在低维空间中直观评估不同成因类型萤石矿的分布模式与分离趋势,从而为后续有监督的机器学习分类提供先验洞察.

2.3 地球化学图解

地球化学图解方法是矿床成因研究中长期采用的重要分析手段,常用于揭示不同流体来源或成矿过程所导致的元素分异特征.在本研究中,笔者将结合箱线图与元素比值投图,对三类萤石矿在关键地球化学参数上的差异进行对比分析.

箱线图用于表征单一参数的分布特征,通过比较不同矿床类型样本的中位数、四分位距及整体分布范围,定性识别具有判别意义的地球化学指标.比值投图通过将样品投点于由两种具有不同地球化学行为的元素或参数构成的二维空间中,以其分布模式反映潜在的成因差异.

传统判别图中的边界多基于经验归纳,其适用性可能受具体地质背景的影响.因此,本研究引入定量分离度指标,对不同参数组合的判别效能进行客观评估.指标通过计算所有矿床类型两两组合的相对分离程度来评估判别空间的整体分类效能.对于任意两类矿床ij,其分离度计算公式如下:

          Dij=lgX˜i-lgX˜j2+lgY˜i-lgY˜j212σlgX˜i2+σlgY˜i2+σlgX˜j2+σlgY˜j2

其中,分子项计算两类矿床分布中心间的欧氏距离:X˜iY˜j:表示第i类矿床在XY参数上的中位数.X˜jY˜j:表示第j类矿床在XY参数上的中位数;分母项计算两类矿床离散度的平均值:σXiσYi:表示第i类矿床在XY参数上的标准差.σXjσYj:表示第j类矿床在XY参数上的标准差.

在获得所有类别对(共3对)的两两分离度Dij后,最终的综合分离度被定义为它们的算术平均值:

           D综合=13D12+D13+D23 .

基于多组参数组合的判别能力量化分析与比对,可筛选出最优判别能力的参数组合.为规避元素重复使用引发的多重共线性问题,同时保障所选组合的地质代表性与信息互补性,本研究在筛选过程中确立以下四项规则:(1)元素非重叠原则:两个比值的所有元素(分子+分母)需完全不重叠,杜绝核心元素重复共享;(2)逆比值排除原则:剔除互为倒数的比值配对(如Tb/Dy与Dy/Tb),规避完全线性相关;(3)锚定比值‒衍生簇归并原则:识别高频“锚定比值”,将与同一锚定比值配对且由相同元素子集构成的多个比值归为“衍生簇”,每个衍生簇仅保留分离度评分最高的组合;(4)参数出现频率限制原则:设定单个参数的最大出现次数阈值,超过阈值时仅保留该参数参与的最高分离度组合.上述规则的核心目的,一方面避免核心元素反复共享引发重复性判别图解,另一方面防止高得分重复图解掩盖其他元素图解的有效信息,最终保障图解分析结果的客观性、可比性及地质判别信息的多样性.

2.4 机器学习分类模型

为构建高鲁棒性的成因类型判别模型,采用SVM与RF两种监督学习算法进行建模与对比.

在模型构建过程中,将146个样本的数据集按7∶3的比例随机划分为训练集(102个样本)与测试集(44个样本).训练集用于模型的参数学习与优化调整,测试集则作为未参与建模的“未知”地质样本,用于公正评估模型的泛化能力.

支持向量机算法的核心优势在于其通过核函数技巧将原始数据映射到高维特征空间,并在此空间中构建能够最大化分类间隔的最优超平面(Cortes and Vapnik, 1995).其决策函数可表述为:

           fx=signi=1nαiyiKxi,x+b

其中,xi为支持向量,yi为其类别标签,αi为拉格朗日乘子,b为偏置项,Kxi,x为核函数.本研究选用应用广泛的径向基核函数来处理预期的复杂非线性边界,其定义如下:

           Kxi,xj=exp -γxi-xj2 .

通过网格搜索结合五折交叉验证,对惩罚参数C与核参数γ进行协同优化,旨在最大化分类精度与控制模型复杂度之间取得最佳平衡.

随机森林是一种集成学习算法,它通过构建多棵决策树并综合其预测结果(如多数投票)来提升模型的准确性与稳定性(Breiman, 2001).该算法在构建每棵树时,同时进行样本和特征的随机抽样,这一机制使其天然具备良好的抗过拟合能力.节点分裂依据基尼不纯度最小化原则进行:

           Ginit=1-i=1cpi|t2

其中,pi|t为节点t中属于类别i的样本比例.

特征重要性评估采用置换重要性方法,通过随机置换某一特征的取值,观察模型性能的变化来评估该特征的贡献度(Altmann et al., 2010).设训练好的支持向量机分类器为f,测试集Dtest={(xi,yi)}i=1m,基准性能为Sbase=Af,Dtest.对于每个特征j,进行n次置换实验:在第k次实验中,置换特征j的取值得到扰动数据集Dtestj,k,并计算性能Spermj,k.特征j的重要性得分为:

           IJ=1nk=1nSbase-Spermj,k .

模型评估采用全面量化指标,包括准确率、精确率、召回率与F1分数,在独立测试集上对最终模型性能进行综合评价.此外,通过五折交叉验证获得的平均准确率及其标准差,进一步评估模型在不同数据子集上的稳定性,确保所建模型具有可靠的地质应用价值.

3 结果与讨论

3.1 基于主成分分析的矿床成因空间构建

为探索不同成因类型萤石矿的微量元素组合特征差异,并识别对分类贡献最大的变量,本研究首先对全部样本的稀土元素数据进行了主成分分析.

对标准化后的稀土元素数据进行PCA计算,前两个主成分(PC1与PC2)累计方差贡献率达到75.22%,能够充分表征原始数据的主要信息,其结果适用于进一步的二维可视化与解释.PCA方差解释率图(图3)直观表明,前两个主成分的贡献率显著高于后续成分,证明选取其进行分析是高效且合理的.各主成分的方差贡献率及关键变量的载荷特征如表2所示.具体载荷如图4所示.

在明确了主成分的地球化学意义后,基于PC1和PC2绘制的样本得分图(图5)进一步直观地展示了三类矿床的分布关系.

隐爆角砾岩型矿床(红色样本)显示出高度的内在均一性,其绝大部分数据点紧密聚集在PC1值较低(约-2.5至0)且PC2值接近0(约-1至+0.5)的核心区域内,形成一个致密的群落,仅有极少数样本点(例如PC2>7或PC1>4的点)离散在主群之外.

与盆地卤水相关的热液填充型矿床(绿色样本)形成了一个相对集中的分布带.它们主要分布在PC1的负半轴(-3至0),但在PC2维度上表现出向上方的延伸(0至8).

与岩浆热液相关的热液充填型矿床(蓝色样本)则表现出显著的空间分异性,其分布可大致分为两个部分:相当一部分蓝色样本密集投点于坐标轴中心附近(PC1: -3至0, PC2: -2至1),与隐爆角砾岩型矿床(红色样本)的核心聚集区发生严重重叠;其余的蓝色样本呈现出极广泛的离散分布.这些数据点主要沿着PC1的正方向显著延展(最大值接近17),并散布于第一象限(高PC1、正PC2)和第四象限(高PC1、负PC2),构成了整个图表中离散度最大的数据序列.

PCA实验将高维稀土元素数据降维成两个具有明确地球化学意义的主成分(累计方差贡献率达75.22%).PCA作为一种无监督学习方法,成功揭示了数据集中最主要的元素共生结构与矿床类型的宏观分布框架.然而,其本质上是一种探索性工具,无法为未知样本提供明确的分类规则.为此,需要引入能够进行定量预测的监督学习方法.

3.2 基于机器学习模型的矿床类型判别与要素识别

本研究选取支持向量机与随机森林两种典型的机器学习算法,系统构建萤石矿床类型三分类判别模型并进行对比分析.实验数据集包含146个萤石矿样本,涵盖19项地球化学特征参数,样本涵盖与岩浆热液相关的热液充填型、与盆地卤水相关的热液填充型与隐爆角砾岩型三类矿床.为保障模型评估的稳健性,本文采用分层抽样策略,将完整数据集按7∶3的比例划分为训练集与测试集,其中,训练集包含三类矿床样本各34个;测试集样本则包含与岩浆热液相关的热液充填型15个、与盆地卤水相关的热液填充型14个及隐爆角砾岩型 15个.此外,模型构建过程中引入了5折交叉验证,以进一步验证其预测性能.

在模型构建前,首先对19个地球化学特征进行系统的相关性分析,结果如图6所示.

两种模型在测试集上的性能对比如表3所示.SVM与RF均展现出可靠的分类性能,其中SVM的准确率、召回率与F1分数均达93.18%,精确率为93.32%;RF的准确率与召回率为88.64%,精确率为90.37%,F1分数为87.97%,整体而言SVM的综合分类表现更优.在评估模型稳健性与泛化能力的五折分层交叉验证中,SVM的平均准确率为87.29%(标准差为±0.078 3%),RF为87.33%(标准差为±0.088 0%),二者平均准确率相当,仅在结果稳定性上存在细微差异.

混淆矩阵分析(图7)揭示了两种模型在不同成因类型上的分类差异.SVM展现出较为均衡的分类性能:对隐爆角砾岩型样本实现了100%的准确识别;在与岩浆热液相关的热液充填型样本中仅出现1例误判,在与盆地卤水相关的热液填充型样本中出现2例误判,误判数量较少且分布相对均匀,反映出模型具备较好的泛化稳定性.相比之下,RF表现出明显的类型特异性判别特征:其对隐爆角砾岩型以及与岩浆热液相关的热液充填型样本均实现了100%正确分类,显示出针对这两类样本的强判别能力;然而,全部误判样本(共5例)均集中于与盆地卤水相关的热液填充型,表明RF对该类样本的判别鲁棒性相对有限,其分类性能对于不同成因类型样本存在显著差异.

基于支持向量机计算的置换重要性排序结果(图8)表明,Eu、Yb、Tm、δCe、Lu是判别矿床类型最具贡献的五个特征.这一结果从高维、非线性的模型视角,量化了各元素在分类决策中的相对重要性.

由于稀土元素(REE3+)与Ca2+的离子半径相近,稀土元素通常以类质同象的方式进入萤石晶格中导致萤石富含REE和Y元素.此外,不同地质环境下形成的萤石存在明显的地球化学差异(Möller et al., 1976Bau and Dulski, 1995).萤石矿稀土元素组成在热液萤石矿床中可以有效指示其成矿过程中的物理化学条件变化、成矿流体运移与演化、水‒岩反应等过程(刘道荣等, 2023).因此,萤石矿中的REE+Y元素可以有效区分隐爆角砾岩型、与岩浆相关的热液充填型和与盆地卤水相关的热液填充型萤石矿.基于现有地球化学元素成因判别二元模型,La/Yb⁃ΣREE图解可以有效识别萤石矿成因为与玄武岩、沉积岩和钙质泥岩、花岗岩、金伯利岩还是碳酸岩相关.Möller et al.(1976)基于全球超过150件萤石样品数据,构建了以Tb/Ca和Tb/La原子比为参数的成因判别二元模型,可以有效识别伟晶气液、热液和沉积成因.Tb/Ca比值可指示成矿流体的水‒岩反应作用及稀土元素在流体中的络合吸附作用;而Tb/La比值则可反映稀土元素的分馏程度及萤石的结晶序列(Möller et al., 1976).Tb/La⁃Sm/Nd图解则被有效用于区分萤石矿不同成矿阶段(帅秋燕等, 2025).此外,δEu和δCe的异常可以指示萤石成矿流体温度和氧化还原条件(Bau and Möller, 1992).前人通过传统数理统计识别出了与萤石矿成因密切相关的La、Yb、Tb、ΣREE、Sm、Nd、δEu和δCe稀土元素参数,而SVM模型计算的置换重要性排序结果显示Eu、Yb、Tm、δCe、Lu是判别矿床成因类型最具贡献的五个特征参数.SVM模型不仅识别出传统数理统计中可以有效判别萤石矿成因的相关参数(Yb、δCe等),同时也识别出其他可以用于判别的稀土元素参数(Tm、Lu).Yb、Tm、Lu同属HREE元素,通常具有相似的化学性质,不仅受成矿流体中络合物的影响,同时也受到矿物沉淀过程的控制(Schwinn and Markl, 2005),三种不同成因类型的萤石矿床具有明显不同的成因机制与成矿过程,因此这些元素可以很好地用来判别三种不同成因类型的萤石矿床.

3.3 关键判别元素的分布特征与地球化学意义

基于对研究数据的分析,三类萤石矿床的稀土元素含量表现出明显的差异性.所有15种稀土元素在不同矿床类型间均具有统计显著性差异,且呈现出清晰的分布模式(表4):与岩浆热液相关的热液充填型矿床普遍富集所有稀土元素,其含量约为隐爆角砾岩型矿床的1.38~10.11倍,这一富集趋势在重稀土段(如Yb、Lu)尤为显著,比值分别高达10.03和10.11;与盆地卤水相关的热液填充型矿床则整体贫化稀土元素,其含量多为隐爆角砾岩型矿床的0.19~0.75倍,但Eu元素构成显著例外,其含量约为隐爆角砾岩型矿床的2.46倍,显示出独特的正Eu异常;隐爆角砾岩型矿床的地球化学特征则稳定地介于二者之间.

为直观展示三类矿床稀土元素的分布特征,笔者绘制了所有15种稀土元素的中位数对比图(图9)和箱线图(图10).由于不同稀土元素的绝对含量差异可达三个数量级,直接使用原始数据绘制箱线图会导致低含量元素的分布特征被掩盖.因此,笔者对所有数据进行了球粒陨石标准化处理以及以10为底的对数变换处理(log₁₀),将数据压缩到相近的数值范围,使所有稀土元素的分布特征都能在同一图中清晰展示.

3.4 基于比值投图的成因判别

为将前述数据驱动分析的发现转化为具象化、可应用的地球化学判别工具,本研究采用了一种完全量化的策略来构建候选元素集.具体而言,笔者依据模型的贡献率与重要性排序,分别从PCA的PC1、PC2以及SVM模型中遴选核心元素:从贡献了57.08%方差的PC1中选取载荷前五的元素(Tb、Dy、Ho、Sm、ΣREE),从贡献了18.14%方差的PC2中选取前五的元素(LREE/HREE、Eu、δEu、La、Ce),同时从高性能SVM中选取置换重要性前五的元素(Eu、Yb、Tm、δCe、Lu).在合并去重并考虑地质意义的基础上,笔者进一步优化了候选元素集,移除了Eu和Ce两个元素,以避免与已包含的δEu和δCe在信息上产生冗余.最终形成了一个包含12个关键参数(Tb、Dy、Ho、Sm、ΣREE、LREE/HREE、δEu、La、Yb、Tm、δCe、Lu)的精炼候选池.

通过对该集合中的所有元素进行系统性两两配对与分离度定量计算,笔者客观地评估了多种二维元素组合的判别效能(表5).

实验结果显示,Tb/Dy与Sm/Yb的元素比值组合以2.974 1的分离度评分显著优于其他配对,展现出最佳的三类矿床区分能力(图11a).在其余优选组合中,δCe与Sm/Yb组合以2.644 0的分离度位列第二(图11b),第三至第四名依次为:δCe与Sm/Tm组合(分离度2.214 6,图11c)、δEu与Sm/Lu组合(分离度1.921 4,图11d),上述组合均显示出良好的类型区分能力.

4 结论

(1)通过从已发表的学术论文中收集隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型萤石矿稀土元素地球化学数据,构建萤石矿稀土元素地球化学数据集.基于该数据集采用支持向量机算法进行矿床成因类型分类,提出了一个用于有效区分三种类型萤石矿的稀土元素判别模型.

(2)通过PCA分析对19个地球化学变量进行统计分析和降维可视化,并结合支持向量机模型特征元素重要性排序,识别出可用于区分三种成因类型萤石矿的12种关键参数(Tb、Dy、Ho、Sm、ΣREE、LREE/HREE、δEu、La、Yb、Tm、δCe、Lu).

(3)基于形成的精炼候选池,采用分离度评分体系进行定量评估,新构建了Tb/Dy vs Sm/Yb、δCe vs Sm/Yb、δCe vs Sm/Tm、δEu vs Sm/Lu对数判别图,可以有效区分隐爆角砾岩型、与岩浆热液相关的热液充填型和与盆地卤水相关热液填充型萤石矿.

参考文献

[1]

Altmann, A., Toloşi, L., Sander, O., et al., 2010. Permutation Importance: A Corrected Feature Importance Measure. Bioinformatics, 26(10): 1340-1347. https://doi.org/10.1093/bioinformatics/btq134

[2]

Bai, Y., 2020. Geological Characteristics and Structural Ore⁃Control Regularity of Fluorite Deposits in Northern Siziwang Banner, Inner Mongolia (Dissertation). China University of Geosciences, Beijing (in Chinese with English abstract).

[3]

Bau, M., Dulski, P., 1995. Comparative Study of Yttrium and Rare⁃Earth Element Behaviours in Fluorine⁃Rich Hydrothermal Fluids. Contributions to Mineralogy and Petrology, 119(2): 213-223. https://doi.org/10.1007/BF00307282

[4]

Bau, M., Möller, P., 1992. Rare Earth Element Fractionation in Metamorphogenic Hydrothermal Calcite, Magnesite and Siderite. Mineralogy and Petrology, 45(3): 231-246. https://doi.org/10.1007/BF01163114

[5]

Breiman, L., 2001. Random Forests. Machine Learning, 45(1): 5-32. https://doi.org/10.1023/A:1010933404324

[6]

Boynton, W. V., 1984. Cosmochemistry of the Rare Earth Elements: Meteorite Studies. Elsevier, Amsterdam. https://doi.org/10.1016/b978⁃0⁃444⁃42148⁃7.50008⁃3

[7]

Cai, H. J., Zhang, B. G., Li, Y. S., 1996. REE Geochemistry of Fluorite in Stibnite⁃Fluorite Paragenetic Deposits. Geology⁃Geochemistry, 24(2): 103-106 (in Chinese with English abstract).

[8]

Carniel, R., Guzmán, S. R., 2021. Machine Learning in Volcanology: A Review. In: Németh, K., ed., Updates in Volcanology: Transdisciplinary Nature of Volcano Science. IntechOpen, London. https://doi.org/10.5772/intechopen.94217

[9]

Chen, D., Liu, Z. C., Tang, Z. C., et al., 2023. Rare Earth Element Geochemical Characteristics of Fluorite Deposits in Fuyang Area, Wuchuan, Guizhou Province. Acta Mineralogica Sinica, 43(6): 861-872 (in Chinese with English abstract).

[10]

Cortes, C., Vapnik, V., 1995. Support⁃Vector Networks. Machine Learning, 20(3): 273-297. https://doi.org/10.1023/A:1022627411411

[11]

Guo, Y., Chen, D., Tang, Z. C., et al., 2023. Ceochemical Characteristics of Rare Earth Elements and the Source of Ore⁃Forming Materials in the Jinliang Fluorite Deposit in the Northeastern Guizhou. Acta Mineralogica Sinica, 43(6): 873-881 (in Chinese with English abstract).

[12]

Hong, S., Zuo, R. G., Huang, X. W., et al., 2021. Distinguishing IOCG and IOA Deposits via Random Forest Algorithm Based on Magnetite Composition. Journal of Geochemical Exploration, 230: 106859. https://doi.org/10.1016/j.gexplo.2021.106859

[13]

Hou, L. L., Wu, S., Yi, J. Z., et al., 2024. Discriminating Deposit Types Using Chlorite Trace Elements Based on Machine Learning. Earth Science, 49(12): 4303-4317 (in Chinese with English abstract).

[14]

Hu, B., Zeng, L. P., Liao, W., et al., 2022. The Origin and Discrimination of High⁃Ti Magnetite in Magmatic⁃Hydrothermal Systems: Insight from Machine Learning Analysis. Economic Geology, 117(7): 1613-1627. https://doi.org/10.5382/econgeo.4946

[15]

Huang, X. W., Boutroy, É., Makvandi, S., et al., 2019. Trace Element Composition of Iron Oxides from IOCG and IOA Deposits: Relationship to Hydrothermal Alteration and Deposit Subtypes. Mineralium Deposita, 54(4): 525-552. https://doi.org/10.1007/s00126⁃018⁃0825⁃1

[16]

Jin, S. R., Chen, J., Dai, D. R., et al., 2018. Geochemical Characteristics of Trace Elements and REE in the Gaoling Fluorite Deposit, Southwest Guizhou, China. Acta Mineralogica Sinica, 38(6): 684-692 (in Chinese with English abstract).

[17]

Jolliffe, I. T., Cadima, J., 2016. Principal Component Analysis: A Review and Recent Developments. Philosophical Transactions Series A, Mathematical, Physical, and Engineering Sciences, 374(2065): 20150202. https://doi.org/10.1098/rsta.2015.0202

[18]

Lachaud, A., Adam, M., Mišković, I., 2023. Comparative Study of Random Forest and Support Vector Machine Algorithms in Mineral Prospectivity Mapping with Limited Training Data. Minerals, 13(8): 1073. https://doi.org/10.3390/min13081073

[19]

Li, M., 2022. Geological Characteristics and Genesis of the Shuanghe Barite⁃Fluorite Deposit in Northeastern Guizhou Province (Dissertation). Chengdu University of Technology, Chengdu (in Chinese with English abstract).

[20]

Liu, D. R., Shang, P. Q., 2023. Classification and REE Geochemical Characteristics of Fluorite Deposits in China. Geology and Exploration, 59(2): 211-222 (in Chinese with English abstract).

[21]

Möller, P., Parekh, P. P., Schneider, H. J., 1976. The Application of Tb/Ca⁃Tb/La Abundance Ratios to Problems of Fluorspar Genesis. Mineralium Deposita, 11(1): 111-116. https://doi.org/10.1007/BF00203098

[22]

Peng, J. T., Hu, R. Z., Qi, L., et al., 2002. Ree Geochemistry of Fluorite from the Qinglong Antimony Deposit and Its Geological Implications. Scientia Geologica Sinica, 37(3): 277-287 (in Chinese with English abstract).

[23]

Petrelli, M., Bizzarri, R., Morgavi, D., et al., 2017. Combining Machine Learning Techniques, Microanalyses and Large Geochemical Datasets for Tephrochronological Studies in Complex Volcanic Areas: New Age Constraints for the Pleistocene Magmatism of Central Italy. Quaternary Geochronology, 40: 33-44. https://doi.org/10.1016/j.quageo.2016.12.003

[24]

Qi, L. S., Yin, T. L., Huang, Q. L., et al., 2025. The Vapour⁃Fluid⁃Explosion Mineralization of the Heishanqing Fluorite Deposit in Qinglong County, Guizhou Province. Acta Mineralogica Sinica, 45(4): 823-834 (in Chinese with English abstract).

[25]

Rao, H. J., Luo, P., Yang, Z. X., et al., 2010. Geochemistry of Fluorite and Its Genesis in Sickl Area, Tarim Basin. Acta Sedimentologica Sinica, 28(4): 821-831 (in Chinese with English abstract).

[26]

Schwinn, G., Markl, G., 2005. REE Systematics in Hydrothermal Fluorite. Chemical Geology, 216(3/4): 225-248. https://doi.org/10.1016/j.chemgeo.2004.11.012

[27]

Shuai, Q. Y., Li, J. H., Wei, G. H., et al., 2025. Characteristics of Ore⁃Forming Fluids and Ore Genesis of the Yaojiata Fluorite Deposit in Southern Anhui: Constraints from Rare Earth Elements and Fluid Inclusions. Chinese Journal of Geology, 60(5): 1426-1439 (in Chinese with English abstract).

[28]

Sun, S. S., McDonough, W. F., 1989. Chemical and Isotopic Systematics of Oceanic Basalts: Implications for Mantle Composition and Processes. Geological Society, London, Special Publications, 42(1): 313-345. https://doi.org/10.1144/gsl.sp.1989.042.01.19

[29]

U.S. Geological Survey, 2024. Mineral Commodity Summaries 2024. U.S. Geological Survey, Reston. https://doi.org/10.3133/mcs2024

[30]

Wang, J., 2019. Metallogenic Characteristics and Ore⁃Prospecting Prediction Research of the Dachang Ore Concentration Area in Qinglong, Guizhou Province (Dissertation). China University of Geosciences, Beijing (in Chinese with English abstract).

[31]

Wang, J. P., Shang, P. Q., Xiong, X. X., et al., 2014. The Classification of Fluorite Deposits in China. Geology in China, 41(2): 315-325 (in Chinese with English abstract).

[32]

Wang, K., 2022. Types and Geological⁃Geochemical Characteristics of Fluorite Deposits in the Southern Section of the Greater Khingan Range (Dissertation). China University of Geosciences, Beijing (in Chinese with English abstract).

[33]

Wang, P., Glover, L., 1992. A Tectonics Test of the Most Commonly Used Geochemical Discriminant Diagrams and Patterns. Earth⁃Science Reviews, 33(2): 111-131. https://doi.org/10.1016/0012⁃8252(92)90022⁃L

[34]

Xia, X. H., Han, Y. C., Lian, W., et al., 2009. Genesis Discussion and REE Geochemistry Characters in Ba⁃Mianshan Fluorite Deposit in Zhejiang Province. Geology of Chemical Minerals, 31(4): 193-200 (in Chinese with English abstract).

[35]

Xu, Y. D., Qi, L. S., Yin, T. L., et al., 2023. Geochemical Characteristics of Trace Elements and Rare Earth Elements(REE) of the Donggualin Fluorite Deposit in Qinglong City, Guizhou Province. Acta Mineralogica Sinica, 43(6): 853-860 (in Chinese with English abstract).

[36]

Yu, L. M., Zou, H., Santosh, M., et al., 2022. The Link between Paleo⁃Tethys Subduction and Regional Metallogeny in the SW Yangtze Block: New Evidence from the Zubu Carbonate⁃Hosted F⁃Pb⁃Zn Deposit. Ore Geology Reviews, 144: 104809. https://doi.org/10.1016/j.oregeorev.2022.104809

[37]

Zhang, H. F., Wen, J., Chen, M., et al., 2025. Sources of Ore⁃Forming Materials of Fluorite Deposit in the Mabian Area, Southwest Sichuan, and Implications for Regional Prospecting of Fluorite. Geological Bulletin of China, 44(10): 1816-1829 (in Chinese with English abstract).

[38]

Zhang, X. Y., Gu, J. Y., Luo, P., et al., 2006. Genesis of the Fluorite in the Ordovician and Its Significance to the Petroleum Geology of Tarim Basin. Acta Petrologica Sinica, 22(8): 2220-2228 (in Chinese with English abstract).

[39]

Zhang, Z. Z., Gong, Y. J., Chen, L. B., et al., 2018. Geochemical Evidence of the Source of Ore⁃Forming Materials from Dazhuyuan Fluorite Deposit in Northeastern Guizhou. Geochimica, 47(3): 295-305 (in Chinese with English abstract).

[40]

Zhou, B. W., 2023. Geochemical Characteristics and Genesis Discussion of the Zhangcuo Fluorite Deposit in Shaowu, Fujian Province (Dissertation). Kunming University of Science and Technology, Kunming (in Chinese with English abstract).

[41]

Zhou, Q., Tao, P., Chen, Q. F., et al., 2025. Metallogenic Regularity, Centennial Exploration Results of Guizhou Province, and Suggestions for a New Round of Prospecting: Research and Compilation of “Geology of Mineral Resources of China · Guizhou Volume”. Acta Geoscientica Sinica, 46(1): 172-183 (in Chinese with English abstract).

[42]

Zhou, Z. H., Cao, W. G., Dai, Y. H., et al., 2024. Ore⁃Controlling Factors and Prospecting Direction of Fluorite Belt in Northeastern Lianhuashan Anticline, Southwestern Guizhou. Guizhou Geology, 41(3): 270-277 (in Chinese with English abstract).

[43]

Zou, H., Dan, Y., Zhang, S. T., et al., 2016. Geochemical Evidence for Sources of Ore⁃Forming Material of Barite⁃Fluorite Deposits in Pengshui Area, Southeast Chongqing. Geotectonica et Metallogenia, 40(1): 71-85 (in Chinese with English abstract).

[44]

Zou, H., Fang, Y., Chen, H. M., et al., 2014. REE Geochemistry and Genesis of the Xiachen Fluorite Deposit in Tiantai Basin, Zhejiang Province. Geology in China, 41(4): 1375-1386 (in Chinese with English abstract).

[45]

Zou, H., Li, M., Santosh, M., et al., 2022. Fault⁃Controlled Carbonate⁃Hosted Barite⁃Fluorite Mineral Systems: The Shuanghe Deposit, Yangtze Block, South China. Gondwana Research, 101: 26-43. https://doi.org/10.1016/j.gr.2021.07.020

[46]

Zuo, R. G., Carranza, E. J. M., 2023. Machine Learning⁃Based Mapping for Mineral Exploration. Mathematical Geosciences, 55(7): 891-895. https://doi.org/10.1007/s11004⁃023⁃10097⁃3

[47]

Zuo, R. G., Yang, F. F., Cheng, Q. M., et al., 2025. A Novel Data⁃Knowledge Dual⁃Driven Model Coupling Artificial Intelligence with a Mineral Systems Approach for Mineral Prospectivity Mapping. Geology, 53(3): 284-288. https://doi.org/10.1130/g52970.1

基金资助

贵州省重大科技专项(黔科合重大[2025]016)

贵州省科技创新人才团队建设项目(黔科合人才CXTD[2025]026)

贵州省科技计划项目(No.黔科合平台人才⁃ZDSYS[2023]005)

AI Summary AI Mindmap
PDF (2694KB)

247

访问

0

被引

详细

导航
相关文章

AI思维导图

/