基于知识图谱的江南造山带金矿地质特征聚集性与找矿意义

李胜苗; 贾立宁; 王成彬; 周丽芸; 刘邦定; 朱锦豪; 王悦颖; 李楠

doi:10.3799/dqkx.2026.022

地球科学 ›› 2026, Vol. 51 ›› Issue (03) : 1040 -1056. DOI: 10.3799/dqkx.2026.022

基于知识图谱的江南造山带金矿地质特征聚集性与找矿意义

李胜苗 ¹^,³ ,
贾立宁 ² ,
王成彬 ² ,
周丽芸 ¹ ,
刘邦定 ¹ ,
朱锦豪 ² ,
王悦颖 ² ,
李楠 ⁴

作者信息 +

Clustering of Geological Characteristics and Prospecting Significance of Gold Deposits in the Jiangnan Orogen Based on Knowledge Graphs

Shengmiao Li ¹^,³ ,
Lining Jia ² ,
Chengbin Wang ² ,
Liyun Zhou ¹ ,
Bangding Liu ¹ ,
Jinhao Zhu ² ,
Yueying Wang ² ,
Nan Li ⁴

Author information +

文章历史 +

PDF (10511K)

摘要

为深化对江南造山带金矿成矿规律的理解，进一步评估找矿潜力.本文以江南造山带及其邻区的金矿为研究对象，引入知识图谱技术，采用自上而下方法构建金矿领域知识模型，并综合利用深度学习与大语言模型构建金矿成矿‒勘查知识图谱；基于该知识图谱开展金矿社区聚类分析与Jaccard相似性评价，系统分析矿床聚集性特征.构建了含28类实体类型、10种语义关系类型的金矿领域知识模型，由此生成的知识图谱涵盖区域内60个代表性矿床，包含2 212条实体及5 497条语义关系.社区聚类分析成功提取了“蚀变‒矿物‒地层”等关键控矿要素组合及成矿规律；Jaccard系数分析显示，水口山、黄金洞金矿与世界大型‒超大型矿床具有高度相似性，揭示出两矿床具有巨大的深部及外围找矿潜力.

Abstract

This study aims to deepen the understanding of metallogenic regularities and evaluate the prospecting potential of gold deposits in the Jiangnan Orogen. Focusing on the gold deposits within and adjacent to the Jiangnan Orogen, technologies related to the knowledge graph were introduced. A domain knowledge schema was developed using a top-down approach, and the metallogeny-exploration knowledge graph of gold deposits was constructed by integrating deep learning and Large Language Models (LLM). Community detection and Jaccard similarity evaluation were used to analyze the clustering characteristics of the gold deposits. The knowledge schema contains 28 geological entity types and 10 semantic relationship types. The resulting knowledge graph encompasses 60 representative gold deposits in the region, containing 2 212 geological entities and 5 497 semantic relationships. Community detection successfully extracted key ore-controlling factor combinations and metallogenic regularities, such as “alteration-mineral-strata”. Jaccard similarity analysis indicates that the Shuikoushan and Huangjindong gold deposits have high similarities to global large-to-giant deposits, revealing significant prospecting potential in their deep-seated zones and peripheral areas.

Graphical abstract

关键词

知识图谱 / 江南造山带金矿 / 本体模型 / 社区聚类 / Jaccard系数 / 深度学习.

Key words

knowledge graph / gold deposits in the Jiangnan orogenic belt / ontology model / community clustering / Jaccard coefficient / deep learning

引用本文

引用格式 ▾

李胜苗,贾立宁,王成彬,周丽芸,刘邦定,朱锦豪,王悦颖,李楠. 基于知识图谱的江南造山带金矿地质特征聚集性与找矿意义[J]. 地球科学, 2026, 51(03): 1040-1056 DOI:10.3799/dqkx.2026.022

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

近年来，随着地学大数据与人工智能技术的迅速发展，知识图谱作为关键的知识表示与推理技术，被广泛应用于地球科学领域（邱芹军等，2023；郭飞等，2024）.作为结构化知识表示的重要方式，知识图谱为复杂地质知识的组织、推理和挖掘提供了新的技术途径（Zhang et al.， 2023a）.知识图谱在地质领域的应用已得到多项研究证实（Deng et al.， 2024），其对地质知识的结构化呈现与深度挖掘能力也得到广泛认可（Dong et al.， 2024）.在这一背景下，诸多学者开展了探索性研究：Wang et al.（2018）利用文本数据挖掘和可视化技术，实现地质文本数据中隐藏知识和关系的抽取与可视化表达；Ma et al.（2020）提出了一种新的结构，用于深时知识图谱的版本控制和跟踪；Enkhsaikhan et al.（2021）通过融合机器学习与地质文本大数据，实现地质文档报告的检索利用，提升了计算机对地学专业文本的理解能力；Qiu et al.（2023a）提出了适应勘查报告的“对象‒过程”双重关系模型，为地质知识表示提供了方式；Wang et al.（2023）从矿床地质特征的客观存在出发，采用用例驱动方法建立斑岩型铜矿的本体模型，构建斑岩型铜矿知识图谱.

地学知识图谱的发展推动了地学文本数据挖掘研究（Zhang et al.， 2023b），显著提升了地学大数据二次利用效率（Zhou et al.， 2021； Peng et al.， 2023）.吴润泽等（2025）挖掘三峡地质资料中的地质灾害信息，构建三峡地质灾害知识图谱，服务于三峡滑坡地质灾害的监测预警；周成虎等（2021）系统开展了地学知识图谱的全域自适应表达模型、联邦式群智协同与多模态数据动态构建研究，并探讨地学知识图谱的应用方向.Li et al.（2018）利用卷积神经网络（Convolutional Neural Network，CNN）提取了中国拉拉铜矿的实体关系；Qiu et al.（2020）利用字典匹配和关注机制构建字典关注层，并基于领域特定知识对地质文本进行分类；Li et al.（2022）通过远程监测，从少量标记样本中提取金矿的地质实体关系，实现了地质文献中的金矿知识抽取；Tian et al.（2024）将预训练的RoBERTa模型用于地质实体关系的抽取；Wang et al.（2022）提出了GeoERE⁃Net地质实体‒语义关系联合抽取模型抽取地质文献中的三元组；Qiu et al.（2023b）将ALBERT⁃BiLSTM⁃CRF模型用于地质实体关系的抽取.Yang et al.（2025）将扩展卷积神经网络层纳入BERT⁃BiLSTM⁃CRF模型，抽取锂矿知识并构建知识图谱.马香菲（2025）将生成式数据增强、提示学习与LoRA参数高效微调相结合对大语言模型进行优化微调，用于地质灾害领域文本实体识别和关系抽取.王嘉翔（2024）以开源大语言模型（Chinese⁃LLaMA⁃2）为基础，经地学语料无监督预训练、人工标注数据集有监督微调，实现斑岩型铜矿领域三元组提取.当前研究仍以知识图谱的构建、知识表示与存储为主，如何挖掘地质知识图谱中的知识价值，驱动和服务矿产资源智能预测仍然是亟须解决的热点和难题.

本文根据江南造山带金矿地质特征构建成矿‒勘查本体模型，综合利用深度学习和大语言模型方法对江南造山带及其邻区金矿地质文本进行命名实体识别和关系抽取，构建金矿知识图谱；然后对知识图谱中的实体类型和关系类型进行统计分析.在此基础上，对江南造山带金矿知识图谱进行社区聚类，基于聚类结果识别出内部关联紧密的地质实体集群，精准提取 “蚀变‒矿物‒地层” 等区域共性成矿规律，展现不同矿床的成矿模式差异.进而以水口山和黄金洞等典型金矿为研究对象，通过社区聚类分析其成矿要素特征聚集性和差异性；采用Jaccard 相似性系数对比水口山和黄金洞金矿与已知的世界大型‒超大型矿床的相似性，评价水口山和黄金洞金矿是否具有成为大型‒超大型矿床的潜力.

1 金矿领域本体模型构建

基于江南造山带金矿成矿地质模型，结合矿床领域专家知识，采用自上而下的方法构建金矿领域本体模型（图1），覆盖了金矿成矿系统和勘查系统.

1.1　实体类型定义

在深入理解江南造山带金矿成矿模型基础上，采用用例驱动的方法定义与江南造山带金矿相关的28种实体类型，即包括地理位置、地质年代、地质背景、地质事件、金属矿物、非金属矿物、断裂、褶皱、蚀变类型、沉积岩、火成岩、变质岩、岩石地层、年代地层、岩体、矿体、矿床、主要元素、微量元素、同位素、地球物理异常、地球化学异常、遥感异常、测量勘探仪器、勘探工程、找矿标志、矿化类型、流体包裹体类型.这些实体类型涵盖了矿床成矿模型和找矿模型的核心知识内容.

1.2　关系类型定义

除了与江南造山带金矿相关的实体类型，实体之间的语义关系是构成三元组、表征金矿知识的关键部分，它规定了各个实体之间的相互联系和交互方式.关系类型定义不仅描绘了实体之间的结构关系，还反映了它们之间的逻辑关系和动态交互.本文共构建10种语义关系类型，包括“hasAlteration”、“isControlledBy”、“isLocatedIn”、“isFormedIn”、“hasMinerals”、“hasElement”、“isRelatedTo”、“isFoundIn”、“isAnalyzedBy”和“isRevealedBy”，前7种主要表示金矿成矿系统中实体间的语义关系，后3种主要表示金矿勘查系统中实体间的语义关系.

语义关系定义了地质实体之间的相互作用和逻辑关系，其详细内涵如：hasAlteration表示矿体或岩体附近出现的蚀变类型，如绿泥石化、黄铁矿化；hasMinerals描述矿床或矿体中包含的金属或非金属矿物；hasElement指岩石或矿物样品中的化学元素组合；isControlledBy用于表征矿床的控矿构造，如构造破碎带；isRelatedTo用于表征与矿床相关但非控矿的地质要素；isRevealedBy指勘探工程（如钻孔、探槽）对矿体或岩体的揭示作用；isFoundIn表示在矿床中发现的地质异常；isFormedIn描述矿床或相关地层的形成年代；isLocatedIn定义矿床的地理位置和地质背景；isAnalyzedBy则描述某实体的勘查或分析方法，如汞气测量被用于某研究区的勘查.这些关系类型系统地刻画了矿床地质中各要素的相互作用，为构建金矿的知识画像提供了实体‒关系语义框架.在该实体和语义关系的本体模型中，一种语义关系的头实体和尾实体可与多种实体类型组合，从而表达复杂的地质知识；同时较少的实体和语义关系数量也兼顾了地质文本数据挖掘计算机模型训练的需求.

2 江南造山带金矿知识图谱构建

本文使用的地质文本数据包括水口山和黄金洞矿床的46篇地质勘查报告和江南造山带金矿的120篇开放性学术文献.通过对地质勘查报告进行清洗和标注，构建1 000多条训练语料，利用深度学习对地质勘查报告中实体和关系进行抽取；针对开放性学术文献则采用大语言模型完成实体与关系的提取.将不同方法抽取的实体‒关系三元组进行对齐和消歧校正，建立江南造山带及邻区金矿知识图谱.

2.1　知识图谱构建方法

2.1.1　基于词增强深度学习的命名实体识别

该模型采用字‒词特征融合的方法，通过Word2Vec模型提取词特征，同时利用BERT模型获取字级特征、位置特征和句级特征，并借助适配器实现特征的深度融合（Vaswani et al.， 2017）.模型采用双向Transformer结构来提取上下文特征，相比传统循环神经网络（Recurrent Neural Network，RNN）和CNN模型，其能够更好地捕捉长距离依赖关系并避免梯度问题.在输出层引入条件随机场模型，将命名实体识别任务转化为多分类问题，通过考虑相邻标签之间的转移概率来优化最终的标注结果.实验结果表明，该模型的精确率达到0.88，召回率为0.84，F1值为0.86，性能指标表明模型在实体识别任务中兼顾了较高的识别准确性与良好的实体覆盖范围，具备可靠的实用价值.

2.1.2　基于BERT⁃CasRel的语义关系抽取模型

BERT⁃CasRel模型实现金矿领域语义关系提取主要经过三步（Wei et al.，2020）.第一步使用BERT编码器将输入文本中的每个单词转换为相应的词向量表示；第二步使用CasRel模型的头实体识别模块，直接解码n层BERT编码器生成的编码向量，识别输入句子中所有可能的头实体.第三步关系对象识别模块根据每个头实体预测对应的语义关系和尾实体.实验结果显示，该语义关系抽取模型的性能更为突出，精确率达0.94，召回率达0.91，F1值为0.93 .

2.1.3　基于大语言模型的实体关系抽取模型

深度学习方法在复杂语义场景、长文本处理上存在一定的局限性，并且深度学习方法需要大量的人工标注训练语料作为支撑，训练语料的构建需要大量的劳动力和经济成本.相较于深度学习模型，大语言模型不仅在长文本处理、复杂语义推理方面表现突出，更具备显著的少样本或零样本学习优势，无需依赖大规模标注语料，即可高效完成实体与语义关系抽取任务（Li et al.，2024；Zhou et al.，2024）.在金矿本体模型的引导下，编写Prompt指令开展金矿文本中实体和关系的抽取.在Prompt指令中首先明确大语言模型服务的领域和角色，定义与金矿知识图谱相关的实体和语义关系；然后对大语言模型抽取结果的存储形式进行约定.实验采用本地部署的DeepSeek⁃R1⁃70B模型，采用基于大语言模型的Prompt方法对实体‒语义关系抽取的精确率达0.89，召回率达0.82，F1值为0.85.

本文综合利用基于词增强的深度学习命名实体识别、BERT⁃CasRel语义关系抽取模型和大语言模型方法对与江南造山带金矿相关的地质实体及其之间的语义关系进行抽取，然后经消歧对齐处理，获得涵盖与60个金矿床相关的2 212个实体和5 497条语义关系的江南造山带及邻区金矿知识图谱（如图2所示）.

2.2　实体类型统计分析

江南造山带金矿知识图谱中实体类型统计分布如图3所示，该知识图谱的实体类型全面覆盖了矿床成矿模型和勘查模型.在矿床物质基础层面，沉积岩118个、变质岩85个、火成岩20个、岩体81个、金属矿物77个、非金属矿物46个、主要元素30个、微量元素21个、同位素30个、矿床60个、矿体331个，共899个实体，占全部实体数量的40.64%.沉积岩和变质岩作为主要岩性为成矿提供了物质来源和赋矿空间；侵入岩体提供成矿热源与物质；其中与成矿相关的金属矿物数量较多，非金属矿物则主要反映成矿岩石的组成特点或蚀变类别；矿床和矿体是成矿作用的核心产物和表现形式，表征矿质富集的空间位置和规模.在矿床时间维度上，地质年代实体13个、年代地层28个、地质事件8个，共49个实体，占全部实体数量的2.21%，该类实体可为地质历史演化和地质成矿时间提供时间框架约束.在矿床构造方面，断裂实体214个、褶皱实体88个，共302个实体，占全部实体数量的13.65%，断裂和褶皱体现江南造山带金矿“构造控矿”特征.在矿床的流体和蚀变作用维度，蚀变类型实体48个、流体包裹体类型实体18个，共66个实体，占全部实体数量的2.98%.蚀变类型反映热液流体与围岩相互作用，流体包裹体则与成矿流体物理化学条件密切相关.在矿床空间分布上，地质背景实体113个、岩石地层98个，共211个实体，占全部实体数量的9.53%，地质背景和岩石地层实体揭示了成矿的区域构造背景和地层条件.在空间位置层面，地理位置108个，占全部实体数量的4.88%.在勘查方法与找矿标志方面，勘探工程311个、测量勘探仪器25个、找矿标志44个、地球化学异常152个、地球物理异常43个、遥感异常1个、重砂异常1个，共577个实体，占实体数量的26.08%，勘探工程可直接揭露地下地质体形态，测量勘探仪器是获取勘查数据的重要手段.地球化学异常用于圈定元素富集区，也可示踪深部矿化信息、追溯成矿物质来源；地球物理异常可定位深部隐伏矿体以及构造、岩体的分布；遥感异常可服务于大区域尺度靶区圈定，找矿标志能够快速指示成矿有利地段.

2.3　关系类型统计分析

江南造山带金矿知识图谱中语义关系类型统计分布如图4所示，江南造山带金矿知识图谱的10类语义关系共计5 497条.其中，isControlledBy共计1 434条，占语义关系数量的26.09%，该语义关系主要用于表达矿床（或矿体）与岩体、断裂、地层等地质要素之间的控制关系. isRelatedTo共计698条，占语义关系数量的12.70%，该语义关系用于描述与成矿相关但起非控矿作用的岩石、地层、构造等地质要素. hasMinerals共计819条，占语义关系数量的14.90%，该语义关联矿床（或矿床）与金属、非金属矿物，表示矿床的矿物组合. isLocatedIn共807条，占语义关系数量的14.68%，可实现矿床和矿体与地理位置、地质背景的空间语义描述. hasAlteration共626条，占语义关系数量的11.39%，该语义连接矿床（或矿体）与蚀变类型. isRevealedBy共计372条，占语义关系数量的6.77%，该语义用于表示矿床（或矿体）与勘探工程之间的连接关系，体现勘查工程对矿床（或矿体）的揭示作用. hasElement共295条，占语义关系数量的5.37%，该语义连接矿石或样本与化学元素. isFoundIn共205条，占语义关系数量的3.73%，该语义关联地质异常与地质单元.isFormedIn共129条，占语义关系数量2.35%，该语义表征矿床形成年代. isAnalyzedBy共112条，占语义关系数量2.04%，该语义用于表示矿床研究所采用的分析方法.

3 江南造山带金矿知识图谱对比

本文采用社区检测方法对江南造山带金矿知识图谱进行挖掘和分析.社区检测的核心是将网络划分为内部连接紧密、外部连接稀疏的社区集群.模块度（Modularity）通过量化实际网络连接与随机连接模型的差异衡量社区划分质量，其值越接近1表明社区结构越显著（Newman et al.，2006）.Louvain算法（Blondel et al.，2008）通过“局部优化‒层次聚合”的迭代策略实现高效社区检测，其核心逻辑围绕模块度计算与增量优化展开，执行流程分为两个核心步骤：（1）局部优化：将每个节点初始化为独立社区，随机遍历所有节点，计算节点迁移至各相邻社区的模块度增量ΔQ，仅保留使ΔQ最大化的迁移操作.由于ΔQ直接反映节点移动对全局Q的贡献，因此每次ΔQ>0的迁移都会严格提高整个网络的模块度该过程不断迭代，直至不存在任何节点的迁移能够进一步提升全局模块度，此时完成一次局部最优社区划分.（2）层次聚合：将局部优化后的每个社区抽象为“超级节点”，以社区间节点的边权重总和作为超级节点间的连接权重，构建新的层次化网络.重复上述两个步骤直至模块度达到最大值，最终输出多层次社区结构.

其中，模块度是衡量社区划分优劣的基础，对于含n个节点、m条边的无向网络，模块度Q的计算公式为：

Q = 1 2 m ∑ i, j [A i j - k i k j 2 m] δ (c i, c j)

，（1）

其中，

A i j

表示邻接矩阵元素，表示节点

i

和节点

j

之间是否存在边.若两节点间存在边连接，则

A i j = 1

否则

A i j = 0

；

k i

和

k j

表示节点

i

和节点

j

的度数，即各自连接边的数量；

m

表示整个网络中边的数量；

δ (c i, c j)

为Kronecker delta函数，当节点

i

和节点

j

属于同一个社区时取值为1，否则为0.

Louvain算法的高效性源于将全局模块度优化转化为局部节点迁移决策，核心是模块度增量ΔQ的计算.当节点

u

从原社区

C

迁移至相邻社区

C'

时，ΔQ可通过局部信息求解：

Δ Q = 1 2 m [2 k u, i n - ∑ t o t ⋅ k u m]

，（2）

其中，

k u, i n

为社区

C'

内节点与节点

u

之间的边权重之和，

∑ t o t

与社区

C'

中节点相连的所有边的权重总和，k_u 代表节点u的总度数，m代表图中所有边的总权重.若ΔQ>0，说明迁移可提升模块度，算法将选择ΔQ最大的社区完成节点迁移.

3.1　江南造山带金矿知识图谱网络分析

模块度社区聚类算法主要涉及四个参数，分别是随机度、边权重、解析度和聚类起始标识号（ID）.随机度在算法中主要体现为初始节点访问顺序的随机化程度，通过采用不同的随机初始化方式，算法每次以不同节点顺序遍历并计算模块度增量，形成不同的探索路径，从而产生不同的社区划分结果；边权重由关系类型及其属性（如置信度、频次）动态计算获得，以体现不同关系对社区结构的贡献差异；解析度通过调整社区内部与社区之间边权重的相对权重影响社区聚类结果的数量，解析度越大，获得的聚类数越少；聚类起始标识号决定网络分析聚类的起始编号.

经社区检测聚类运算，得到了不同解析度下金矿知识图谱社区发现的模块度与聚类数量结果之间的对应关系（图5）.在［0，0.2］解析度区间内的模块度集中在0.40到0.52之间，聚类数大于60，聚类数过多，缺乏地质可解释性；在［0.2，0.6］解析度区间内模块度随解析度增长变缓，聚类数从62降到21，但聚类数依旧过多，不利于地质解译；在［0.6，1.1］解析度区间内模块度出现“平台”，聚类数降至17个左右；解析度大于1.1后，模块度随解析度变大而降低，说明随着解析度变大，网络的社区聚类效果变弱.综合模块度与聚类数在不同解析度下的变化趋势，选择解析度为1时的结果作为社区聚类最优结果.在解析度为1、增加边权重、随机性为真的条件下，通过多次独立运行计算保证结果稳定性，最终得到金矿知识图谱的社区结构，其模块度为0.55，共识别19个聚类结果.

金矿知识图谱的知识节点在不同社区聚类中差异明显，如图6所示.其中ID=8、18的类别包含较多的节点，节点数量大于200个；聚类ID为3、10、15、16的4个聚类包含的节点数量为100~200个；聚类ID为1、2、12、13等13个聚类包含的节点数量小于100个.

选取类别8、15、18和6这4个典型类别进行详细分析，重点分析与金矿成矿模型和勘查模型密切相关的地质知识信息：

（1）类别8聚类结果揭示了水口山金矿内相关矿床和成矿地质要素.该类别共包括5处相关矿床（段），具体包括白泥冲黄铁矿、龙王山金矿、老鸦巢、鸭公塘矿段及水口山矿田，均隶属于水口山金矿（图7a）.这一结果充分印证了社区聚类算法的有效性与合理性，聚类边界清晰且符合实际地质规律.除上述矿床实体外，该类别中还包含大量与矿床相关的地质要素，比较集中的实体标签有岩石地层、沉积岩、断裂、褶皱等.岩石地层中，高家田组、栖霞组、当冲组与矿床或矿体之间的语义关系为isControlledBy，表明这些地层是控制矿床和矿体分布的重要地层单元；沉积岩中，灰岩、砂岩和页岩与矿床或矿体之间的语义关系为isControlledBy，表明这些沉积岩对水口山金矿有着重要影响；在断裂构造方面，NE、NW向断裂与矿床或矿体的语义关系为isControlledBy，表明矿床的空间分布受这些断裂控制；褶皱构造方面，聚类结果包含康家湾倒转背斜、鸭公塘倒转背斜等褶皱实体，这一特征表明褶皱构造在该类型矿床的成矿过程中发挥了关键控制作用.以上结果表明地层、断裂和褶皱等地质要素与水口山金矿形成密切关系.

（2）类别15聚类结果揭示了黄金洞金矿内相关矿床和成矿地质要素.该类别包括11个矿床，这些矿床均属于黄金洞金金矿或者在黄金洞金矿附近（图7b）.除矿床实体外，该类别比较集中的实体标签有岩石地层、变质岩、断裂、蚀变类型，岩石地层中，冷家溪群、坪原组和黄浒洞组与矿床或矿体之间的语义关系为isControlledBy，表明这些地层是控制矿床或矿体分布的重要地层单元；在断裂构造方面，矿床或矿体与NE、NNW和NW向断裂的语义关系为isControlledBy，表明矿床或矿体的空间分布受这些断裂控制；褶皱构造方面，矿床或矿体与屠刀坑倒转背斜、野猪埂倒转背斜、高楼坑倒转向斜和东西或北西向的复式背斜语义关系是isControlledBy，这一特征表明褶皱构造对矿床的成矿过程与矿体空间起到控制作用；蚀变类型方面，黄铁矿化、硅化、毒砂化和绢云母化出现，表明金矿化与这些蚀变有关；在变质岩方面，板岩、粉砂质板岩、砂质板岩、泥质板岩等变质岩表明金矿形成与这些类别变质岩有关.地层、断裂和蚀变等地质要素与这些金矿存在密切联系.

（3）类别18聚类结果揭示了矿床和金属矿物相关性.该类别包括合仁坪金矿、铲子坪金矿、仙人岩多金属矿床等9个矿床（图7c）.这些金矿关联自然金、闪锌矿、毒砂、方铅矿、黄铁矿等金属矿物，表明金矿化与上述金属矿物组合具有密切联系.

（4）类别6聚类结果揭示了矿床和蚀变相关性.该类别包括曲溪金矿、黄土嘴金矿、平茶金矿以及古台山金锑矿床（图7d）.毒砂化、黄铁矿化、绢云母化和硅化等蚀变与这四个矿床存在紧密联系，表明矿床之间存在相似的热液成矿环境.

3.2　江南造山带金矿知识图谱K⁃core核心关联特征

K⁃core算法是一种基于图拓扑结构的子图挖掘算法，旨在挖掘满足指定核心度要求的关联子图结构（Kong et al.， 2019）.K⁃core子图中，每个顶点在该子图内的度数均不小于K，即每个顶点至少与子图中的K个顶点存在直接语义关联.该算法通过剔除网络中度数未达到阈值K的非核心顶点，层层剥离网络外围的松散结构，从而获得核心子图.

本文拟利用K⁃core算法探索与矿床关系密切的控矿要素，加深对成矿模型的理解.当K值为1或2时，核心子图中包括地理位置、勘探工程等与成矿模型关联性较弱的实体与关系，筛选力度不足，不利于对矿物、断裂、地层等核心成矿要素的规律分析；当K≥4时，一些矿床、岩石地层、断裂等重要信息被排除，破坏“矿床‒成矿要素”完整关联.当K值为3时，在剥离与成矿模型低价值边缘信息的同时又最大限度保留核心地质要素信息，精准达成 “去冗存核” 的筛选目标.

因此，选择K值为3构建江南造山带金矿知识图谱的核心子图（图8）.核心子图表明：金矿矿床均与黄铁矿化、毒砂化、绢云母化三类蚀变及黄铁矿、毒砂、方铅矿三种矿物紧密关联；黄铁矿与毒砂是该区域金矿典型的金属矿物组合，黄铁矿与毒砂是核心载金矿物，方铅矿指示成矿流体的多金属成矿特征，这一关联集群印证了“蚀变‒矿物‒金矿化”的强耦合关系，为地质找矿提供了金属矿物组合标志.岩石地层实体高度聚焦于板溪群、五强溪群、马底驿组，其中板溪群与五强溪群是江南造山带基底地层，以浅变质碎屑岩、火山碎屑岩为主，富含Au、As等成矿元素（柏道远等，2025），为金矿形成提供物质基础与赋矿地层；马底驿组与基底地层的不整合接触带因构造活动易形成热液流体运移通道与矿体赋存空间.在断裂方面，NW向、NE向、EW向断裂为大部分矿床的控矿断裂（肖丹等，2025），NE向断裂控制成矿带宏观展布，NW向断裂与NE向断裂交叉部位常是热液流体聚集与成矿物质沉淀的核心区，EW向断裂约束前两者分布，三者共同构成“构造控矿网络”，揭示“构造控矿”成矿规律，为金矿找矿勘查提供明确的构造方向指引.

基于K⁃core筛选的核心金矿知识图谱子图中对控矿要素与金矿之间语义逻辑关系的可视化表达，有助于深化对江南造山带金矿的成矿模型和找矿勘查的快速理解.在成矿模式层面，明确了“构造‒地层‒蚀变‒矿物”成矿要素耦合机制：板溪群、五强溪群、马底驿组的特定地层组合为成矿提供了物质基础与容矿空间；NW向与NE向断裂的交汇部位构成流体运移与成矿物质富集通道；“黄铁矿化‒毒砂化‒绢云母化”蚀变组合与“黄铁矿‒毒砂‒方铅矿”矿物组合则是元素富集直接标志.在找矿模式层面，可优先圈定板溪群、五强溪群、马底驿组的地层组合区域，结合NW向与NE向断裂的交汇部位构建找矿靶区；在勘查层面，将“黄铁矿化‒毒砂化‒绢云母化”蚀变组合与“黄铁矿‒毒砂‒方铅矿”矿物组合作为直接找矿标志，提升对潜在矿体的识别能力.

3.3　水口山和黄金洞矿床金矿知识图谱对比分析

水口山和黄金洞金矿的矿床分别处于两个聚类结果之中，并且各个聚类结果内部的矿床存在语义联系.针对水口山金矿和黄金洞金矿内的矿床进行二次聚类分析，分析这两个矿区成矿‒勘查要素之间的联系和区别.在水口山金矿的聚类中类别6、7、8、9这4个类别有较多的实体分布，在黄金洞金矿的聚类中类别3、5、8、9这4个类别有较多的实体分布.

（1）为揭示水口山金矿地质要素的内在联系，笔者对该金矿知识图谱聚类结果进行了系统分析.结果显示不同社区由岩石地层、沉积岩、岩体、褶皱、断裂和金属矿物等地质要素构成.类别7中较为集中的实体标签为岩石地层和沉积岩（图9a），其中高家田组、栖霞组、当冲组单元占比较大，地层中的岩石类型主要为灰岩、砂岩、泥岩等沉积岩类，反映出矿区基底的沉积环境特征.类别8则以岩体和蚀变类型实体标签为主（图9b），主要为花岗闪长斑岩、石英斑岩等岩体，以及绢云母化、绿泥石化、高岭土化、黄铁矿化等蚀变类型，岩体与矿体及蚀变的显著关联，表明矿床形成与岩浆侵入活动及其伴随的蚀变作用存在密切的成因联系.类别6的实体标签主要是褶皱和断裂（图9c），其中褶皱主要为康家湾倒转背斜、盐湖式向斜、仙人岩倒转背斜，断裂则以NW向和NE向断裂为主，表明矿床形成与分布受特定褶皱和多方向断裂共同控制.类别9主要是矿体与金属矿物的实体标签（图9d），金属矿物以闪锌矿、方铅矿、黄铁矿、银黝铜矿等多种硫化物为主，表明上述金属矿物是构成矿体的主要矿物成分.综上所述，水口山矿床形成了“沉积地层‒岩浆活动‒褶皱和断裂构造”的成矿模式：高家田组等沉积地层为矿质富集提供容矿空间与物质基础，花岗闪长斑岩等岩体侵入提供了成矿热源与成矿物质，褶皱核部及NW和NE向断裂交汇带则构成导矿和容矿体系.基于该成矿模式可构建以下找矿模式：以高家田组‒栖霞组‒当冲组地层组合、花岗闪长斑岩等侵入岩体、NW和NE向断裂与褶皱构造区域为核心找矿靶区，将绢云母化‒黄铁矿化等蚀变组合与闪锌矿‒方铅矿‒黄铁矿等硫化物矿物组合作为找矿标志，深部探测重点聚焦褶皱核部破碎带、断裂交汇处及岩体与地层的接触带等隐伏部位.该模式可为水口山矿床的精准勘查提供一定科学指导.

（2）为揭示黄金洞金矿地质要素的内在联系，对该矿床的知识图谱聚类结果进行了系统分析，结果显示不同社区主要由岩石地层、变质岩、金属和非金属矿物、断裂等地质要素构成.类别8和类别3中较为集中的实体标签包括岩石地层、变质岩、金属矿物和非金属矿物（图10a和10b）.岩石地层以冷家溪群为主，地层中的变质岩主要为绢云母板岩、泥质板岩等，反映出矿床基底的变质岩属性；金属矿物主要为黄铁矿、毒砂、闪锌矿等，非金属矿物主要为石英、方解石、绢云母等，其中黄铁矿和毒砂是核心载金矿物，闪锌矿、黄铜矿等作为伴生硫化物，其出现指示成矿流体富硫且具备金元素迁移和富集的化学环境；而石英作为热液活动的重要产物，为金沉淀和富集提供有利空间.类别9实体标签主要为蚀变类型，主要包括黄铁矿化、毒砂化、硅化、绿泥石化等蚀变（图10c），这些蚀变与矿化过程密切相关，进一步印证了热液活动对矿床形成的影响.5号社区的实体标签以矿床与断裂为主（图10d），其中断裂以NE向和NWW向为主.矿床与这些断裂密切相关，表明NE、NWW向断裂可能在成矿过程中充当成矿流体的主要运移通道和有利的富集空间.综上所述，黄金洞矿床形成了“变质基底‒热液蚀变‒构造控矿”成矿模式.冷家溪群绢云母板岩、泥质板岩等变质岩为金元素富集提供物质基础与赋矿空间；黄铁矿化‒毒砂化‒硅化等蚀变发育表明热液活动促进成矿物质迁移和富集；NE和NWW向断裂既充当成矿流体运移通道又可作为矿体的赋存位置；黄铁矿、毒砂等载金矿物与石英的组合则是成矿物质富集的直接体现.基于该成矿模式，构建以下找矿模式：以冷家溪群变质岩基底、NE和NWW向断裂交汇带为重点圈定找矿靶区，以黄铁矿化‒毒砂化蚀变组合及黄铁矿‒毒砂‒石英矿物组合为直接找矿标志，深部探测可聚焦断裂破碎带及脉体发育部位.

3.4　水口山和黄金洞矿床与大型‒超大型矿床相似性分析

Jaccard相似性系数是衡量两个集合相似程度的经典指标，其核心原理为通过计算两集合交集元素数量与并集元素数量的比值表征两集合的重叠程度，取值范围为0~1，数值越接近1表明两集合的相似性越高（Niwattanakul et al.， 2013）.为客观分析成矿规律并科学评估成矿潜力，本文选取金属矿物、火成岩、断裂等13个与成矿相关的地质要素构建特征集合，基于公式（3）计算水口山和黄金洞矿床与世界大型‒超大型矿床之间Jaccard相似性系数.

J A, B = A ⋂ B / A ⋃ B

.（3）

本文选取Kalgoorlie矿床、Muruntau矿床、Timmins矿床、Grasberg矿床、Pueblo Viejo矿床、Ladolam矿床、Lihir矿床这7个典型大型‒超大型矿床作为对比对象，计算水口山和黄金洞矿床与上述矿床的Jaccard相似性系数（图11和图12）.对相似性计算结果进行拆解与系统分析后，将两矿床与世界大型‒超大型矿床的相似性特征划分为以下方面进行对比研究：

（1）水口山矿床与世界大型‒超大型金矿床的相似性在不同地质指标上表现出显著分异.在矿物组成方面，该矿床以非金属矿物为优势指标，与世界大型‒超大型金矿床的平均相似性高达0.78，其中与Pueblo Viejo矿床相似性达到1.0，与Lihir、Ladolam矿床相似性均超过0.80，显示其非金属矿物组合与大型‒超大型金矿床具有高度一致性；金属矿物指标平均相似性为0.70，与Lihir、Timmins等矿床相似性均超过0.80，同样具有较强共性.在构造与地质事件指标上，地质事件指标平均相似性为0.49，与Lihir矿床相似性达1.0，与Grasberg、Muruntau、Ladolam矿床相似性为0.5；断裂指标平均相似性为0.44，与Pueblo Viejo、Muruntau矿床相似性均大于0.6；褶皱指标平均相似性仅0.07，仅与Kalgoorlie矿床相似性为0.5，表明水口山矿床的构造运动和岩浆活动与部分大型‒超大型矿床具有可对比性，并且断裂控矿作用突出，但是褶皱控矿与多数大型‒超大型金矿存在明显差异.在成矿基础条件方面，岩石地层指标平均相似性仅为0.01，除与Timmins矿床相似性为0.1，存在微弱相似性外，与其余矿床相似性均为0；地质背景指标平均相似性为0.21，仅与Timmins、Ladolam矿床达到0.5，整体相似程度偏低；表明水口山矿床的赋矿地层条件与区域构造背景均具有显著独特性，与全球多数大型‒超大型金矿存在明显差异.岩石类型方面，沉积岩指标平均相似性为0.24，与Pueblo Viejo、Ladolam矿床相似性为0.3；火成岩指标平均相似性为0.13，仅与Grasberg矿床相似性相对较高为0.43；变质岩指标平均相似性为0；表明岩石类型组合与世界大型‒超大型金矿床匹配度不高，体现出水口山矿床具有相对独特的成矿岩石学背景.蚀变类型指标平均相似性为0.28，与Kalgoorlie、Muruntau矿床相似性分别为0.44和0.36，表明水口山矿床与世界大型‒超大型金矿床具有一定的热液蚀变共性.找矿标志指标平均相似性仅0.10，仅与Pueblo Viejo、Kalgoorlie矿床相似性为0.33，整体缺乏典型大型‒超大型金矿床的找矿标识.岩体指标平均相似性为0.20，仅与Ladolam矿床相似性达到0.5，表明岩体对成矿的控矿机制与世界大型‒超大型金矿床存在明显区别.

（2）黄金洞矿床与世界大型‒超大型金矿床在各地质指标上的相似性同样表现出明显的分异特征，且与水口山矿床存在差异.在矿物组成方面，该矿床以金属矿物为核心优势指标，与世界大型‒超大型金矿床的平均相似性达0.70，其中与Timmins、Muruntau等矿床相似性均超过0.70，体现出其金属矿物组合与世界大型‒超大型金矿具有较强的成矿共性；非金属矿物指标平均相似性为0.49，与Timmins和Muruntau矿床相似性均达0.67，显示出一定的非金属矿物相似性，但整体相似性弱于金属矿物指标.在构造和地质事件方面，地质事件指标平均相似性仅为0.07，仅与Lihir矿床相似性为0.5，与其余矿床相似性均为0；断裂指标平均相似性为0.35，与Lihir、Kalgoorlie矿床相似性分别为0.5和0.67；褶皱指标平均相似性为0.21，与Kalgoorlie、Timmins矿床相似性分别为1和0.5，其余矿床均为0，黄金洞金矿的地质事件的演化历程与多数世界大型‒超大型金矿床差异明显，断裂构造虽具一定控矿作用但整体匹配度不高，褶皱构造仅与个别矿床存在局部关联.在成矿基础条件方面，岩石地层指标平均相似性仅为0.10，仅与Pueblo Viejo、Timmins矿床相似性为0.2，存在微弱相似性，与其余矿床相似性均为0；地质背景指标平均相似性为0.21，仅与Timmins、Ladolam矿床相似性达到0.5，其余矿床均低于0.3，整体相似程度较低；表明黄金洞矿床的赋矿地层条件与区域构造背景均具有显著独特性，与全球多数大型‒超大型金矿存在差异.岩石类型方面，沉积岩、火成岩及变质岩指标平均相似性均为0，显示其岩石建造与世界大型‒超大型金矿床存在根本性差异.在蚀变与找矿标志方面，蚀变类型指标平均相似性为0.20，与Kalgoorlie、Timmins矿床相似性分别为0.42和0.38，其余矿床均低于0.3，仅与少数世界大型金矿床存在一定的热液蚀变共性；找矿标志指标平均相似性仅为0.14，仅与Pueblo Viejo、Kalgoorlie矿床相似性达0.5，整体缺乏与世界大型‒超大型金矿一致的找矿标识.岩体指标平均相似性为0.14，仅与Timmins矿床相似性达1.0，与其余矿床均为0，该结果与黄金洞矿床实际成矿弱依赖岩体的特征形成反差，需重新审视岩体指标的界定标准，或反映其与Timmins矿床在“非直接岩体控矿但岩体间接影响成矿流体”等隐性关联上存在共性.

（3）黄金洞和水口山矿床与世界7个大型‒超大型金矿的综合相似性均存在显著差异（图13和图14）.水口山矿床的综合相似性平均值为0.45，处于中等偏低水平，与Muruntau矿床的匹配度最高，相似性为0.58，接近中等相似程度，与Grasberg矿床的匹配度最低，相似性为0.39，整体呈现“ 单矿床高匹配、其余分布中等”的格局.黄金洞矿床的综合相似性平均值为0.32，低于水口山矿床，处于较低水平，与Timmins矿床的匹配度最高，相似性为0.51，是唯一接近中等相似的矿床，与Publo Viejo矿床的匹配度最低相似性为0.21，呈现“两极分化”的特征.两者共同特点是与Grasberg矿床的综合匹配度均最低，但水口山矿床整体相似性水平更高，且高匹配矿床的综合相似值略高于黄金洞矿床的最高值.

综上所述，黄金洞矿床虽在金属矿物维度与Timmins、Muruntau等超大型金矿具有高度相似性，但地层、构造、岩石类型等成矿基础条件与多数世界大型‒超大型金矿的相似性较低，且岩体控矿特征不显著、找矿标志匹配度低，其形成超大型矿床的潜力相对受限，该矿床可借鉴Timmins矿床的非直接岩浆控矿模式，将构造‒地层耦合带及深部隐伏构造界面作为重点勘查靶域.水口山矿床的非金属矿物与Pueblo Viejo、Lihir等超大型矿床具有高相似性，该矿床褶皱、断裂控矿作用突出，契合超大型矿床构造控矿特征，并且与Muruntau、Ladolam矿床可构建多维度类比体系，具备形成大型‒超大型矿床的更高潜力，水口山矿床应依托其与 Muruntau、Ladolam矿床的多维相似性特征，聚焦断裂构造交汇处及岩性接触带的深部延展，深部矿化的探明将成为其潜力释放的关键.

4 结论

本研究通过对江南造山带金矿及其邻区金矿知识图谱的社区聚类分析以及水口山和黄金洞矿床与世界大型‒超大型金矿床进行相似性分析，为矿床知识图谱挖掘提供了一定的参考性解决方案，本研究取得主要成果如下所示：

本文以江南造山带金矿及其邻区金矿为研究对象，采用自上而下构建方法，融合多维数据与专家知识，确立涵盖28类实体、10种语义关系的成矿‒勘查领域本体，覆盖地层、构造、岩浆岩等关键要素及成矿‒勘查系统语义关联，为知识图谱构建提供基础.基于该本体，通过词增强深度学习命名实体识别、BERT⁃CasRel关系抽取和大语言模型方法及消歧校正，构建包含与60个金矿床相关的2 212个实体、5 497条语义关系的知识图谱.

通过模块度社区聚类算法，将江南造山带金矿及邻区金矿知识图谱划分为19个类别，结合K=3的K⁃core分析剥离边缘信息，精准提取出蚀变组合、优势赋矿地层、构造控矿等核心控矿规律，并且对水口山矿床和黄金洞矿床知识图谱进行二次聚类，有效区分了水口山矽卡岩型与黄金洞变质热液型成矿模式.进一步以13个成矿地质要素为特征集合，通过Jaccard相似性系数量化对比两大矿床与7个世界大型‒超大型矿床，发现两大矿床与7个世界大型‒超大型矿床矿物组成具高度相似性，但成矿基础、找矿标志和岩体相似性低，其中水口山矿床因非金属矿物优势、构造匹配性强，综合相似性高于黄金洞矿床，形成大型‒超大型矿床潜力更高，可为区域成矿模式解析与深部勘查提供结构化知识支撑.

本文虽然对江南造山带金矿及邻区金矿知识图谱进行了一定的知识挖掘，但是知识图谱中遥感、重砂异常等实体稀缺，且数据多源于文献与报告，缺乏动态监测及野外实测属性数据.知识挖掘与分析深度有限，社区聚类语义解读依赖人工，矿床间相似性分析未考虑地质要素权重.下一步研究中需补充遥感、重砂异常等实体数据，整合动态监测数据与野外实测属性数据，提升知识图谱的数据完整性.与此同时优化矿床间相似性分析模型，引入地质要素权重赋值机制，结合成矿地质规律明确各要素的权重占比，提升相似性分析结果的科学性与精准性.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Bai, D. Y., Li, B., Zeng, G. Q., et al., 2025. Tectonic Ore⁃Controlling Characteristics and Dynamic Mechanism of the Hunan Segment of the Jiangnan Gold Ore Belt. Geotectonica et Metallogenia, Online (in Chinese with English abstract). https://link.cnki.net/urlid/44.1595.P.20251222.1628.002

[2]	Blondel, V. D., Guillaume, J., Lambiotte, R., et al.,2008. Fast Unfolding of Communities in Large Networks. Journal of Statistical Mechanics: Theory and Experiment,2008(10):P10008. https://iopscience.iop.org/article/10.1088/1742⁃5468/2008/10/P10008

[3]	Deng, Y. Y., Song, S. C., Fan, J. X., et al., 2024. Paleontology Knowledge Graph for Data⁃Driven Discovery. Journal of Earth Science, 35(3): 1024-1034. https://doi.org/10.1007/s12583⁃023⁃1943⁃9

[4]	Dong, S. C., Shi, Y. K., Ran, Y. Z., et al., 2024. Biological Classification System Knowledge Graph and Semi⁃Automatic Construction of Its Invertebrate Fossil Branches. Journal of Earth Science, 35(6): 2119-2128. https://doi.org/10.1007/s12583⁃023⁃1941⁃y

[5]	Enkhsaikhan, M., Liu, W., Holden, E. J., et al., 2021. Auto⁃Labelling Entities in Low⁃Resource Text: A Geological Case Study. Knowledge and Information Systems, 63(3): 695-715. https://doi.org/10.1007/s10115⁃020⁃01532⁃6

[6]	Guo, F., Lai, P., Huang, F. M., et al., 2024. Literature Review and Research Progress of Landslide Susceptibility Mapping Based on Knowledge Graph. Earth Science, 49(5): 1584-1606 (in Chinese with English abstract).

[7]	Kong, Y. X., Shi, G. Y., Wu, R. J., et al., 2019. K⁃Core: Theories and Applications. Physics Reports, 832: 1-32. https://doi.org/10.1016/j.physrep.2019.10.004

[8]	Li, G. Z., Wang, P., Liu, J. J., et al., 2024. Meta In⁃Context Learning Makes Large Language Models Better Zero and Few⁃Shot Relation Extractors. arXiv, 2404.17807. https://arxiv.org/abs/2404.17807

[9]	Li, J., Huang, X. J., Gao, Y. T., et al., 2022. Distant Supervised Relation Extraction Based on Sentence⁃Level Attention with Relation Alignment. Artificial Intelligence and Security. Cham: Springer International Publishing: 142-152. https://doi.org/10.1007/978⁃3⁃031⁃06794⁃5_12

[10]	Li, S., Chen, J. P., Xiang, J., 2018. Prospecting Information Extraction by Text Mining Based on Convolutional Neural Networks: A Case Study of the Lala Copper Deposit, China. IEEE Access, 6: 52286-52297. https://ieeexplore.ieee.org/document/8466566

[11]	Ma, X. F., 2025. Research on Knowledge Extraction Method of Geological Hazards Based on Large Models (Dissertation). Qinghai Normal University, Xining (in Chinese with English abstract).

[12]	Ma, X. G., Ma, C., Wang, C. B., 2020. A New Structure for Representing and Tracking Version Information in a Deep Time Knowledge Graph. Computers & Geosciences, 145: 104620. https://doi.org/10.1016/j.cageo.2020.104620

[13]	Newman, M. E. J., 2006. Modularity and Community Structure in Networks. Proceedings of the National Academy of Sciences of the United States of America, 103(23): 8577-8582. https://doi.org/10.1073/pnas.0601602103

[14]	Niwattanakul, S., Singthongchai, J., Naenudorn, E., et al., 2013. Using of Jaccard Coefficient for Keywords Similarity. The International Multiconference of Engineers and Computer Scientists, Hong Kong.

[15]	Peng, C. Y., Xia, F., Naseriparsa, M., et al., 2023. Knowledge Graphs: Opportunities and Challenges. Artificial Intelligence Review, 56(11): 13071-13102. https://doi.org/10.1007/s10462⁃023⁃10465⁃9

[16]	Qiu, Q. J., Ma, K., Lü, H. R., et al., 2023a. Construction and Application of a Knowledge Graph for Iron Deposits Using Text Mining Analytics and a Deep Learning Algorithm. Mathematical Geosciences, 55(3): 423-456. https://doi.org/10.1007/s11004⁃023⁃10050⁃4

[17]	Qiu, Q. J., Tian, M., Xie, Z., et al., 2023b. Extracting Named Entity Using Entity Labeling in Geological Text Using Deep Learning Approach. Journal of Earth Science, 34(5): 1406-1417. https://doi.org/10.1007/s12583⁃022⁃1789⁃8

[18]	Qiu, Q. J., Wu, L., Ma, K., et al., 2023. A Knowledge Graph Construction Method for Geohazard Chain for Disaster Emergency Response. Earth Science, 48(5): 1875-1891 (in Chinese with English abstract).

[19]	Qiu, Q. J., Xie, Z., Wu, L., et al., 2020. Dictionary⁃Based Automated Information Extraction from Geological Documents Using a Deep Learning Algorithm. Earth and Space Science, 7(3): e2019EA000993. https://doi.org/10.1029/2019ea000993

[20]	Tian, M., Ma, K., Wu, Q. R., et al., 2024. Joint Extraction of Entity Relations from Geological Reports Based on a Novel Relation Graph Convolutional Network. Computers & Geosciences, 187: 105571. https://doi.org/10.1016/j.cageo.2024.105571

[21]	Vaswani, A., Shazeer, N., Parmar, N., et al., 2017. Attention is All You Need. Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach. https://doi.org/10.5555/3295222.3295349

[22]	Wang, B., Wu, L., Xie, Z., et al., 2022. Understanding Geological Reports Based on Knowledge Graphs Using a Deep Learning Approach. Computers & Geosciences, 168: 105229. https://doi.org/10.1016/j.cageo.2022.105229

[23]

Wang, C. B., Li, Y. J., Chen, J. G., 2023. Text Mining and Knowledge Graph Construction from Geoscience Literature Legacy: A Review. In: Ma, X., Mookerjee, M., Hsu, L., et al., eds., Recent Advancement in Geoinformatics and Data Science. Geological Society of America, New York. https://doi.org/10.1130/2022.2558(02)

[24]	Wang, C. B., Ma, X. G., Chen, J. G., et al., 2018. Information Extraction and Knowledge Graph Construction from Geoscience Literature. Computers & Geosciences, 112: 112-120. https://doi.org/10.1016/j.cageo.2017.12.007

[25]	Wang, J. X., 2024. Intelligent Identification of Prospecting Criteria for Porphyry Copper Deposits Based on Large Language Models (Dissertation). Jilin University, Changchun (in Chinese with English abstract).

[26]	Wei, Z. P., Su, J. L., Wang, Y., et al., 2020. A Novel Cascade Binary Tagging Framework for Relational Triple Extraction. The 58th Annual Meeting of the Association for Computational Linguistics. Online.10.18653/v1/2020.acl⁃main.136

[27]	Wu, R. Z., Li, H., Mei, H. B., et al., 2025. A Landslide Monitoring and Early Warning System with Retrieval⁃Augmented Generation Enhanced by Knowledge Graph. Earth Science, 50(10): 4125-4136 (in Chinese with English abstract).

[28]	Xiao, D., Song, W. G., Yan, Z. F., et al., 2025. Geological Characteristics, Metallogenic Regularity and Metallogenic Model of Gold Deposits in the Xuefeng Arcuate Tectonic Belt of Hunan Province. Geology and Exploration, 61(3): 450-463 (in Chinese with English abstract).

[29]	Yang, X., Sun, L., Liu, M. L., et al., 2025. Knowledge Graph Construction with BERT⁃BiLSTM⁃IDCNN⁃CRF and Graph Algorithms for Metallogenic Pattern Discovery: A Case Study of Pegmatite⁃Type Lithium Deposits in China. Ore Geology Reviews, 179: 106514. https://doi.org/10.1016/j.oregeorev.2025.106514

[30]	Zhang, L. N., Hou, Z. S., Shen, B. H., et al., 2023a. Paleobiogeographic Knowledge Graph: An Ongoing Work with Fundamental Support for Future Research. Journal of Earth Science, 34(5): 1339-1349. https://doi.org/10.1007/s12583⁃023⁃1845⁃z

[31]	Zhang, L., Hou, M. C., Chen, A. Q., et al., 2023b. Construction of a Fluvial Facies Knowledge Graph and Its Application in Sedimentary Facies Identification. Geoscience Frontiers, 14(2): 101521. https://doi.org/10.1016/j.gsf.2022.101521

[32]	Zhou, C. H., Wang, H., Wang, C. S., et al. 2021. Research on Geoscience Knowledge Graph in the Big Data Era. Scientia Sinica Terrae, 51(7): 1070-1079 (in Chinese with English abstract).

[33]	Zhou, C. H., Wang, H., Wang, C. S., et al., 2021. Geoscience Knowledge Graph in the Big Data Era. Science China Earth Sciences, 64(7): 1105-1114. https://doi.org/10.1007/s11430⁃020⁃9750⁃4

[34]	Zhou, S. Z., Meng, Y., Jin, B. W., et al., 2024. Grasping the Essentials: Tailoring Large Language Models for Zero⁃Shot Relation Extraction. arXiv, 2402.11142. https://arxiv.org/abs/2402.11142

基金资助

湖南省地质院重大项目(HNGSTP202401)

国家重点研发计划项目(2022YFF0801202)

地球深部探测与矿产资源勘查国家科技重大专项(2024ZD1001205⁃05)

地球深部探测与矿产资源勘查国家科技重大专项(2025ZD1007803)

AI Summary AI Mindmap

PDF (10266KB)

访问

被引

详细

导航

Received	Accepted	Published
2025-12-07
Issue Date
2026-05-13

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引言

1 金矿领域本体模型构建

1.1 实体类型定义

1.2 关系类型定义

2 江南造山带金矿知识图谱构建

2.1 知识图谱构建方法

2.1.1 基于词增强深度学习的命名实体识别

2.1.2 基于BERT⁃CasRel的语义关系抽取模型

2.1.3 基于大语言模型的实体关系抽取模型

2.2 实体类型统计分析

2.3 关系类型统计分析