大语言模型赋能的地质找矿知识图谱与问答模型构建

张宝一; 唐嘉成; 张彤蕴; 王宾海; 史与正; 詹庆忠; 方振西; Kablan Or Aimon Brou Koffi; 马凯

doi:10.3799/dqkx.2025.176

地球科学 ›› 2026, Vol. 51 ›› Issue (03) : 982 -995. DOI: 10.3799/dqkx.2025.176

大语言模型赋能的地质找矿知识图谱与问答模型构建

张宝一 ¹^,² ,
唐嘉成 ¹^,² ,
张彤蕴 ³ ,
王宾海 ³ ,
史与正 ³ ,
詹庆忠 ⁴ ,
方振西 ¹^,² ,
Kablan Or Aimon Brou Koffi ¹^,² ,
马凯 ⁴

作者信息 +

Knowledge Graph and Question-Answering Model for Geological Prospecting Empowered by Large Language Models

Author information +

文章历史 +

PDF (3754K)

摘要

当前地质找矿领域的大语言模型应用面临着专业知识不足、数据隐私安全和模型幻觉等问题，同时大语言模型在地质找矿领域应用中仍缺乏高效快捷的知识推荐手段.本研究提出了知识图谱与检索增强生成相结合的KG-RAG （Knowledge Graph Retrieval-Augmented Generation）框架，以大语言模型为工具，在地质本体约束下实现了地质找矿知识图谱的自动化抽取和结构化表达，同时利用知识图谱的多跳检索算法实现检索内容的深度与广度优化，构建了地质找矿智能知识问答模型.实验结果表明：在知识图谱构建任务中，KG-RAG的准确率、召回率和可信度（F1分数）分别为0.807、0.833和0.819，相比大语言基模型GLM4-9B的直接知识抽取，分别取得了约50%、8%和29%的提升；在问答任务中，KG-RAG召回率和准确率分别为0.917和0.88，相比文档向量检索增强生成方法分别取得了约24%和22%的提升.KG-RAG在知识图谱构建与智能问答两方面均表现出了较好的性能，能够有效从地质资料中进行地质找矿知识收集与表达，支持地质工作者的地质调查与找矿预测工作，本研究为大语言模型与知识图谱的联合应用提供了借鉴.

Abstract

Current applications of Large Language Models (LLMs) in geological prospecting face challenges including insufficient domain expertise, data privacy concerns, and model hallucinations. Furthermore, there remains a lack of efficient and rapid knowledge recommendation methods for LLMs in this field. This study proposes a KG-RAG (Knowledge Graph-Embedded Retrieval-Augmented Generation) framework that automates the extraction and structured representation of geological prospecting knowledge under the constraints of a geological ontology, leveraging large LLMs as tools. It further employs multi-hop retrieval algorithms within the knowledge graph to enhance the depth and breadth of retrieved content, thereby constructing an intelligent question-answering model for geological prospecting. Experimental results demonstrate that KG-RAG achieves scores of 0.807 (Precision), 0.833 (Recall), and 0.819 (F1-score) in knowledge graph construction tasks. Compared to direct knowledge extraction using the baseline LLM (GLM4-9B), KG-RAG delivers improvements of approximately 50% (Precision), 8% (Recall), and 29% (F1-score), respectively. In question-answering tasks, KG-RAG achieves 0.917 (Recall) and 0.88 (Precision), outperforming document vector-embedded retrieval-augmented generation methods by approximately 24% (Recall) and 22% (Precision), respectively. KG-RAG exhibits superior performance in both knowledge graph construction and intelligent question-answering. It effectively collects and represents geological prospecting and mineral exploration knowledge, providing a valuable reference to geologists for the combined application of LLMs and knowledge graphs.

Graphical abstract

关键词

地质找矿 / 知识图谱 / 大语言模型 / 检索增强生成 / 地质本体 / 思维链.

Key words

geological prospecting / knowledge graph / large language models / retrieval augmented generation / geological ontology / chain of thought

引用本文

引用格式 ▾

张宝一,唐嘉成,张彤蕴,王宾海,史与正,詹庆忠,方振西,Kablan Or Aimon Brou Koffi,马凯. 大语言模型赋能的地质找矿知识图谱与问答模型构建[J]. 地球科学, 2026, 51(03): 982-995 DOI:10.3799/dqkx.2025.176

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

大数据与人工智能技术的迅猛发展为科学研究范式带来了深刻变革.在地学领域，地质勘探作为典型的数据密集型科学工作，其数据的收集、更新、维护、挖掘与分析已成为地学研究的重要内容（王登红等， 2015；周永章等， 2021； Zhang et al.， 2023）.当前人工智能逐步演进到大语言模型（Large Language Models， LLMs）阶段，LLMs已经在各种自然语言处理任务中取得了巨大成功，表现出了令人印象深刻的Zero⁃shot和Few⁃shot性能，其代表模型有GPT⁃3、GPT⁃4、LLaMa、ChatGLM和DeepSeek等（Floridi and Chiriatti， 2020； Katz et al.， 2024；徐春等， 2024； Dreyer， 2025； Wang et al.， 2025）.受益于大量的模型参数和广泛的预训练语料库，LLMs可以通过提示词工程和上下文学习来解决复杂的推理任务（Zhang et al.， 2024a；佟彬等， 2025；吴华意等， 2025）.在地学领域，LLMs有助于地学知识理解与问题解决，Hu et al.（2023）将位置描述的地理知识和LLMs进行结合，有效提取了自然灾害的位置信息；Memduhoğlu et al.（2024）提出了使用LLMs来解读OpenStreetMap标签的方法，通过LLMs嵌入捕捉深度语境理解，结合物理和空间指标来对城市建筑功能进行分类；Zhang et al. （2024b）开发了一款融合LLMs和地理空间数据的人工智能助手GeoGPT，结合知识链和扩展工具实现了空间分析和文本报告生成；de Almeida et al.（2025）利用GPT⁃4和微软Azure创建了一个文本转视频生成工具，以增强采矿中的安全报告；Fu et al.（2025）开发了云南省地质和矿产勘探智能问答系统 GeoMinLM，通过知识图谱整合专家知识，减少幻觉现象并提高专业性；Li et al. （2025）开发了面向地理空间数据问答系统GDQA，将地理空间数据知识图谱GDKG与LLMs相结合，使LLMs能够在GDKG上进行推理和探索，从而增强其理解和回答复杂地球科学查询的能力；吴若玲和郭旦怀（2025）开展了LLMs在空间认知问题上的测试标准研究，最终形成一套具备LLMs空间认知能力的测试标准框架SRT4LLM和测试流程.然而需要注意的是，LLMs在地学领域应用过程中，也面临着专业知识不足、数据隐私安全和模型幻觉等挑战.

为解决LLMs “幻觉”问题，检索增强生成（Retrieval⁃Augmented Generation，RAG）技术应运而生.RAG以外挂知识库的方式，能有效避免隐私数据泄露，同时在内容生成过程中，会检索大规模知识集合，生成的内容更丰富，有效增强LLMs的泛化能力（Chen et al.， 2025；江双五等， 2025）.目前主流使用的RAG框架有LangChain、LangChain⁃ Chatchat、LlmaIndex和RAGFlow（Church et al.， 2024； Vidivelli et al.， 2024；Hosseini and Seilani， 2025）.随着DBpedia（Bizer et al.， 2009）、多模态地球科学知识图谱GAKG（董少春等， 2020）、地球科学数据语料库ESDC（Li et al.， 2024）等国内外地学领域开放知识库的迅猛增长，知识图谱（Knowledge Graph， KG）已广泛用于支持语义网络的各类地学应用（Ma， 2022；邱芹军等， 2023；郭飞等， 2024；王成彬等， 2024）.Jiang et al.（2020）提出了一种知识增强对话生成模型KADG，通过预先优化每个知识候选对象并结合推断出的话题转换线索来进行一跳主题推理，并充分利用所选知识生成上下文连贯且富有知识性的回答；Liang et al.（2025）提出了基于图的检索增强生成框架GeoGraphRAG，从外部知识库中检索相关子图，并将结构和语义信息注入到LLMs中用于地理空间建模.然而，地质找矿领域的知识推荐需要一套以成矿概念与数据混合驱动的背景信息组织方法，当前的文档向量RAG和知识库RAG并不能完全胜任这份工作.

面向地质找矿领域的大语言模型应用，本研究提出结合大语言模型和知识图谱的检索增强生成框架KG⁃RAG （Knowledge Graph Retrieval⁃Augmented Generation）来实现地质领域的知识抽取与知识应用，解决地质找矿领域的知识图谱构建中依赖人工标注、扩展性差等问题，同时针对地质找矿应用的知识碎片化与智能化不足的问题，通过将结构化的知识图谱嵌入RAG增强生成机制中，实现地质找矿信息的深层次和多粒度检索.

1 KG⁃RAG框架

针对地质知识图谱构建与找矿问答推荐任务，本研究融合大语言模型、知识图谱和检索增强生成构建了KG⁃RAG框架，如图1所示，包括：利用语料数据、大语言模型和提示词工程实现知识图谱的构建，以及通过大语言模型、检索增强生成和知识图谱信息实现问答推荐.

由于地质资料的涉密性，在知识图谱构建与地质找矿知识推荐中，采用了本地部署GLM4⁃9B大语言模型来辅助实现两类任务.两类任务均采用思维链（Chain of Thought， CoT）进行任务逻辑拆分，以保证复杂任务能够有效进行分解，从而使得9B参数的GLM4大语言模型能够有效执行单次逻辑推理分析任务.同时对提示词模板进行参数化，以保证在知识图谱构建中的地质本体模式层约束，在知识推荐中提示词参数化则为知识图谱节点提供增强检索生成的入口链接.

1.1　大语言模型辅助构建知识图谱

地质找矿知识图谱本体模式层是对地质找矿领域概念体系的形式化规范，通过概念节点与关系边构建语义网络，为数据层实例的属性分解和关联推理提供理论框架.本研究从地理、地层、岩体、构造、地质年代、成矿要素、地球物理、地球化学这8类要素进行了总结，通过先验知识厘定各要素的层次关系、定义属性关系及语义关系，如图2所示.

在抽取地质找矿知识的信息时，需要利用CoT流程辅助大语言模型进行推理工程.思维链的意义是让大语言模型逐步参与，将一个复杂问题分解为一步一步的子问题并依次求解.CoT允许垂直领域的大语言模型应用，将复杂推理任务进行分解，从而保证模型的有效性；同时，CoT也在任务构建与调优过程中显式地表达任务中存在的问题与正确思考，如图3所示.提示词设计（图4）分为模糊关键词匹配推理、三元组知识抽取和知识校验与规则迭代三部分.

1.1.1　模糊关键词匹配

模糊关键词匹配主要是利用本体定义的实体类型和关系规则进行信息抽取、获取相关语料，在语料的基础上进行信息分析与评价，从而为后续三元组知识抽取提供推理信息，其逻辑映射可以表达为：

i n f o = f p r o m p t i n f o, o n t o, t x t,

(1)

其中，

i n f o

为大语言模型推理的知识分析文本，

f

表示大语言模型映射函数，

p r o m p t i n f o

表示模糊关键词推理的提示词模板，

o n t o

表示本体定义的实体和关系，

t x t

表示基于关键词匹配的上下文语料.

1.1.2　三元组知识抽取

三元组知识抽取是按照本体设计的上下框架进行从顶层到底层的实体节点抽取.在抽取对应层级的实体节点时，利用本体定义关系对其进行锚定，从而避免得到错误的结果.同时在提示词工程中，利用Few⁃shot的示例回答机制，将对应实体节点的实例

G e o l i n s t a n c e

进行补充，从而让大语言模型对抽取的三元组与正确三元组进行形式与内容上的比对，最终有效从上下文分析的语料中抽取出三元组.Few⁃shot不需覆盖全部预定义关系，而是按照专家经验设置少量回答模板来引导模型进行回答.

1.1.3　知识校验与规则迭代

本研究采用的是9B等级的本地大语言模型，尽管大语言模型大部分情况下能对提示词工程任务进行有效和合理地反馈，但是也会存在错误分类的情况，因此有必要在推理思维链中补充校正与规范化输出的过程.本研究将抽取得到的三元组与本体设计的规则以及实例进行匹配验证，让大语言模型判别三元组的合理性，从而建立补充规则以优化原始关系定义的描述，最终改善大语言模型推理的效果，得到结构化的三元组结果输出.

1.2　知识图谱增强大语言模型

检索增强生成是指结合文本嵌入模型和生成模型，利用外部知识库补充大语言模型的隐性知识.传统文档向量化的检索增强生成面临着地质文本数据集Chunk划分困难和长文本信息噪声导致的弱相关性问题，为此本研究设计了一个基于知识图谱的检索增强生成框架，旨在结合知识图谱和嵌入模型，通过多跳关系检索相关知识，以取代文档级检索增强生成流程，优化问答效果.实验使用的Embedding模型是MiniCPM⁃Embedding，模型参数大小为2.4B，结合知识图谱的检索增强生成流程如图5所示.以问题“川口区域的地层出露状况是什么”为例，首先，经过问题重构后将保留主要关键词“川口区域、地层、出露状况”等集合，通过对上述重组的关键字利用嵌入模型形成特征向量，同时从图数据库中将三元组知识进行图嵌入以形成特征向量；其次，在第一次相似性排序可以获取诸如“川口区域，出露的地层，泥盆系跳马涧组”等高度语义相似性的知识信息；最后，利用图节点进行多跳扩展，便可以从“川口区域”和“泥盆系跳马涧组”进行相关节点检索，从而得到诸如“泥盆系跳马涧组，岩性，巨厚层状石英砾岩”和“泥盆系跳马涧组，上段厚度，约35 m”的详细地层背景信息，从而摆脱原始Chunk划分对于引申信息的弱关联性，并通过辅助回答模板对问答推荐进行生成.优化问题的输入，主要是提取问题的关键词，从而弱化原始问题文本对回答的影响.问题重构不会强制依赖知识图谱，而会根据关键词属性关联图结构，即通过关键词与节点属性的相似性进行关联.

通过将问答模型的自然语言交互进行任务逻辑划分，从而让大语言模型能够构建一条逻辑推理，提示词工程设计如图6所示，分为任务描述/角色定义、找矿知识图谱利用和回答示例补充.通过该提示词确保LLM生成的回答既准确又符合专业领域的表达方式，同时也提高了可控性.

1.2.1　任务描述/角色定义

通过提示词让LLM扮演地质专家角色，确保回答具有专业性和针对性.同时对原始问题进行输入，让LLM基于这个输入进行回答.同时强调回答的目标是“解答地质找矿相关问题”，而不是提供通用信息，避免回答泛化.

1.2.2　地质找矿知识图谱的利用

首要是明确LLM的回答，要求LLM的回答基于三元组提供的信息，而不是凭空生成.同时要求前后文风格一致性，以便LLM的回答能够按照后续示例进行优化，保证回答的规范性.还要通过列出所有使用的三元组来源，确保信息的可溯源性，并且采用标准格式进行输出，方便对回答三元组进行解析.

1.2.3　示例提示

通过提供参考领域问题和答案，帮助LLM理解理想的回答风格、格式和内容层次.在Few⁃shot的基础上，LLM可以基于示例的结构进行模仿，确保输出风格与预期一致.同时面对不同类型的问题，让LLM学会如何灵活处理各种输入.

2 大语言模型赋能的知识图谱构建

2.1　语料库制作

本研究所采用的数据集源自湖南省衡阳市川口钨矿田的地质勘探资料，涵盖川口、白水、毛湾、塘江沅共4个主要钨矿床（宋宏邦等， 2002；蔡富成等， 2021；Li et al.， 2023）.前人在川口钨矿田已经完成多次地质勘探工作，并分析了其矿床类型与地球化学特征，对其成矿规律进行了总结（彭能立等， 2017；Qin et al.， 2020； Li et al.， 2021）.收集的文档资料主要包括钨矿普查总结报告、钨矿普查设计书、地球物理勘探报告、质量总结报告等17类地质技术文档，如表1所示.这些资料以PDF格式为主，辅以部分Word与Excel文档，其内容涵盖地质背景调查、勘查设计、物探成果、找矿结论等关键信息，全面反映了区域内的成矿特征与勘探工作进展.

在对地质文档进行知识抽取前，需要对文档资料数据集进行非结构化数据转换，进行图文表分割以便进一步处理.数据预处理流程分为以下4步：首先，数据输入主要包括数据的收集与归类；其次，转换与筛选主要是为文本数据集的字符串收集进行统一处理；再次，句子分割则是将字符串数据集进行合理地拆分，以保证输入大语言模型的语义连贯性；最后，校正优化则是补充自动化算法的遗漏或者校正错误.

采用pdfplumber进行图文表的划分，同时在数据拆分时能够有效去除噪声字符，如文档中的页码和页眉等信息.然后，通过集成spaCy的中文大语言模型包zh_core_web_lg对预处理数据进行句子分割以保证语义完整性，便于大语言模型能够有效地理解内容.对于文本T，每个词

t i

被赋予一个标签

s i

，表示该词是否是句子的边界：

s i = 1, t i 是句 子结 束点 0, t i 不是 句子 结束 点,

(2)

式（2）中主要采用3类规则进行句子边界约束，即标点符号规则

R t i

、依存关系规则

D t i

和机器学习概率模型规则

P t i

R t i = 1, 如果 t i ∈ ., ?,! 且满 足上 下文 条件 0, 否则,

(3)

D t i = 1, 如果 d e p t i = p u n c t 且 h e a d t i = R o o t 0, 否则,

(4)

其中，

R o o t

表示句子的主谓结构结束，

p u n c t

表示句尾标点符号依附于主句.

d e p t i

表示对

t i

词互补性依存关系判断，

h e a d t i

表示对

t i

词进行句法依存中的头节点进行判断.

P t i = σ W ⋅ ϕ t i + b,

(5)

其中，

W

表示权重向量，

b

表示偏置量，σ表示激活函数，

ϕ (t i)

表示对词

t i

的词性标注.

2.2　地质找矿知识图谱

经过上述提示词引导的大语言模型三元组抽取工作之后，最终累计获得了973条与领域相关的三元组数据，部分实例如表2所示.

本研究从知识覆盖度和关联完备性两个维度评估了知识图谱质量，具体指标定义如下：

（1）知识覆盖度（丰度指标），知识覆盖度用于衡量图谱信息量的充分程度，其核心特征表现为：实体属性的完备性、关系连接的密集程度和概念层次的完整性.基于图论中的节点中心性理论，本研究用度中心性作为量化指标.具体而言，通过计算实体节点的平均连接度（包含入度和出度）来评估知识覆盖水平，平均度（aveD）的计算式为：

a v e D G = ∑ i = 0 V D v i V, D v i = ∑ i = 0 V a i j,

(6)

其中，

D v i

代表每个顶点V的度.

（2）链接预测（Link Prediction），链接预测通常是评估知识图谱推理能力的正确性，直接衡量了知识图谱中隐藏信息的推理能力.知识图谱的推理能力指的是基于现有的三元组，推导出新的合理三元组的能力.这对于评估非监督知识图谱构建的有效性非常重要，因为推理能力直接与图谱的表现能力相关.通过这种方式，可以评估图谱的推理是否能够从已有的三元组推导出新的知识.本研究使用了准确性和召回率指标，具体定义如下：

（a）准确性.准确性反映了知识图谱中存储的三元组是否正确地表达了实体之间的关系.在实际应用中，由于知识图谱构建通常依赖于自动化方法（如关系抽取模型、实体识别等），因此会存在一定的错误信息.通过比较知识图谱中的推理结果与已知的真实数据进行匹配，能够量化图谱的准确性.具体通过MRR（Mean Reciprocal Rank）和Hits@K（K=1，3，10）指标来量化预测的准确度.

M R R = 1 T ∑ i = 1 T 1 r i,

(7)

其中，

r i

是第

i

个预测的排名，

T

是测试集中三元组的数量.MRR衡量的是所有预测中正确三元组的平均倒数排名，值越大表示模型预测准确度越高.

Hits@K则是衡量在前K个预测中，正确答案是否出现在其中，即：

H i t s @ K = 正确 的预 测数 量 总预 测数 量 .

(8)

（b）召回率.召回率衡量的是模型从知识图谱中检索到的正确实体和关系的比例.尽管模型在某些任务中具有较高的准确性，但往往可能会遗漏某些真实的实体或关系，因此召回率能够有效衡量模型的检索能力.为了评估召回率，本研究采用Hits@3和Hits@10等指标，测试模型在多个预测中能否识别出正确的尾实体.较高的Hits@3和Hits@10值表明，模型在大范围的预测中能够涵盖更多的真实实体.

本研究构建的地质找矿知识图谱评估如表3所示.当前知识图谱节点总数小于1 000个节点，属于轻量级，因此丰度的合理区间为2~5.本研究构建的平均丰度数表现为3.05，这个结果表明图谱相对不是特别稀疏，但仍存在许多低度数节点.其中经统计发现度数为1的节点占比最高，说明知识图谱中有许多“孤立”实体，其原因是部分实体节点作为属性表现出了“叶子节点现象”，比如“岩性，走向，厚度”等关系对应的属性实体.同时少数节点在度数呈现几十的数量级，这说明这些节点连接了大量其他节点，主要是矿区和地质单元节点，可能在矿区这个概念细分得不够彻底，导致该节点存在过度泛化的现象.本研究采用TransE作为预测模型，在MRR实验中计算结果为0.631，符合0.5~0.8的合理区间，这一结果表明，模型在预测尾实体时，能够相对较好地找到正确的实体.

2.3　知识图谱构建方法对比

为验证本文知识图谱构建方法的有效性，将本文方法与基于纯语料的知识图谱构建方法（ChatGLM⁃9B）进行了比较.人工标记了100份语料（表4），选取了精确率、召回率和可信度进行方法比较.

（1）精确率（Precision），用于评估在模型预测的正例中，实际为正的比例.在面对地质垂直领域的知识图谱构建时，高精确率意味着可以有效避免生成大量无效或者错误的三元组，从而衡量有多少实际相关的地质知识被成功抽取出来.

P r e c i s i o n = T P T P + F P,

(9)

其中，TP（True Positives）表示模型正确预测的三元组数量，即预测为地质知识相关三元组且实际也为地质知识相关的三元组；FP（False Positives）表示模型错误预测的三元组数量，即模型预测为地质知识相关但实际与领域主题无关的三元组.

（2）召回率（Recall），用于衡量模型是否能捕捉到所有的正例三元组，即所有实际相关的三元组中有多少被模型正确识别出来.高召回率意味着模型能够从大量的语料中提取出更多的潜在知识.对于地质找矿知识图谱构建任务，较高的召回率有助于确保图谱中包含尽可能多的知识信息.

R e c a l l = T P T P + F N,

(10)

其中，FN（False Negatives）为模型漏掉的三元组数量，即预测为不相关的三元组但实际是相关的三元组数量.

（3）可信度（F1⁃socre）是精确率和召回率的调和平均数，用于综合考虑精确率和召回率的指标.对于知识图谱构建任务，F1⁃score能够平衡精确率和召回率，避免只关注一方面导致的偏差.

F 1 ⁃ s c o r e = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l .

(11)

根据上述评估方法，地质找矿知识图谱构建的实验评估结果如表5所示.

3 地质找矿智能问答模型构建

3.1　地质找矿问答模型

地质找矿问答模型允许人工输入自然语言问句与大语言模型进行交互，大模型根据自然语句执行知识图谱检索增强生成（KG⁃RAG），从而得到领域内的专业结果.例如，对于问题“毛湾区域存在哪些地层，这些地层的岩性是什么？”的回答（图7），KG⁃RAG能够正确总结区域地层及岩性信息，而不使用知识图谱的大语言直接回答，避免缺乏地质背景信息产生幻觉，进行信息捏造.

此外，本研究分别从矿区的找矿标志和控矿因素进行提问，问答模型均能从众多提供的背景信息三元组中选择相关的成矿信息进行总结回答，如图8所示.

3.2　检索增强生成方法对比

为验证本研究所提出KG⁃RAG模型的有效性，分别与微软的GraphRAG（https：//github.com/microsoft/graphrag）、基于LangChain构建的文档级检索增强生成（Doc RAG）模块以及不采用RAG方案（No RAG）的单纯大语言模型进行比较，实验共设置100组问答对.选取了检索增强生成任务中常用的召回率和可信度来评估模型的检索性能与生成质量，并增加了准确率作为整体输出效果评估指标.

（1）召回率（Recall）：通过将检索内容与正确回答所涉及的事实内容进行比较从而确定是否检索到有效信息，在文档级Doc RAG中，为统计检索到的Chunk（

C h u n k r e t r i e v a l

）中包含标准答案Chunk（

C h u n k t r u e

）的比例；在知识图谱级GraphRAG和KG⁃RAG中，则统计检索三元组（

T r i p l e r e t r i e v a l

）中涵盖正确答案（

T r i p l e t r u e

）的比例.召回率计算公式为：

R e c a l l = C h u n k r e t r i e v a l C h u n k t r u e, f o r D o c T r i p l e r e t r i e v a l T r i p l e t r u e, f o r K G .

(12)

（2）可信度（Faithfulness）：用以评估大语言模型的生成是否基于检索结果，不添加无关信息或歪曲事实.可信度能直接衡量生成内容是否严格遵循检索到的证据，从而减轻幻觉或篡改事实.本研究将检索生成事实（

C h u n k g e n e r a t i o n

或

T r i p l e g e n e r a t i o n

），与检索正确事实（

C h u n k r e t r i e v a l

或

T r i p l e r e t r i e v a l

）进行对照，如果检索生成结果无法与事实匹配，则视为幻觉生成.可信度指标计算公式为：

F a i t h f u l n e s s = C h u n k g e n e r a t i o n C h u n k r e t r i e v a l, f o r D o c T r i p l e g e n e r a t i o n T r i p l e r e t r i e v a l, f o r K G .

(13)

（3）准确率（Accuracy）：用以衡量采用RAG方案前后的模型输出正确与否，本研究采用预测回答和标准回答的语义相似性值进行判定，从而确定预测回答（

A n s w e r i n g

）是否为正确回答（

A n s w e r i n g t r u e

），准确性计算公式为：

A c c u r a c y = A n s w e r i n g t r u e A n s w e r i n g .

(14)

根据上述评估方法，问答关联检索的实验结果评价如表6所示.实验结果表明，KG⁃RAG在各项指标上都取得了最好的表现，尤其是召回率和准确率方面，验证了结构化的知识能够显著提升检索和生成的效果.

4 结论

本研究围绕地质找矿领域的知识图谱构建、大语言模型问答优化展开，提出了一种融合地质找矿知识图谱的增强检索框架（KG⁃RAG），建立了从数据采集处理、知识抽取、知识组织、问答优化到实际应用的完整流程，不仅为地质找矿提供了新的智能问答模型，也为大语言模型与知识图谱的联合应用提供了借鉴.本研究取得的主要结论如下：

（1）采用大语言模型辅助进行知识图谱的构建，避免了监督方法依赖人工标注数据的问题，同时面对大语言模型的数据信息噪声干扰、实体关系抽取准确率下降与知识融合不稳定问题，以地质找矿本体模式层作为指导，配合模糊关键词匹配算法，有效改善了地质文本语料中的信息冗余和数据噪声问题，实现了地质知识的自动化抽取和结构化组织.

（2）利用本体模式层引导大语言模型提示词工程的思维链，通过实体关系分析、三元组抽取和知识校验三步走的思维链，改善了相较于通用大语言模型在地质找矿领域知识抽取的准确率下降问题和知识融合问题，从地质文献、报告、数据库等多种数据源中有效提取地质实体及其关系.

（3）提出了知识图谱与检索增强生成结合的KG⁃RAG框架，搭建了地质找矿智能问答模型，利用知识图谱和思维链引导替代了传统文档向量RAG手段的Chunk划分，改善了在地质知识中长上下文Chunk划分困难与Chunk段落检索相关性低的问题，同时利用多跳检索算法，将问答模型进行深度与广度拓展，确保了回答检索信息的全面性与可靠性.

本研究提出的地质找矿智能问答模型的KG⁃RAG框架，仍存在一些需要进一步优化和拓展的方向：首先，大语言模型在地质找矿知识推理和生成方面仍存在“幻觉”问题，可以进一步引入基于知识图谱的事实验证机制，以及结合多轮对话增强，提高模型问答的可信度和逻辑一致性；其次，目前的知识图谱构建主要以文本数据为主，然而地质找矿领域的地、物、化、遥的数据形式丰富，如何将地质大数据的多模态信息有效地映射到知识图谱中，提高知识表示的多样性和完整性，也是未来的重要研究方向.

本研究的Python源代码（KG⁃RAG）可在Github上开放获取（https：//github.com/Geo3D-AI-CSU/KG-RAG）.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Bizer, C., Lehmann, J., Kobilarov, G., et al., 2009. DBpedia: A Crystallization Point for the Web of Data. Journal of Web Semantics, 7(3): 154-165. https://doi.org/10.1016/j.websem.2009.07.002

[2]	Cai, F. C., Qin, J. H., Qin, J. N., et al., 2021. Geochemical Characteristics and LA⁃ICP⁃MS Zircon U⁃Pb Dating of Ore⁃Bearing Granite of Chuankou Intrusion⁃Related Tungsten Deposit, Hunan Province. China Geology, 48(4): 1212-1224 (in Chinese with English abstract).

[3]

Chen, X. D., Liu, Y. P., Han, W., et al., 2025. A Vision⁃Language Foundation Model⁃Based Multi⁃Modal Retrieval⁃Augmented Generation Framework for Remote Sensing Lithological Recognition. ISPRS Journal of Photogrammetry and Remote Sensing, 225: 328-340. https://doi.org/10.1016/j.isprsjprs.2025.04.015

[4]	Church, K. W., Sun, J. M., Yue, R., et al., 2024. Emerging Trends: A Gentle Introduction to RAG. Natural Language Engineering, 30(4): 870-881. https://doi.org/10.1017/s1351324924000044

[5]

de Almeida, T. D., de Oliveira, N. N., He, C. D., et al., 2025. Using Generative Pre⁃Trained Transformer⁃4 (GPT⁃4), Ffmpeg, and Microsoft Azure to Aid in Creating a Text⁃to⁃Video Generation Tool to Improve Safety Shares and Incident Descriptions in the Mining Industry. Mining, Metallurgy & Exploration, 42(3): 1325-1343. https://doi.org/10.1007/s42461⁃024⁃01114⁃y

[6]	Dong, S. C., Li, Y., Lü, H. R., et al., 2020. An Editing Platform of Geoscience Knowledge System. Geological Journal of China Universities, 26(4): 384-394 (in Chinese with English abstract).

[7]	Dreyer, J., 2025. China Made Waves with Deepseek, but Its Real Ambition is AI⁃Driven Industrial Innovation. Nature, 638(8051): 609-611. https://doi.org/10.1038/d41586⁃025⁃00460⁃1

[8]	Floridi, L., Chiriatti, M., 2020. GPT⁃3: Its Nature, Scope, Limits, and Consequences. Minds and Machines, 30(4): 681-694. https://doi.org/10.1007/s11023⁃020⁃09548⁃1

[9]	Fu, Y., Wang, M. G., Wang, C. B., et al., 2025. GeoMinLM: A Large Language Model in Geology and Mineral Survey in Yunnan Province. Ore Geology Reviews, 182: 106638. https://doi.org/10.1016/j.oregeorev.2025.106638

[10]	Guo, F., Lai, P., Huang, F. M., et al., 2024. Literature Review and Research Progress of Landslide Susceptibility Mapping Based on Knowledge Graph. Earth Science, 49(5): 1584-1606 (in Chinese with English abstract).

[11]	Hosseini, S., Seilani, H., 2025. The Role of Agentic AI in Shaping a Smart future: A Systematic Review. Array, 26: 100399. https://doi.org/10.1016/j.array.2025.100399

[12]	Hu, Y. J., Mai, G. C., Cundy, C., et al., 2023. Geo⁃Knowledge⁃Guided GPT Models Improve the Extraction of Location Descriptions from Disaster⁃Related Social Media Messages. International Journal of Geographical Information Science, 37(11): 2289-2318. https://doi.org/10.1080/13658816.2023.2266495

[13]	Jiang, B., Yang, J. X., Yang, C., et al., 2020. Knowledge Augmented Dialogue Generation with Divergent Facts Selection. Knowledge⁃Based Systems, 210: 106479. https://doi.org/10.1016/j.knosys.2020.106479

[14]	Jiang, S. W., Zhang, J. W., Hua, L. S., et al., 2025. Implementation of Meteorological Database Question⁃Answering Based on Large⁃Scale Model Retrieval⁃Augmentation Generation. Computer Engineering and Applications, 61(5): 113-121 (in Chinese with English abstract).

[15]	Katz, D. M., Bommarito, M. J., Gao, S., et al., 2024. GPT⁃4 Passes the Bar Exam. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 382(2270): 20230254. https://doi.org/10.1098/rsta.2023.0254

[16]	Li, C. L., Wang, Z. X., Lü, Q. T., et al., 2021. Mesozoic Tectonic Evolution of the Eastern South China Block: A Review on the Synthesis of the Regional Deformation and Magmatism. Ore Geology Reviews, 131: 104028. https://doi.org/10.1016/j.oregeorev.2021.104028

[17]	Li, H., Yue, P., Tapete, D., et al., 2024. ESDC: An Open Earth Science Data Corpus to Support Geoscientific Literature Information Extraction. Science China Earth Sciences, 67(12): 3840-3854. https://doi.org/10.1007/s11430⁃023⁃1444⁃9

[18]	Li, H., Yue, P., Wu, H. R., et al., 2025. A Question⁃Answering Framework for Geospatial Data Retrieval Enhanced by a Knowledge Graph and Large Language Models. International Journal of Digital Earth, 18(1): 2510566. https://doi.org/10.1080/17538947.2025.2510566

[19]	Li, N. X., Zhang, R. Q., Zhu, L., et al., 2023. Tracing Tungsten⁃Tin Mineralization Processes with Tourmaline Geochemistry in the Wangxianling⁃Hehuaping District, Nanling Range (South China). Ore Geology Reviews, 163: 105806. https://doi.org/10.1016/j.oregeorev.2023.105806

[20]

Liang, J. Y., Hou, S. Y., Jiao, H. Y., et al., 2025. GeoGraphRAG: A Graph⁃Based Retrieval⁃Augmented Generation Approach for Empowering Large Language Models in Automated Geospatial Modeling. International Journal of Applied Earth Observation and Geoinformation, 142: 104712. https://doi.org/10.1016/j.jag.2025.104712

[21]	Ma, X. G., 2022. Knowledge Graph Construction and Application in Geosciences: A Review. Computers & Geosciences, 161: 105082. https://doi.org/10.1016/j.cageo.2022.105082

[22]	Memduhoğlu, A., Fulman, N., Zipf, A., 2024. Enriching Building Function Classification Using Large Language Model Embeddings of OpenStreetMap Tags. Earth Science Informatics, 17(6): 5403-5418. https://doi.org/10.1007/s12145⁃024⁃01463⁃8

[23]	Peng, N. L., Wang, X. H., Yang, J., et al., 2017. Re⁃Os Dating of Molybdenite from Sanjiaotan Tungsten Deposit in Chuankou Area, Hunan Province, and Its Geological Implications. Mineral Deposits, 36(6): 1402-1414 (in Chinese with English abstract).

[24]

Qin, J. H., Wang, D. H., Li, C., et al., 2020. The Molybdenite Re⁃Os Isotope Chronology, in Situ Scheelite and Wolframite Trace Elements and Sr Isotope Characteristics of the Chuankou Tungsten Ore Field, South China. Ore Geology Reviews, 126: 103756. https://doi.org/10.1016/j.oregeorev.2020.103756

[25]	Qiu, Q. J., Wu, L., Ma, K., et al., 2023. A Knowledge Graph Construction Method for Geohazard Chain for Disaster Emergency Response. Earth Science, 48(5): 1875-1891 (in Chinese with English abstract).

[26]	Song, H. B., Huang, M. X., Fan, Z. H., et al., 2002. Characteristics of the Ore⁃Controlling Structures of the Sanjiaotan Wolframite Deposit and Its Relationships with Ore Formation in Chuankou, Hunan. Geotectonica et Metallogenia, 26(1): 51-54 (in Chinese with English abstract).

[27]	Tong, B., Yin, Y. P., Li, B., et al., 2025. Review on Artificial Intelligence⁃Based Large Language Models for Geological Hazards. The Chinese Journal of Geological Hazard and Control, 36(2): 1-12 (in Chinese with English abstract).

[28]	Vidivelli, S., Ramachandran, M., Dharunbalaji, A., 2024. Efficiency⁃Driven Custom Chatbot Development: Unleashing LangChain, RAG, and Performance⁃Optimized LLM Fusion. Computers, Materials & Continua, 80(2): 2423-2442. https://doi.org/10.32604/cmc.2024.054360

[29]	Wang, C. B., Wang, M. G., Wang, B., et al., 2024. Knowledge Graph⁃Infused Quantitative Mineral Resource Forecasting. Earth Science Frontiers, 31(4): 26-36 (in Chinese with English abstract).

[30]	Wang, D. H., Liu, X. X., Liu, L. J., 2015. Characteristics of Big Geodata and Its Application to Study of Minerogenetic Regularity and Minerogenetic Series. Mineral Deposits, 34(6): 1143-1154 (in Chinese with English abstract).

[31]	Wang, G. Q., Xie, J. L., Zhang, T., et al., 2025. LLaMA⁃Unidetector: An LLaMA⁃Based Universal Framework for Open⁃Vocabulary Object Detection in Remote Sensing Imagery. IEEE Transactions on Geoscience and Remote Sensing, 63: 4409318. https://doi.org/10.1109/TGRS.2025.3564332

[32]	Wu, H. Y., Shen, Z. X., Hou, S. Y., et al., 2025. Large Language Model⁃Driven GIS Analysis: methods, Applications, and Prospects. Acta Geodaetica et Cartographica Sinica, 54(4): 621-635 (in Chinese with English abstract).

[33]	Wu, R. L., Guo, D. H., 2025. Research on Evaluation Standards for Spatial Cognitive Abilities in Large Language Models. Journal of Geo⁃Information Science, 27(5): 1041-1052 (in Chinese with English abstract).

[34]	Xu, C., Su, M. Y., Sun, B., et al., 2024. Tourism Knowledge Graph Construction Based on ChatGLM and Prompt⁃Tuning. Science Technology and Engineering, 24: 13484-13492 (in Chinese with English abstract).

[35]	Zhang, W., Cai, M. X., Zhang, T., et al., 2024a. EarthGPT: A Universal Multimodal Large Language Model for Multisensor Image Comprehension in Remote Sensing Domain. IEEE Transactions on Geoscience and Remote Sensing, 62: 5917820. https://doi.org/10.1109/TGRS.2024.3409624

[36]	Zhang, Y. F., Wei, C., He, Z. T., et al., 2024b. GeoGPT: An Assistant for Understanding and Processing Geospatial Tasks. International Journal of Applied Earth Observation and Geoinformation, 131: 103976. https://doi.org/10.1016/j.jag.2024.103976

[37]

Zhang, Z. J., Kusky, T., Gao, M., et al., 2023. Spatio⁃Temporal Analysis of Big Data Sets of Detrital Zircon U⁃Pb Geochronology and Hf Isotope Data: Tests of Tectonic Models for the Precambrian Evolution of the North China Craton. Earth⁃Science Reviews, 239: 104372. https://doi.org/10.1016/j.earscirev.2023.104372

[38]

Zhou, Y. Z., Zuo, R. G., Liu, G., et al., 2021. The Great⁃Leap⁃Forward Development of Mathematical Geoscience during 2010-2019: Big Data and Artificial Intelligence Algorithm are Changing Mathematical Geoscience. Bulletin of Mineralogy, Petrology and Geochemistry, 40(3): 556-573 (in Chinese with English abstract).

基金资助

国家科技重大专项(2024ZD1001201)

湖南省地质院重大科研项目(HNGSTP202301)

AI Summary AI Mindmap

PDF (3667KB)

访问

被引

详细

导航

Received	Accepted	Published
2025-07-22
Issue Date
2026-05-13

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引言

1 KG⁃RAG框架

1.1 大语言模型辅助构建知识图谱

1.1.1 模糊关键词匹配

1.1.2 三元组知识抽取

1.1.3 知识校验与规则迭代

1.2 知识图谱增强大语言模型

1.2.1 任务描述/角色定义

1.2.2 地质找矿知识图谱的利用

1.2.3 示例提示