找矿知识图谱的智能化应用:以钦杭成矿带斑岩铜矿为例

张前龙 ,  周永章 ,  郭兰萱 ,  原桂强 ,  虞鹏鹏 ,  王汉雨 ,  朱彪彪 ,  韩枫 ,  龙师尧

地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 7 -15.

PDF (5269KB)
地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 7 -15. DOI: 10.13745/j.esf.sf.2024.5.2
知识图谱与智能推理

找矿知识图谱的智能化应用:以钦杭成矿带斑岩铜矿为例

作者信息 +

Intelligent application of knowledge graphs in mineral prospecting: A case study of porphyry copper deposits in the Qin-Hang metallogenic belt

Author information +
文章历史 +
PDF (5394K)

摘要

找矿知识图谱是一个结构化的找矿知识表示形式,它通过将各种矿床地质、矿物、矿体和勘探开发技术等要素以及要素之间的关系进行关联和表达,形成一个知识图谱结构,为矿产资源的预测和评估提供了新的途径。本研究从数据源和文献中收集了钦杭成矿带斑岩铜矿的相关知识,利用自然语言处理技术构建了知识图谱并和机器学习技术进行知识的自动化提取和推理。本研究通过构建找矿知识图谱模型,对钦杭成矿带斑岩铜矿的实体、属性和关系进行了表达和存储。在此基础上,利用自然语言处理技术对知识图谱进行了语义关联和推理,实现了知识的自动化提取和推理。本研究还建立了查询问答和可视化系统,使用户可以通过查询实体、属性或关系来获取相关信息,并以可视化的方式展示钦杭成矿带斑岩铜矿信息的结构和关联。最后,本研究通过实验和测试验证了基于知识图谱的智能应用在钦杭成矿带斑岩铜矿找矿工作中的有效性和准确性。与传统方法相比,该应用能够在短时间内提供更全面、准确的找矿建议。未来,将深化图算法应用和推荐系统,以满足不同场景下的找矿需求,并拓展其在其他相关领域的应用潜力。

关键词

知识图谱 / 矿床本体 / 斑岩铜矿 / 钦杭成矿带 / 成矿预测

Key words

knowledge graph / ore deposit ontology / porphyry copper deposit / Qin-Hang metallogenic belt / mineral prospecting mapping

引用本文

引用格式 ▾
张前龙,周永章,郭兰萱,原桂强,虞鹏鹏,王汉雨,朱彪彪,韩枫,龙师尧. 找矿知识图谱的智能化应用:以钦杭成矿带斑岩铜矿为例[J]. 地学前缘, 2024, 31(4): 7-15 DOI:10.13745/j.esf.sf.2024.5.2

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

在大数据与人工智能时代,建立一个强大且更高效的、基于AI辅助的找矿指导系统,具有重要意义[1]。随着技术的不断发展,矿产勘查工作正面临着越来越多的挑战,特别是找矿难度不断增加。为了应对这些挑战,人们期望建立一个以人工智能为核心的找矿指导系统,以提供更加精准和高效的找矿应用。

找矿知识图谱是一个结构化的找矿知识表示形式。它可以通过将各种矿床地质、矿物、矿体和勘探开发技术等要素以及要素之间的关系进行关联和表达,形成一个知识图谱结构,帮助用户更好地理解和利用这些知识。找矿知识图谱是地球系统-成矿系统-找矿系统关联知识图谱体系中的一部分[2],为矿产资源的预测和评估提供了新的途径。它利用知识图谱作为结构化的语义知识库的特质,以符号形式描述找矿物理世界中的概念及其相互关系,整合、存储和展现大规模多源知识,具有智能、个性化和高效的信息检索、推荐和分析功能[3-4]。通过知识图谱的关联分析和挖掘,可以发现知识中的潜在关联关系、模式和规律,进行智能化的勘探目标定位、资源评估和矿产开发决策,应用可视化技术和交互式分析,将找矿知识图谱呈现为直观、易理解的形式,帮助研究人员进行数据挖掘和分析。

目前,找矿知识图谱研究还存在不小的挑战,面向下游等找矿知识图谱的智能应用研究严重偏弱。过往地质工作积累了大量的地质报告、学术论文等文本数据,地球化学、地球物理等实测矿床数据,矿床数据具有多源异构、高维度和非线性等特点,数据格式、时间空间标度和精度差异大,对于矿床特征的描述纷杂。其次,矿床的成矿模式是构造运动、岩浆活动、地层等多维地质要素的复杂综合性结果,矿床的实体和关系之间存在复杂的模式。识别这些模式之间的关联成为找矿勘查的关键线索。

本研究以钦杭成矿带上的斑岩铜矿为对象,开展找矿知识图谱智能化应用的案例研究。研究收集和分析了大量的地质数据、矿产数据和其他相关数据,应用NLP技术抽取矿床知识,进而构建了一个基于人工智能的找矿知识图谱模型。

1 研究方法与数据

1.1 找矿知识图谱

本研究的基础性工作是找矿本体的构建,试图建立一个用于描述找矿领域相关概念、术语和关系的系统化知识模型。在找矿知识图谱中,找矿本体可以明确专业术语、关系及其领域公理, 使其形式化,在机器与人之间形成联系。本研究采用基于知识工程和顶层本体相结合的找矿本体构建方法,使用地质叙词表[5-6]和矿床学书籍[7]的地质矿床知识作为构建依据,再复用前人本体和地质报告作为辅助验证,用以实现对矿床知识实体、关系的系统化、规范化和形式化表达。本研究提出的找矿本体模型见图1

本研究应用于构建和应用找矿知识图谱的流程如图2所示。它涉及以下几个步骤。

(1)知识收集和整合。从各种数据源和文献中收集矿床相关的知识,包括地质调查报告、科学文献和矿产资源数据库等。这些知识需要经过整合、清洗和标准化,以适应知识图谱的表示和存储。

(2)实体和关系建模。基于收集到的知识,对矿床相关实体(如矿种、矿床类型和矿物)进行建模,并定义它们之间的关系。这涉及实体的标识符、属性的定义和关系的定义,通常使用本体或图模型进行表示。常用的本体构建方式主要有手工构建、复用已有本体(半自动构建)和自动构建本体,主要方法为TOVE法、METHONTOLOGY法、骨架法、SENSUS法、IDEF5法、七步法和神经网络法等[8-9]

(3)知识抽取和融合。知识抽取是指从各种文本、文档和数据源包括学术文献、地质报告、采样数据、实验数据等中自动提取与矿床相关的信息和知识,通过自然语言处理技术,自动识别和提取出矿床的实体和关系。常用的知识抽取方法有基于规则的方法、基于统计模型的方法和基于深度学习的方法[10-11]。知识融合是将从地质数据、地球化学数据、地球物理数据等不同数据源抽取的矿床信息进行整合和合并的过程,将这些异构的数据源进行语义一致性的整合,建立一个综合的、一致的矿床知识库[12-13]。通过矿床知识抽取和融合,可以帮助研究人员和决策者快速获取文本中与矿床相关的信息。

(4)知识图谱存储。利用收集和建模的知识,构建矿床知识图谱的数据结构,包括创建实体和属性的节点以及关系的边,建立节点之间的连接关系,形成一个结构化的图形。常用的数据库有MySQL、Oracle、SQL Server、Sybase、Neo4j、Virtuoso、Apache Jena、Blazegraph、Stardog和AllegroGraph,这些数据库是存储、管理和查询知识图谱数据的关键工具,具有一定的知识发现、推理、融合和应用作用。

(5)知识推理。将矿床知识和数据建模成图形结构,其中实体、属性和关系之间的语义关系被用于推理,基于已有的矿床知识和规则,通过推理引擎进行逻辑推理和推断,从而得出新的矿床信息、关联和结论。矿床知识推理主要的方法包含基于逻辑规则的推理(基于逻辑的推理、基于统计的推理和基于图结构的推理)、基于嵌入表示(张量分解方法、距离模型和语义匹配模型以及随机游走方法)和基于神经网络的推理(卷积神经网络、循环神经网络和图神经网络)[14-15]。基于逻辑规则的推理方法表达能力强,推理过程解释性好,能够处理不完全和不确定信息,但计算效率低,难以处理连续和非线性数据,缺乏学习能力;基于嵌入表示的推理方法学习能力强,能够处理连续和非线性数据,推理效率高,但缺乏解释性,依赖训练数据;基于神经网络的推理方法学习能力强,能够处理连续和非线性数据,并行计算能力强,但缺乏解释性,容易过拟合。通过推理,可以发现潜在的矿床关联,补充缺失的矿床属性,预测未知的矿床参数等。矿床知识推理可以应用于各个阶段的矿床研究和开发过程。例如,在矿产勘探阶段,可以基于已有的地质数据和矿床特征,通过推理发现有利的勘探目标区域;在矿产资源评估阶段,可以通过推理预估矿床储量和品位;在矿产资源管理和决策中,可以基于推理结果进行资源规划和优化决策。

(6)数据查询和可视化。建立对矿床知识图谱的查询接口和可视化系统,使用户可以通过查询实体、属性或关系来获取相关信息,并以可视化的方式展示矿床信息的结构和关联。

(7)应用场景开发。基于找矿知识图谱,开发具体的应用场景,如智能咨询系统、矿产资源调查与评估和智能勘探规划等。

1.2 数据来源

本研究区域钦-杭成矿带是钦州湾—杭州湾成矿带的简称。它是华南地区一条重要的多金属成矿带,全长近2 000 km,大地构造上属于扬子与华夏两个古陆块在新元古代的碰撞拼接带,带内产出一系列的斑岩铜钼矿(例如江西的德兴和粤西的圆珠顶)和斑岩-夕卡岩型铜多金属矿床(例如江西的永平、湖南的七宝山和粤北的大宝山)等,是我国重要的铜矿资源产地[16-18]。斑岩型铜矿床分布位置如图3所示。

本研究选取钦杭成矿带上的斑岩型铜矿,在Web of Science数据库、CNKI数据库和地质云等公开数据库中收集公开发表的与这些斑岩型铜矿相关的学术论文和地质报告作为找矿知识图谱的数据来源。

2 找矿知识图谱构建

2.1 知识抽取与融合

为了实现矿床文本抽取,本研究采用自然语言处理技术,包括关键词提取、实体识别、关系抽取等,将矿床文本抽取为(实体1,关系,实体2)和(实体1,关系,属性1)的知识图谱三元组数据。以ChatGPT为代表的大语言模型面世后,本研究把它增列到知识抽取方法中,根据指令从矿床相关文本中提取有用的信息(表1[19]),例如矿体、矿石、矿床储量和地质特征等矿床信息。

在前述找矿本体模型的基础上,抽取文本数据中的地质等相关要素,获得大量的三元组信息。通过不同数据源中的实体的匹配和对齐,消除重复和冗余信息,对不同数据源中的关系进行链接,建立关系之间的联系。

2.2 知识存储

本研究使用图数据库进行知识图谱存储。与传统的关系型数据库相比,图数据库的优势体现在直观性、灵活性和高性能等方面,图中的节点表示知识图谱的实体,图中的边表示知识图谱的关系,具有灵活直观的数据模型和强大的查询遍历能力[20-21]。图数据库本身提供有完善的图查询语言,支持各种图挖掘算法,在查询速度上要优于关系型数据库,特别是多跳查询的性能较好。

本研究具体使用Neo4j图数据库存储数据,如图4所示。Neo4j使用自带的Cypher查询语言,能够容易地表达复杂的查询需求。

3 知识图谱智能应用

找矿知识图谱的下游应用主要包括基于cypher语句的知识查询与语义匹配、智能问答与推荐和基于图算法的知识推理与决策。本研究基于Java语言开发了GoldMiner可视化平台,配置有数据总览、实体查询、关系查询、知识问答和图算法应用等功能组件。

3.1 语义匹配与智能问答

本研究在中山大学GoldMiner可视化平台上实现语义匹配与智能问答功能。首先,前端向后端Neo4j数据库请求传输数据进行数据交互,后端响应后将矿床数据传输至前端中,依次获取数据并更新界面进行展示(图5)。其次,为界面上的各个组件添加事件处理程序,例如按钮点击、文本框输入等,用户通过界面上的各种交互组件(如按钮、下拉框、文本框等)与用户进行交互,获取用户输入并进行相应的处理,例如用户可以输入查询语句与平台进行交互问答(图6),平台据问题遍历数据库根定位数据返回答案(图7)。还根据用户的操作或数据的变化,管理界面的状态,例如显示不同的界面、禁用或启用某些组件等。根据不同的屏幕尺寸或设备类型,进行适配和响应式设计,以保证界面在不同环境下的良好显示效果。

3.2 知识推理

知识推理是一个重要研究,许多学者对其开展深入研究[22]。图算法越来越多地在知识推理中使用,包括路径算法、中心性算法、相似度算法和社区发现算法等。

本研究使用嵌入算法与图算法结合,进行知识推理应用分析。首先,使用基于随机游走的Node2Vec算法对矿床知识图谱中的节点进行特征学习,将每个节点映射到低维特征空间,形成特征向量,如图7a所示。利用Louvain算法对矿床知识图谱进行社区发现,通过计算每个节点的相似性度量,将相似的节点聚集到同一个社区中,如图7b所示。基于Node2Vec嵌入和Louvain社区发现的结果,通过比较不同社区中节点的特征向量相似性,对实验结果进行了分析,评估了社区发现的效果。实验结果显示,这些社区能够反映铜矿床的分布情况、成矿机理和岩石类型等重要信息。例如,斑岩型铜矿床的形成与岩石的原岩、蚀变类型等重要因素有关,绿泥石化是形成斑岩型矿床的重要过程。

通过比较不同社区间节点的相似性度量和节点间的连接关系,可以推断出不同矿床之间的相似性和差异。基于Node2Vec嵌入后的LOUVAIN社区发现方法在钦杭成矿带斑岩型铜矿床知识推理实验结果中显示,该法效果良好,有望为矿产资源的合理开发和利用提供理论支持和决策辅助。

4 结论

大数据与人工智能方法的发展,为矿产勘查领域带来了新的机遇和研究技术。知识图谱作为一种重要的人工智能分析方法,在整合多源矿床数据、分析挖掘矿床隐藏知识中具有重要作用。本文以钦杭成矿带斑岩型矿床为例开展找矿知识图谱及其智能化应用研究,取得有意义的新认识。

通过收集钦杭成矿带斑岩铜矿的相关数据和文献,设计适用于实际矿床的本体模型,通过大语言模型算法知识抽取,构建了找矿知识图谱。该图谱将实体、属性和关系进行了表达和存储,为后续的智能化应用提供了基础。

通过建立Goldminer知识图谱管理系统,用户可以查询问答和可视化系统,查询实体、属性或关系来获取相关信息,并以可视化的方式展示钦杭成矿带斑岩铜矿信息的结构和关联。实验和测试结果表明,基于知识图谱的智能应用在找矿工作中具有较高的准确性和效率,能够提供更全面、准确的找矿建议。

找矿知识图谱在斑岩型铜矿中的知识推理应用应具有拓展其他应用的潜力。未来,可进一步深化图算法应用和推荐系统,以满足不同场景下的找矿需求,并拓展其在其他相关领域的应用潜力。

参考文献

[1]

陈华勇, 张俊岭. 21世纪矿产勘查的未来发展方向在哪里?[J]. 地球科学, 2022, 47(10): 3874-3875.

[2]

周永章, 张前龙, 黄永健, 钦杭成矿带斑岩铜矿知识图谱构建及应用展望[J]. 地学前缘, 2021, 28(3): 67-75.

[3]

刘峤, 李杨, 段宏, 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600.

[4]

官赛萍, 靳小龙, 贾岩涛, 面向知识图谱的知识推理研究进展[J]. 软件学报, 2018, 29(10): 2966-2994.

[5]

地质部地质辞典办公室. 地质大辞典(五)[M]. 北京: 地质出版社, 2005.

[6]

史静, 刘素芳, 刘振锋. 地质学汉语叙词表: 2010[M]. 北京: 地质出版社, 2010.

[7]

翟裕生, 姚书振, 蔡克勤. 矿床学[M]. 3版. 北京: 地质出版社, 2011.

[8]

李善平, 尹奇韦华, 胡玉杰, 本体论研究综述[J]. 计算机研究与发展, 2004, 41(7): 1041-1052.

[9]

张前龙, 周永章, 虞鹏鹏, 多层次矿床本体的构建及在知识图谱中的应用[J/OL]. 矿物岩石地球化学通报: 1-7[2023-09-13]. DOI: 10.19658/j.issn.1007-2802.2023.42.082.

[10]

田玲, 张谨川, 张晋豪, 知识图谱综述: 表示、 构建、 推理与知识超图理论[J]. 计算机应用, 2021, 41(8): 2161-2186.

[11]

张雪英, 叶鹏, 王曙, 基于深度信念网络的地质实体识别方法[J]. 岩石学报, 2018, 34(2): 343-351.

[12]

王昊奋, 漆桂林, 陈华钧. 知识图谱:方法、实践与应用[M]. 北京: 电子工业出版社, 2019.

[13]

祝振媛, 李广建. “数据-信息-知识” 整体视角下的知识融合初探: 数据融合、 信息融合、 知识融合的关联与比较[J]. 情报理论与实践, 2017, 40(2): 12-18.

[14]

马昂, 于艳华, 杨胜利, 基于强化学习的知识图谱综述[J]. 计算机研究与发展, 2022, 59(8): 1694-1722.

[15]

侯中妮, 靳小龙, 陈剑赟, 知识图谱可解释推理研究综述[J]. 软件学报, 2022, 33(12): 4644-4667.

[16]

毛景文, 陈懋弘, 袁顺达, 华南地区钦杭成矿带地质特征和矿床时空分布规律[J]. 地质学报, 2011, 85(5): 636-658.

[17]

周永章, 李兴远, 郑义, 钦杭结合带成矿地质背景及成矿规律[J]. 岩石学报, 2017, 33(3): 667-681.

[18]

MAO J W, CHENG Y B, CHEN M H, et al. Major types and time-space distribution of Mesozoic ore deposits in South China and their geodynamic settings[J]. Mineralium Deposita, 2013, 48(3): 267-294.

[19]

林振文, 梁志鹏, 庄文明, 广东圆珠顶斑岩型铜钼矿床蚀变及元素迁移特征分析[J]. 矿物岩石地球化学通报, 2023, 42(2): 325-339.

[20]

ZHOU Y Z, ZHANG Q L, SHEN W J, et al. Construction and applications of knowledge graph of porphyry copper deposits[J]. Earth Sciences and Subsoil Use, 2021, 44(3): 204-218.

[21]

PEI Y, CHAI S L, LI X L, et al. Construction and application of a knowledge graph for gold deposits in the Jiapigou gold metallogenic belt, Jilin Province, China[J]. Minerals, 2022, 12(9): 1173.

[22]

夏毅, 兰明敬, 陈晓慧, 可解释的知识图谱推理方法综述[J]. 网络与信息安全学报, 2022, 8(5): 1-25.

基金资助

国家重点研发计划项目(2022YFF0801201)

国家自然科学基金联合基金重点项目(U1911202)

广东省科学技术厅科技项目(GDKTP2020053500)

广东省引进人才创新创业团队项目(2021ZT09H399)

广东省自然科学基金青年提升项目(2024A1515030216)

AI Summary AI Mindmap
PDF (5269KB)

222

访问

0

被引

详细

导航
相关文章

AI思维导图

/