融合知识图谱的矿产资源定量预测

王成彬 ,  王明果 ,  王博 ,  陈建国 ,  马小刚 ,  蒋恕

地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 26 -36.

PDF (6062KB)
地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 26 -36. DOI: 10.13745/j.esf.sf.2024.5.3
知识图谱与智能推理

融合知识图谱的矿产资源定量预测

作者信息 +

Knowledge graph-infused quantitative mineral resource forecasting

Author information +
文章历史 +
PDF (6206K)

摘要

大数据和人工智能极大地促进了矿产勘查的发展,创新了矿产预测研究范式,提升了地质找矿大数据的挖掘与集成能力。在资源定量预测领域,知识-数据联合驱动的综合信息智能预测已逐渐成为行业共识,如何实现数据和知识联合驱动是目前亟待解决的问题。知识图谱可以整合多源、异构的地质找矿大数据,其中蕴含的知识和规则在驱动地球科学领域的知识发现方面具有重要的发展潜力。本文针对大数据和人工智能时代对资源定量预测智能化和自动化的需求,结合知识图谱相关技术的特点,探讨融合知识图谱技术的矿产资源定量预测智能化和自动化的可行性和技术方法路线。重点剖析面向矿产预测的成矿-勘查系统多时序全要素知识图谱构建和基于知识图谱从“求同”和“求异”的角度建立找矿预测模型,知识图谱中的知识嵌入到地物化遥异常信息提取的方法,以及融合知识图谱的资源定量预测工作的机遇和挑战。拟希望将知识图谱中知识表达和推理融入到矿产资源定量预测技术方法流程中,协助地质专家来确定矿产预测模型,提高矿产预测的自动化和智能化。

关键词

知识图谱 / 资源定量预测 / 矿产预测智能化 / 地质大数据

Key words

knowledge graph / mineral resource quantitative forecasting / intelligent mineral forecasting / geological big data

引用本文

引用格式 ▾
王成彬,王明果,王博,陈建国,马小刚,蒋恕. 融合知识图谱的矿产资源定量预测[J]. 地学前缘, 2024, 31(4): 26-36 DOI:10.13745/j.esf.sf.2024.5.3

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

随着地质勘查工作的持续推进,未被发现的露头矿和浅表矿越来越少,找矿的难度不断增大。近年来,大数据和人工智能技术的发展和突破,深刻改变了科学研究范式[1-5],为矿产勘查的发展提供了新的动能和机遇。如何利用大数据和人工智能技术创新矿产预测理论、提升战略性矿产找矿效果成了计算机和地质矿产领域学者共同关切的问题。近年来,受深时数字地球国际大科学计划的推动,知识图谱技术被引入到地质信息领域,地学领域知识图谱的构建与应用得到了快速发展[6-10]

人工智能技术的发展早期主要是构建知识规则,代替人类解决一些简单重复性的问题,如斯坦福大学和美国地质调查局合作开发的地质找矿专家系统Prospector[11]。2015年以来,受益于计算机算力水平的提升,地质学者陆续将不同的机器学习算法引入到地质矿产勘查领域中,挖掘数据中隐含的异常信息服务资源定量预测评价,但基于数据驱动的预测结果在地质可解释性、模型的泛化和可迁移方面存在不足。众多学者认为人工智能技术未来发展方向是通过领域知识和数据的深度融合,兼顾数据驱动的数据挖掘性能和行业积累的领域知识,以服务于垂直领域模型训练和应用[12-13]。以人工智能技术为基础的知识-数据联合驱动的综合信息智能预测已经逐渐成为资源定量预测未来发展的方向。但如何将地质知识和地质数据进行深度的融合和耦合是目前急需解决的问题。地质知识增强的深度学习找矿预测模型和专家知识库驱动下地质资源评价的智能化是目前主要探索的两个方向。其中,融合知识图谱的矿产资源定量预测就是后者的一种探索应用。一方面,知识图谱技术可以有效地整合地学领域已有的知识和数据,挖掘深层次与矿床形成密切相关的致矿地质异常信息;另一方面,以知识图谱蕴含的知识和规则可以驱动矿产资源的定量预测,提高矿产资源定量预测的智能化和自动化。

1 知识图谱与地学大数据

1.1 知识图谱概念

知识图谱是一种图形化的语义网络,是领域知识网络化、图形化的重建与表达。知识图谱是在人工智能领域的语义网络、专家系统和本体模型基础上通过不断增强其语义信息表达发展成熟起来的(图1)。知识图谱在2012年由谷歌重新定义之后得到了快速发展[14]。知识图谱广泛应用于搜索引擎增强和知识问答服务中,同时知识图谱是开放数据FAIR原则的核心内容之一,也被广泛应用到关联开放数据中。知识图谱与深度学习、自然语言处理、云计算、知识推理、数据库和可视化等技术密切相关并互相支撑。知识图谱在不同的视角也具有不同的解读:在自然语言处理视角下,知识图谱用于抽取文本中的实体-语义信息;在知识表示和推理视角下,知识图谱采用计算机符号对知识进行表示和推理;在web视角下,建立数据之间的语义链接并提供语义关联和搜索;在数据库的视角下,知识图谱侧重于用图的方式进行知识的存储和检索;在机器学习的视角下,知识图谱研究怎么挖掘知识并且将知识作为特征融入到机器学习模型中提升机器学习模型的有效性;在人工智能的视角下,利用知识图谱来组织和理解人类语言行为,形成决策的“智脑”专家系统。

知识图谱以图模型的方式组织知识,即每条知识都以“点-边-点”三元组的方式来组织,“节点”代表概念和实体对象,“边”代表节点之间的语义逻辑关系。地质矿产领域的复杂知识可以用知识图谱相关理念和技术进行组织和表达[15]。比如在描述矿床的位置信息(地理位置、构造位置)时,可以利用“主-谓-宾”三元组的形式对矿床所在的地理位置、大地构造位置信息进行显式表达(图2)。

与关系数据库的表达方式相比,利用知识图谱的地质矿产知识的表达,可以实现人机可读,不需要通过数据库概念层的理解就可以对数据和知识进行语义信息的理解。利用知识图谱的表达具有更强的语义逻辑约束,可以进一步支撑知识推理和语义查询。通过知识图谱可以对结构性和非结构性知识信息进行语义和数据层面的整合,消除数据语义鸿沟。

1.2 大数据和人工智能时代的地学知识图谱研究

在大数据和人工智能的时代背景下,利用知识图谱等相关技术,改善地球科学研究方式,解决复杂的地球科学问题,已逐渐成为地球科学家和信息学家的共识[16-21]。美国自然科学基金会于2011年启动了“地球立方体”计划,旨在通过开发新一代研究工具,转变地球科学的研究方式[17,22-24]。在王成善、周成虎等6位院士的推动下,2019年启动了“深时数字地球IUGS大科学计划”[25-27],旨在协调全球深时地学数据,以求改变地球科学的研究方式。上述大科学项目研究内容与地学大数据的挖掘和知识图谱密切相关。

地学领域知识图谱的构建,除了利用人工录入方法和已有结构性数据(如关系数据库)映射外,最主要的方法为非结构性文本数据挖掘。非结构性文本数据是地学大数据的重要组成部分。截至目前,GeoRef文献库包含450万条文章、书籍等引文数据,并以每年10万份的速度不断递增。另一个最新实例是GeoDeepDive,它通过和多家出版机构合作获得丰富的地学文献数据,利用文本挖掘技术抽取地质文献中感兴趣的古生物、地层等高价值信息。近年来,利用地学领域非结构性文本数据进行知识图谱构建及智慧应用已成为目前地学信息领域需要解决的重大挑战和研究热点[9,18,28]

深时数字地球大科学计划极大推动了地学领域知识图谱的发展,地学知识图谱作为一个新兴的研究方向,其研究内容主要侧重于以下5个方面。

(1)地学领域本体模型的构建。地学领域具有影响力的本体模型主要有SWEET(Semantic Web for Earth and Environmental Terminology)[29]、地质年代本体模型[28,30-31]、地质矿产本体模型[32-33]、石油本体模型[34-35]、构造地质本体模型[36-37]、地质图本体模型[38]、地质灾害本体模型[39]和海洋科学本体模型[40]

(2)结构性关系数据映射构建地学领域知识图谱[33,41]

(3)非结构性文本数据挖掘[8,9,42-50]

(4)知识图谱语义信息查询及数据知识服务。知识图谱研究的目的就是通过各种知识获取手段构建知识图谱,以用于数据知识查询、语义推理和数据知识服务,如Macrostrat[22]和GeoDocA[51]

(5)数据挖掘和知识发现。知识图谱有助于提升地学领域数据挖掘和促进地学领域知识发现方面的研究。

知识图谱中的领域知识可以反哺数据挖掘并提高知识发现的水平,如石油领域知识图谱PetroKG提高了测井解释的准确性[50];从古生物学文献中提取的叠层石信息,揭示了叠层石的生长与白云岩发育成线性相关,与生物大灭绝无关[21,52];基于含钴矿物的时空演化图谱,发现太古宙海洋生物的多样性与古风化壳产生的钴汇集具有密切关系,揭示了含钴矿物在早期生命演化过程中的作用和来源[53]。目前,地学知识图谱研究在地学各分支领域陆续开展,已有的研究成果表明该研究方向具有强大的生命力。地学知识图谱的进一步发展,必将促进地学研究方式的巨大变革和复杂地学问题的解决。

2 融合知识图谱的矿产资源定量预测技术方法

2.1 资源定量预测智能化发展

大数据和人工智能技术的发展极大促进了地质矿产领域的变革,在创新矿产资源预测模式、提高战略性矿产找矿效率方面具有巨大的潜力和应用价值。20世纪50年代以来,随着计算机技术的应用,尤其是GIS技术的发展,极大地促进了矿产资源预测理论和资源定量预测工作的发展。按照赵鹏大院士的划分[54],资源定量评价工作经历了矿床统计预测、基于求异理论资源定量预测和数字找矿与资源定量预测阶段。随着大数据和云计算等技术的兴起,赵鹏大院士在2011年武汉召开的“数学地质与地学信息研讨会”中提出了“云计算与定量找矿”概念[55]。“云找矿”的实现,不仅仅是现在已有的资源定量预测技术方法在服务器中实现云端化,更需要大数据和人工智能技术实现矿产预测模型-矿产预测图层变量-综合预测信息集成与预测各环节的智能化和自动化。

资源定量预测的发展在技术上得益于GIS相关技术的发展与应用,其强有力的空间数据整合和空间分析功能,促进了资源定量评价发展。此阶段资源定量预测研究侧重于找矿信息提取与融合的数学模型[56],即依托于地质、地球物理、地球化学和遥感等GIS空间数据及其结构化的衍生变量,利用数学模型预测矿产资源潜力。然而,预测模型的构建仍需要大量经验丰富专家的介入,在找矿信息提取和预测结果的可解释性方面也存在一定的不足。

近年来,机器学习和深度学习方法被引入资源定量预测领域,众多的研究实例不仅丰富了资源定量预测技术方法体系,同时预示着矿产资源预测和潜力评价逐步进入智能化时代[56-59]。张金川等[60]提出页岩气资源智能评价需要在专家知识库、推理机和知识管理系统支撑下实现自动执行、自动决策。资源定量预测的智能化目前主要从两个角度进行研究:深层次找矿信息的智能提取与集成和资源定量预测流程的自动与智能化,本文主要针对后者开展讨论。

Reichstein等[20]Nature中刊文,提出以本体语义模型为指导,将地球科学领域的应用模型转换成相应的算法数据处理模型,在大数据平台上实现云操作和流程自动化。资源定量预测智能化研究可以追溯到20世纪70年代,斯坦福大学和美国地质调查局合作开发了世界上第一个地质找矿专家系统Prospector[11],其学术思想和理念为资源定量预测的智能化发展勾绘了基本蓝图。肖克炎等[61]基于MRAS开发了数字矿床模型,结合专家系统和GIS,开展资源定量预测工作;Wójcik等[62]和McGregor等[63]提出将语义网和本体推理技术应用于矿产勘查和远景预测中;周永章等[2,56,64]提出基于地球系统-成矿系统-勘查系统-预测评价系统知识图谱,构建数据-智能矿床成因模型与找矿模型,实现关联知识图谱的矿产资源智能预测;杨明莉等[65]以矿产地质知识图谱为基础,利用图谱分析方法进行推理和总结,寻找有利的成矿属性和结点。除此之外,基于自然语言处理的描述性地质知识和地质知识的嵌入和向量化表达也被应用到成矿异常信息提取和找矿预测过程中[66-69]

2.2 知识图谱与资源定量预测智能化和自动化需求

知识图谱技术结合了语义网络、专家系统、本体和描述逻辑等领域的特点,在数据知识的组织形式、语义逻辑推理和开放性方面具有巨大的优势。知识图谱可以通过三元组的形式整合地质矿产领域多源、异构的科学大数据,消除地质矿产领域的数据语义鸿沟。地质矿产勘查领域积累的对矿床成因-勘查的知识可以通过知识图谱的形式进行组织和表达,形成一个蕴含地质矿产领域知识的知识库。知识图谱实体之间的强语义关系可以支撑地质矿产知识图谱的逻辑推理、知识推荐和知识发现,从而形成地质矿产领域的“智慧大脑”。与传统的专家相比,知识图谱构建的“智慧大脑”不仅仅具有强语义约束和自动推理补全的特点,同时可以依托自然语言处理和深度学习的方法实现实体-语义关系的抽取,实现“智慧大脑”所蕴含的知识动态迭代演化增强。

融合知识图谱的资源定量预测并非对资源定量预测已有技术方法体系的完全颠覆,而是在现有的资源定量预测技术方法体系的基础上,利用知识图谱相关技术对现有的技术方法进行改造和升级,利用知识图谱中蕴含的专家知识和逻辑推理能力,替代传统资源定量预测技术方法体系中大量的人为干预现象,实现资源定量预测业务流程的自动化和智能化。资源定量预测从业务流程上包括地物化遥空间数据库的建立、找矿预测模型的构建、找矿异常信息提取和矿产预测变量的构建、矿产预测变量的筛选与集成、找矿预测远景区/靶区的圈定等主要环节。要实现资源定量预测的智能化和自动化,首先要构建面向资源预测的成矿-勘查系统全要素知识图谱,基于知识图谱的地质矿产领域的“智慧大脑”通过逻辑推理获得矿产预测模型;其次将知识图谱中的知识约束嵌入找矿异常信息提取中,代替找矿异常信息提取中的人为干预,提高异常提取的可信性和地质可解释性。在此基础上驱动机器学习算法和功能算法实现矿产预测变量的构建、矿产预测变量筛选和远景区/靶区评价。

2.2.1 面向矿产预测的成矿-勘查系统全要素知识图谱构建

地质矿产领域是一个复杂的应用地质分支学科,该领域的研究不仅借用了其他地学分支学科的术语和知识,同时具有经济和工程技术属性。构建地质矿产领域的知识图谱不仅仅是学科领域术语体系的梳理。为实现知识图谱对矿产预测的驱动力,要构建面向矿产预测的成矿-勘查全要素知识图谱,其中最基础的工作是设计和构建成矿-勘查领域知识图谱的知识模式层(本体模型)。本体模型定义领域知识图谱的类、属性、关系和术语词汇。地质矿产领域本体模型的构建应以矿产预测理论为指导,兼顾领域的专家知识与数据实例。如采用用例驱动的方法,选取个旧锡矿作为研究案例,从个旧的成矿模式和相关的地质文本中遍历个旧锡矿相关的实体实例,然后根据实例归纳其所属的实体类,最后梳理实体类和实体实例之间的语义关系,构建锡矿的成矿-勘查系统的本体模型(图3[70])。

在地质矿产知识图谱构建过程中,要重视已有的结构数据、地质词典等知识信息。结构化数据不仅可以直接映射为知识图谱,而且可以辅助深度学习训练数据集的快速构建。在利用自然语言处理和深度学习构建地质矿产知识图谱的过程中,由于地质矿产领域的复杂性,需要大量的实体和语义关系刻画地质矿产的知识画像,实体和语义关系标签数量的增多、样本的不均衡为利用深度学习从地质文本数据中抽取实体-语义关系构建知识图谱带来了挑战,需要注重地质矿产领域地质文本实体和语义标注体系的构建和文本特征的分析研究,用来优化深度学习模型。地质研究工作是持续不断更新的,不同时期对同一地质对象和矿床模型的认识往往具有差异性和继承性。地质矿产领域知识图谱的构建不仅要覆盖成矿-勘查领域相关的实体、语义关系和属性信息,同时要支撑多时序地质知识的整合,将不同时期对矿床的认知做成时间序列的知识版本,使构建的地质矿产领域的知识图谱不仅能体现矿床相关的知识信息,同时能够支持多时序矿床知识的演化认知。

2.2.2 基于知识图谱的矿产预测模型构建

根据构建的成矿-勘查领域的知识图谱,利用聚类方法对知识图谱中实体进行聚类分析,获得不同实体-关系群体。对实体群体所关联的知识进行归纳总结,获得包含深层次找矿信息的若干种矿产预测模型(P1,P2,...,Pn),并总结其核心、共性的成矿控制要素和预测要素,建立矿产预测模型和指标体系。计算勘查区实体与已知实体群的距离,距离越小代表勘查区与该矿产预测模型(实体群)越类似,用距离最近的实体群所代表的矿产预测模型作为勘查区的矿产预测模型,构建矿产预测指标体系,指导勘查区的矿产预测工作(图4)。

聚类分析是数据挖掘中研究数据聚集性的常用算法。知识图谱由一系列节点和关系组成,并非传统的数值型数据集。在对知识图谱进行聚类分析之前,必须进行相应的节点嵌入,即将图数据转换为空间向量数值化表达,然后进行知识图谱的聚类分析。常用的知识节点嵌入方法有FastRP、GraphSAGE、Node2Vec和HashGNN。在Neo2Vec图嵌入模型中,为描述共现的节点,采用随机游走的方式实现共现节点信息的提取。即从知识图谱中的起始节点出发,从它的临近节点中随意选择一个节点,并前进到该节点;重复上述过程获得一个固定长度的节点序列;然后借鉴Skip-gram算法模型实现知识的嵌入。

以包含4 000多个节点、9 000多条关系的金矿领域知识图谱为例,首先,利用Node2Vec图嵌入模型将金矿知识图谱中的节点信息转化为128维向量;然后利用K-medoids聚类方法对知识图谱转换的向量进行聚类分析。在聚类分析过程中,采用轮廓系数来评价聚类效果的好坏和优选聚类的数量。轮廓系数的取值范围为[-1,1],越靠近1,聚类效果越好,越接近-1,聚类效果越差。根据轮廓系数与聚类数量的变化曲线(图5),轮廓系数随着聚类数量的增加而降低并逐渐趋于稳定。在聚类数量为8时,出现小幅度的增长,之后快速下降。因此,我们选取轮廓系数0.33,聚类数量8对知识图谱进行聚类分析,获取8个金矿知识图谱聚类中心。其结果与全国矿产资源潜力评价中金矿的8个大类相吻合。根据知识图谱聚类获得的聚类结果,总结相应的找矿预测模型;在找矿预测评价过程中,可以将工作区的情况与基于知识图谱的聚类结果进行相似度计算或者匹配分析,从而获得相近的找矿预测模型,辅助资源定量预测评价工作。

2.2.3 知识图谱中蕴含的深层次异常信息提取

构建的成矿-勘查系统全要素知识图谱往往蕴含深层的找矿信息,基于知识图谱的矿产预测模型的构建本质上是一种“求同”的研究思路,通过社群分析和聚类分析,寻找聚集中心,总结其共性的特征来指导找矿预测模型的构建。在矿床的地质认知中,大型-超大型矿床在共性的控矿要素和找矿标志的基础上,往往具有其成矿的独特性。地质矿产领域知识图谱将矿床的各类知识进行逻辑显性表达,我们可以依托地质矿产知识图谱的逻辑推理能力,探索大型-超大型矿床与其他矿床之间的共性和独特性,如独特的构造环境、成矿母岩等条件,用于指导大型-超大型矿床的找矿预测工作。

蕴含在地质矿产领域知识图谱中的知识往往是描述性和离散型的,矿产资源定量预测往往依赖空间变量数据。融合知识图谱的矿产定量预测需要基于成矿-勘查系统全要素的知识图谱构建相应的地质知识向量化表达和空间映射规则,将深层次的语义信息映射成空间变量数据。在地物化遥异常信息提取过程中,分析知识图谱中蕴含的成矿模型和找矿预测模型知识的空间映射需求,利用数学和计算机的方法将地质知识进行空间刻画、编码,并将其融入到地质异常中。通过地质知识的约束,对地质异常信息去伪存真,增强与成矿密切相关的地质异常,压制和消除不符合地质认知的假异常,提高异常信息的可靠性和地质可解释性,为资源定量预测提供可靠的异常信息变量。比如将研究区不同地质变量进行网格化分割,综合网格单元提取的地质变量和地质矿产知识图谱,使用节点路径计算等方法,将地质矿产知识图谱中的语义描述异常信息转化为空间化变量,获得融合知识图谱的深层次异常找矿信息;进而与地质变量图层数据进行整合,以服务于资源定量预测评价工作(图6)。

3 结论

目前国内易探矿床基本都已完成勘探,深部隐伏矿床成为目前勘查工作的重点,科技赋能的重要性逐渐凸显。新一轮找矿突破战略行动对找矿理论突破、勘查技术提升、找矿信息集成等方面的创新极为重视。大数据和人工智能技术如何赋能新一轮找矿战略行动,提升矿产资源的效能是当前地质矿产领域的前沿问题。本文在前人的研究基础上,探讨、分析知识图谱在地质矿产预测智能化和自动化方面的潜力和关键技术问题,主要认识如下。

(1)目前成矿-勘查系统全要素知识图谱的构建仍然是一个正在进行的工作,多时序、全要素地质矿产领域知识图谱的不完善制约着后面工作的推进和开展。

(2)融合知识图谱的矿产资源定量预测不是对现有矿产资源定量预测技术方法体系的颠覆,是在现有的矿产资源定量预测技术方法体系基础上,将知识图谱融入矿产资源定量预测评价过程中,提高智能化和自动化水平。

(3)融合知识图谱矿产资源定量预测智能化和自动化的实现需要依托大数据、云计算、机器学习、数据存储等领域技术支撑,最终在云端实现业务流程的自动化和智能化。

(4)本文梳理了融合知识图谱的矿产资源定量预测中关键核心步骤,但很多关键技术问题还需进一步探索完善,需要地质专家和计算机专家的协同努力,推动矿产资源预测的智能化和自动化的实现和落地。

感谢赵鹏大院士对于本文研究思路的指导,感谢周永章教授、左仁广教授、李楠研究员、柳炳利副教授和肖凡副教授对论文内容进行的有益讨论,感谢审稿人的意见和建议。

参考文献

[1]

陈建平, 李靖, 谢帅, 中国地质大数据研究现状[J]. 地质学刊, 2017, 41(3): 353-366.

[2]

周永章, 黎培兴, 王树功, 矿床大数据及智能矿床模型研究背景与进展[J]. 矿物岩石地球化学通报, 2017, 36(2): 327-331, 344.

[3]

周永章, 陈川, 张旗, 地质大数据分析的若干工具与应用[J]. 大地构造与成矿学, 2020, 44(2): 173-182.

[4]

周永章, 陈烁, 张旗, 大数据与数学地球科学研究进展: 大数据与数学地球科学专题代序[J]. 岩石学报, 2018, 34(2): 255-263.

[5]

翟明国, 杨树锋, 陈宁华, 大数据时代: 地质学的挑战与机遇[J]. 中国科学院院刊, 2018, 33(8): 825-831.

[6]

QIU Q J, MA K, LV H R, et al. Construction and application of a knowledge graph for iron deposits using text mining analytics and a deep learning algorithm[J]. Mathematical Geosciences, 2023, 55(3): 423-456.

[7]

QIU Q J, XIE Z, MA K, et al. BERTCWS: unsupervised multi-granular Chinese word segmentation based on a BERT method for the geoscience domain[J]. Annals of GIS, 2023, 29(3): 387-399.

[8]

WANG C B, LI Y J, CHEN J G. Text mining and knowledge graph construction from geoscience literature legacy: a review[R]// MA X, MOOKERJEE M, HSU L, et al. Recent advancement in geoinformatics and data science. Boulder, Colorado: Geological Society of America, 2023: 11-28.

[9]

WANG C B, MA X G, CHEN J G, et al. Information extraction and knowledge graph construction from geoscience literature[J]. Computers and Geosciences, 2018, 112: 112-120.

[10]

WANG C B, LI Y J, CHEN J G, et al. Named entity annotation schema for geological literature mining in the domain of porphyry copper deposits[J]. Ore Geology Reviews, 2023, 152: 105243.

[11]

HART P E, DUDA R O, EINAUDI M T. Prospector: a computer-based consultation system for mineral exploration[J]. Journal of the International Association for Mathematical Geology, 1978, 10(5): 589-610.

[12]

张东晓. 科学机器学习中的知识嵌入与知识发现[R/OL]. (2023-01-28)[2024-01-15]. https://www.jiqizhixin.com/articles/2023-01-28-2.

[13]

吴飞. 数据驱动与知识引导相互结合的智能计算[J]. 智能系统学报, 2022, 17(1): 217-219.

[14]

SINGHAL A. Official Google Blog: introducing the knowledge graph: things, not strings[R/OL]. (2015-01-02)[2023-12-04]. https://www.mendeley.com/catalogue/ca10852b-1f48-3172-9b4f-8b521878b39d/.

[15]

BRODARIC B, GAHEGAN M. Representing geoscientific knowledge in cyberinfrastructure: some challenges, approaches, and implementations[M]//Geoinformatics: data to knowledge. Boulder, Colorado: Geological Society of America, 2006.

[16]

BERGEN K J, JOHNSON P A, DE HOOP M V, et al. Machine learning for data-driven discovery in solid Earth geoscience[J]. Science, 2019, 363(6433): eaau0323.

[17]

周成虎, 王华, 王成善, 大数据时代的地学知识图谱研究[J]. 中国科学: 地球科学, 2021, 51(7): 1070-1079.

[18]

GIL Y, PIERCE S A, BABAIE H, et al. Intelligent systems for geosciences[J]. Communications of the ACM, 2018, 62(1): 76-84.

[19]

NORMILE D. Earth scientists plan a ‘geological Google’[J]. Science, 2019, 363(6430): 917.

[20]

REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data-driven Earth system science[J]. Nature, 2019, 566(7743): 195-204.

[21]

PETERS S E, ZHANG C, LIVNY M, et al. A machine reading system for assembling synthetic paleontological databases[J]. PLoS One, 2014, 9(12): e113523.

[22]

HUSSON J M, PETERS S E, ROSS I, et al. Macrostrat and GeoDeepDive: a platform for geological data integration and deep-time research[C/OL]// Proceedings of the AGU fall meeting 2016 abstracts. San Francisco: American Geophysical Union, 2016[2023-09-01]. https://agu.confex.com/agu/fm16/meetingapp.cgi/Paper/187029.

[23]

ZHANG C. DeepDive: a data management system for automatic knowledge base construction[D]. Madison, WI: The University of Wisconsin-Madison, 2015.

[24]

KOSKELA R, RAMAMURTHY M, PEARLMAN J, et al. Earthcube: a community-driven cyberinfrastructure for the geosciences[C/OL]// Proceedings of 19th EGU general assembly conference abstracts. Vienna, Austria: European Geosciences Union, 2017: 5884[2023-06-15]. https://meetingorganizer.copernicus.org/EGU2017/EGU2017-5884-1.pdf.

[25]

成秋明. 深时数字地球: 全球古地理重建与深时大数据[J]. 国际学术动态, 2019(6): 28-29.

[26]

WANG C S, HAZEN R M, CHENG Q M, et al. The Deep-Time Digital Earth program: data-driven discovery in geosciences[J]. National Science Review, 2021, 8(9): nwab027.

[27]

STEPHENSON M H, CHENG Q M, WANG C S, et al. Progress towards the establishment of the IUGS Deep-time Digital Earth (DDE) programme[J]. Episodes, 2020, 43(4): 1057-1062.

[28]

MA X G, MA C, WANG C B. A new structure for representing and tracking version information in a deep time knowledge graph[J]. Computers and Geosciences, 2020, 145: 104620.

[29]

RASKIN R G, PAN M J. Knowledge representation in the semantic web for Earth and environmental terminology (SWEET)[J]. Computers and Geosciences, 2005, 31(9): 1119-1125.

[30]

COX S J D, RICHARD S M. A geologic timescale ontology and service[J]. Earth Science Informatics, 2015, 8(1): 5-19.

[31]

WANG C B, MA X G, CHEN J G. Ontology-driven data integration and visualization for exploring regional geologic time and paleontological information[J]. Computers and Geosciences, 2018, 115: 12-19.

[32]

MENTES H. Design and development of a mineral exploration ontology[D]. Atlanta, GA: Georgia State University, 2012.

[33]

WANG C B, TAN L Q, LI Y J, et al. Ontology-driven relational data mapping for constructing a knowledge graph of porphyry copper deposits[J]. Earth Science Informatics, 2024: 1-12. https://doi.org/10.1007/s12145-024-01307-5.

[34]

李国和, 杨新颖, 叶婷, 海相油气地质的概念本体知识系统设计与实现[J]. 计算机应用, 2010, 30(2): 532-536.

[35]

匡立春, 刘合, 任义丽, 人工智能在石油勘探开发领域的应用现状与发展趋势[J]. 石油勘探与开发, 2021, 48(1): 1-11.

[36]

BABAIE H A, OLDOW J S, BABAEI A, et al. Designing a modular architecture for the structural geology ontology[M]//Geoinformatics: data to knowledge. Boulder, Colorado: Geological Society of America, 2006. 2006.

[37]

ZHONG J, AYDINA A, MCGUINNESS D L. Ontology of fractures[J]. Journal of Structural Geology, 2009, 31(3): 251-259.

[38]

MANTOVANI A, PIANA F, LOMBARDO V. Ontology-driven representation of knowledge for geological maps[J]. Computers and Geosciences, 2020, 139: 104446.

[39]

LIU G, WANG Y N, WU C L. Research and application of geological hazard domain ontology[C/OL]// 2010 18th international conference on geoinformatics. Beijing: IEEE, 2010: 1-6[2011-06-16]. https://www.doi.org/10.1109/GEOINFORMATICS.2010.5567498.

[40]

RUEDA C, BERMUDEZ L, FREDERICKS J. The MMI ontology registry and repository: a portal for marine metadata interoperability[C/OL]// Oceans 2009. Biloxi: IEEE, 2009: 1-6[2010-09-01]. https://www.doi.org/10.23919/OCEANS.2009.5422206.

[41]

黄刚. 知识图谱构建方法及其在油气勘探开发领域应用研究[D]. 大庆: 东北石油大学, 2019.

[42]

QIU Q J, XIE Z, WU L, et al. BiLSTM-CRF for geological named entity recognition from the geoscience literature[J]. Earth Science Informatics, 2019, 12(4): 565-579.

[43]

QIU Q J, XIE Z, WU L, et al. GNER: a generative model for geological named entity recognition without labeled data using deep learning[J]. Earth and Space Science, 2019, 6(6): 931-946.

[44]

QIU Q J, XIE Z, WU L. A cyclic self-learning Chinese word segmentation for the geoscience domain[J]. Geomatica, 2018, 72(1): 16-26.

[45]

HUANG L, DU Y F, CHEN G Y. GeoSegmenter: a statistically learned Chinese word segmenter for the geoscience domain[J]. Computers and Geosciences, 2015, 76: 11-17.

[46]

LI S, CHEN J P, XIANG J. Prospecting information extraction by text mining based on convolutional neural networks: a case study of the lala copper deposit, China[J]. IEEE Access, 2018, 6: 52286-52297.

[47]

ZHU Y Q, ZHOU W W, XU Y, et al. Intelligent learning for knowledge graph towards geological data[J]. Scientific Programming, 2017, 2017: 5072427.

[48]

王永志, 金樑, 朱月琴, 基于大数据技术的地学文档关键词提取算法研发[J]. 地球物理学进展, 2018, 33(3): 1274-1281.

[49]

QIU Q J, XIE Z, WU L, et al. Automatic spatiotemporal and semantic information extraction from unstructured geoscience reports using text mining techniques[J]. Earth Science Informatics, 2020, 13(4): 1393-1410.

[50]

ZHOU X G, GONG R B, SHI F G, et al. PetroKG: construction and application of knowledge graph in upstream area of PetroChina[J]. Journal of Computer Science and Technology, 2020, 35(2): 368-378.

[51]

HOLDEN E J, LIU W, HORROCKS T, et al. GeoDocA-Fast analysis of geological content in mineral exploration reports: a text mining approach[J]. Ore Geology Reviews, 2019, 111: 102919.

[52]

PETERS S E, HUSSON J M, WILCOTS J. The rise and fall of stromatolites in shallow marine environments[J]. Geology, 2017, 45(6): 487-490.

[53]

MOORE E K, HAO J H, PRABHU A, et al. Geological and chemical factors that impacted the biological utilization of cobalt in the Archean eon[J]. Journal of Geophysical Research: Biogeosciences, 2018, 123(3): 743-759.

[54]

赵鹏大. “三联式” 资源定量预测与评价: 数字找矿理论与实践探讨[J]. 地球科学, 2002, 27(5): 482-489.

[55]

赵鹏大. 关于数字地质[C]// 中国地质学会. 第十届全国数学地质与地学信息学术研讨会论文集. 武汉: 中国地质大学出版社, 2011.

[56]

周永章, 左仁广, 刘刚, 数学地球科学跨越发展的十年: 大数据、人工智能算法正在改变地质学[J]. 矿物岩石地球化学通报, 2021, 40(3): 556-573.

[57]

左仁广. 基于数据科学的矿产资源定量预测的理论与方法探索[J]. 地学前缘, 2021, 28(3): 49-55.

[58]

左仁广, 彭勇, 李童, 基于深度学习的地质找矿大数据挖掘与集成的挑战[J]. 地球科学, 2021(1): 350-358.

[59]

赵鹏大. 大数据时代数字找矿与定量评价[J]. 地质通报, 2015, 34(7): 1255-1259.

[60]

张金川, 陈世敬, 李中明, 页岩气资源智能评价[J]. 油气藏评价与开发, 2021, 11(4): 476-486.

[61]

肖克炎, 孙莉, 李楠, 大数据思维下的矿产资源评价[J]. 地质通报, 2015, 34(7): 1266-1272.

[62]

WÓJCIK S, OSMAN T, ZAWADA P. Semanticapproach for prospectivity analysis of mineral deposits[C]// Proceedings of the 2nd international conference on geographical information systems theory, applications and management. Rome, Italy: Science and Technology Press, 2016: 180-189.

[63]

MCGREGOR J, SMYTH C, POOLE D. Ontology-based reasoning applications for mineral exploration and hazard mapping[C/OL]// Proceedings of 21th EGU general assembly conference abstracts, Vienna, Austria: European Geosciences Union, 2019: 11552[2020-02-16]. https://ui.adsabs.harvard.edu/abs/2019EGUGA..2111552M/abstract.

[64]

周永章, 张前龙, 黄永健, 钦杭成矿带斑岩铜矿知识图谱构建及应用展望[J]. 地学前缘, 2021, 28(3): 67-75.

[65]

杨明莉, 薛林福, 冉祥金, 智能矿产地质调查方法: 以甘肃大桥-崖湾地区为例[J]. 岩石学报, 2021, 37(12): 3880-3892.

[66]

LI S, CHEN J P, LIU C. Overview on the development of intelligent methods for mineral resource prediction under the background of geological big data[J]. Minerals, 2022, 12(5): 616.

[67]

LI S, LIU C, CHEN J. Mineral prospecting prediction via transfer learning based on geological big data: a case study of Huayuan, Hunan, China[J]. Minerals, 2023, 13(4): 504.

[68]

吴永亮, 贾志杰, 陈建平, 基于大数据智能的找矿模型构建与预测[J]. 中国矿业, 2017, 26(9): 79-84.

[69]

LAWLEY C J M, GADD M G, PARSA M, et al. Applications of natural language processing to geoscience text data and prospectivity modeling[J]. Natural Resources Research, 2023, 32(4): 1503-1527.

[70]

罗转霞. 云南省锡矿领域语义关系抽取及知识图谱构建[D]. 武汉: 中国地质大学(武汉), 2023.

基金资助

国家重点研发计划项目(2022YFF0801202)

国家重点研发计划项目(2023YFC2906404)

国家重点研发计划项目(2022YFF0801201)

国家自然科学基金项目(41902305)

新疆维吾尔自治区重点专项(2022A03009-3)

战略性矿产资源潜力智能评价湖北省创新群体项目(2023AFA001)

“云找矿”应用支撑能力技术研究项目(YNGH[2023]-155)

AI Summary AI Mindmap
PDF (6062KB)

395

访问

0

被引

详细

导航
相关文章

AI思维导图

/