面向灾害应急响应的地质灾害链知识图谱构建方法

邱芹军 ,  吴亮 ,  马凯 ,  谢忠 ,  陶留锋

地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 1875 -1891.

PDF (2987KB)
地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 1875 -1891. DOI: 10.3799/dqkx.2022.313

面向灾害应急响应的地质灾害链知识图谱构建方法

作者信息 +

A Knowledge Graph Construction Method for Geohazard Chain for Disaster Emergency Response

Author information +
文章历史 +
PDF (3057K)

摘要

知识图谱是形式化描述实体及其相互关系的知识系统,其在应急救灾、时空预测决策等方面发挥着重要的作用.灾害应急领域面临数据骤增而应急关键知识匮乏问题,由此从灾害链角度分析地质灾害发展过程中关联的诸多要素,提出了一种自顶向下和自底向上结合的地质灾害链知识图谱构建方法.首先,基于灾害链角度对地质灾害间复杂形成机理及成链规律进行分析,在已有地质灾害知识基础上,基于自顶向下方法建立了统一的用于信息抽取的地质灾害链本体语义表达框架,包括描述地质灾害知识体系的地质灾害事件本体、承载地质灾害发生的地质环境本体、受地质灾害作用下的地理对象本体及地质灾害在灾前、灾中和灾后时空过程中对应的应急处置方法本体;其次,结合自底向上方法构建数据层,通过知识融合、知识存储对概念、实例与属性等要素及其关联关系进行识别;最后以汶川地震为例并对知识图谱进行可视化表达.结果表明,本方法能有效地对四类要素及其关系进行识别,实现了数据‒信息‒知识的转换,为地质灾害领域的知识图谱构建提供技术参考.

关键词

地质灾害链 / 知识图谱 / 领域本体 / 自然语言处理 / 应急响应 / 灾害地质

Key words

geohazard chain / knowledge graph / domain ontology / natural language processing / emergency response / hazard geology

引用本文

引用格式 ▾
邱芹军,吴亮,马凯,谢忠,陶留锋. 面向灾害应急响应的地质灾害链知识图谱构建方法[J]. 地球科学, 2023, 48(05): 1875-1891 DOI:10.3799/dqkx.2022.313

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

中国是世界上地质灾害最严重的国家之一,其地质环境复杂,地理位置特殊,地貌类型多样,地震、滑坡、泥石流、崩塌等重大地质灾害频发(廖永丰等,2013刘哲等,2018李振洪等,2022罗刚等,2022),给人民生命财产等造成极大威胁(杜志强等,2020陶坤旺等,2020王运生等,2022).地质灾害的发生及发展往往并非彼此独立,相继发生的地质灾害在时空上都存在一定关联(孔嘉旭等,2021李浩然等,2021宋英华等,2021杜文杰等,2022).由于一种灾害的发生引发或导致另外灾害的发生,使得灾害的发生产生链式效应,这样的现象称为灾害链(史培军,2002韩金良等,2007张永双等,2013王飞等,2020).地质灾害链的发生常伴随灾难性后果(杜志强和顾捷晔,2016贾珂程等,2022),因此有必要针对具有突发性、随机性、链式效应和时空关联性的地质灾害链进行研究,为灾情评估、应急处置和综合减灾防灾提供重要的科学依据.

伴随着对地观测技术快速发展,数据源越来越广,数据量越来越大,地质灾害数据相关类型及总量不断增加,给数据的快速收集、融合、关联、网络传输和分析都带来巨大的挑战.海量地质灾害数据中有价值信息并不多.知识图谱在处理和展示多源异构数据方面具有巨大优势,相比于传统信息服务知识库在语义层次关联性缺失等不足(张雪英等,2020刘军旗等,2021谢炎宏等,2021周成虎等,2021施秋华等,2022),这种语义网络特性为地质灾害信息间潜在关系与链式传导的获取、使用和展示提供了新的方案,知识图谱的引入有助于地质灾害相关数据的快速收集、融合和关联.

知识图谱本质是一种用图模型来描述复杂的知识和建模世界万物之间关联关系的技术方法,其概念由谷歌公司2012年5月正式提出,旨在揭示领域知识的动态发展规律(Nickel et al., 2015).知识图谱因其具有大规模、多语义和高质量的特点被广泛应用于语义搜索、智能问答、医疗服务和推荐系统等多领域(李涓子和侯磊,2017官赛萍等,2018侯梦薇等,2018饶子昀等,2021王智悦等,2020Zuo, 2021).众多学者提出了基于不同专业角度的灾害知识图谱,目前相关工作集中于基于本体构建灾害领域本体及图谱.大多针对灾害事件单一要素进行描述,构建灾害或灾害应急本体识别灾害类型,分析灾害时空演化及影响(刘晓慧等,2018贾梦姝等,2020焦麟等,2021);部分研究了灾害时空演化过程,基于灾害本体实现灾害知识的形式化表达(王艳妮和刘刚,2011田董炜等,2019杜志强等,2020).目前地质灾害数据来源广泛,灾害类型多样,现有研究缺乏从灾害链角度对地质灾害链时空变化特性进行研究,无法厘清地质灾害与地质环境、地理对象及应急处置等多要素间关联分析,较难形式化描述地质灾害链演化过程并进行知识及智能服务应用.

针对上述问题,本文以地质灾害链为核心,围绕地质灾害本体、地质环境本体、地理对象本体及应急处置本体四要素,建立地质灾害链知识图谱体系框架,梳理与整合地质灾害领域概念层次及实例间的时空及语义关系;在此基础之上,借助于自然语言处理技术,以地震灾害为例实现了灾害信息抽取与分析,为地质灾害信息智能化服务及灾害快速应急响应提供基础服务与技术支持.

1 地质灾害链知识图谱构建流程

1.1 地质灾害链概念及体系

灾害链指一类灾害产生而引起后续一系列链式反应灾害的现象,从类别上分为串发性灾害链与并发性灾害链(Peng et al.,2016Zhang et al., 2017Liu and He,2018Han et al.,2021).地质灾害链可作为地理事件的一类子集,借助面向事件的地理本体建模对相关概念进行形式化表达,以支撑地理信息的自动化抽取与知识发现.而地理事件代表的是一定空间领域内发生的涵盖事件、位置和现象等要素的各种自然及社会现象,具有典型的时空特征,其形式化表达必须考虑时空要素(刘纪平等,2011马雷雷等,2016).因此,借助面向事件的本体建模方法与思路,在灾害链的整个生命周期中,围绕地质灾害链知识体系形式化与逻辑化表达,其核心内容不仅包括基础地质灾害知识体系,同时还包括地质灾害作用下的地质环境知识体系(如地形地貌、地震与地质构造、岩土结构等),引起的地理对象在时空(如时间、位置)和属性(如面积、类别)上的变化,以及灾害发生后对周边环境或区域产生的影响及人类应急处置措施知识体系.

1.2 地质灾害链知识图谱构建基本流程

地质灾害链知识图谱的构建以地质灾害本体设计为基础,针对地质灾害领域实体结构统一、信息内容及语义关联多样化特点,通过自顶向下与自底而上相结合的方法构建地质灾害链知识图谱(图1).即模式层自顶向下定义概念实体及其属性、层级语义关系与约束规则等,构建准确、结构层次分明的概念体系架构.数据层自底而上,对地质灾害数据库、文献报告、互联网泛在文本等不同数据,抽取实体信息及语义关联,对不同来源知识进行对齐与融合,并将地质灾害、地理对象、地质环境和应急处置的具体实例要素进行分解,建立具体要素与相关概念节点间的映射,形成模式层到数据层的映射,构建综合化的灾害链知识图谱,并以Neo4j图数据库的形式存储.

2 地质灾害链知识图谱模式层构建

从地球信息科学领域角度分析,灾害链演化过程语义可理解为在一定的条件下,演化过程对象在整个灾害生命周期内受孕灾环境、致灾因子的影响,随着灾变特征的变化,引发一系列灾害事件的过程演变序列.地质灾害链传递过程中灾害之间会存在相互作用,从而使得灾害造成的后果被累积放大,单一灾种的研究无法全面考虑灾害链传递过程中的累积放大后果.

地质灾害链知识图谱模式层是地质灾害领域中概念及其相关关系的表示,包含概念节点集合及概念关系边集合.针对地质灾害链演化过程中的地质灾害事件、地质对象、地质环境及应急处置4类要素,联合专家知识对各个要素进行概念定义、属性定义及其约束、关系定义和实例补充.借助本体思想构建地质灾害链知识图谱模式层,地质灾害链本体建模不仅在于灾害知识的逻辑表达,更在于潜在灾害关系的显式化,即以灾害链显式化描述灾害的发展变化过程及其影响,从而探究灾前、灾中和灾后一系列相关事件的时空变化特征及其影响下的应急处置措施.

地质灾害链本体建模包含地质环境本体、地质灾害本体、地理对象本体和应急处置本体4个部分(图2).

2.1 本体逻辑结构表达

本体逻辑结构表达是为了在统一的语义表达框架下,将领域知识进行归纳及整理,从而构建知识体系之间的逻辑关联,最终服务于信息的抽取及知识推理(Qiu et al.,2019).常规的本体逻辑结构表达方法有3类:基于概念、属性、实例的三元组表示方法(三元组),基于概念集、关系集、实例集和公理集的四元组表示方法(四元组),以及基于概念、关系、属性、规则与实例的五元组(五元组)表示方法(Li et al.,2016Liu et al.,2017).

由于三元组无法有效描述概念之间的关系,难以有效支持后续的知识推理及挖掘潜在的知识关联;四元组表示无法描述实例属性特征,无法完整描述实例的基本特性.基于此,本文认为五元组表示方法可满足对地质灾害及其作用下的地质环境、地质对象等进行整体性描述,选用五元组作为本体的描述框架,最终形成知识的统一表达,其表示为:

          O n t o = ( C o n , R e l , P r o p , R u l e , I n s )

其中,Con指概念,代表一系列具有相同特性的事物的集合总称;Rel指关系,代表概念之间、概念与实例之间的层次关系,以及实例之间的时空关系及语义关系;Prop指属性,代表实例对象间的关联性以及实例与数值间的关联性;Rule指规则,代表对领域概念及实例的取值范围、类型及组合方式的约束表达,从而支持语义推理;Ins指实例,代表基于领域概念的具体化表达.

2.2 本体间的语义关系表达

地质灾害知识图谱模式层次包含概念节点集合、概念边关系集合两部分,代表的是地质灾害领域中概念节点及概念间关系的表征.本文依据已有先验知识及地质灾害链时空演化机理,对地质灾害领域中的地质灾害事件、地质灾害环境、地理对象及应急处置4类要素进行概念层次的划分,并对概念间属性关系及语义关系进行定义.其中,地质环境本体描述地质灾害本体的孕灾环境;应急处置本体描述地质灾害的响应及应对措施;地理对象本体是地质灾害本体的承载体;地理对象本体为应急处置本体的处理对象(图3).

地质灾害链的演化过程包括潜伏期、开始期、活跃期及消亡期,对应应急救灾时的灾前、灾中及灾后阶段;时空过程是整个地质灾害链中的主线,伴随着地质灾害链过程及地质灾害事件链式演化过程.

通过对地质灾害链进行分析,地质灾害本身是一种典型的具有时空特征的地理事件.因此,结合自然灾害事件的时空特征,将地质灾害链中实体对象之间存在的关系分为3类:语义关系、事件关系和空间关系(杜志强和顾捷晔,2016).

语义关系划分为地质灾害与地质灾害和地质灾害与承灾体两大类关系(表1).在地质灾害链中存在的主要关系包括:(1)一个地质灾害导致另外一个灾害形成因果关系;(2)由同一个灾害导致的同源关系;(3)一个灾害由两个地质灾害源同时导致的放大关系.地质灾害与承灾体关系则是为了强调地质灾害与承灾体之间的语义关系.

时间关系描述的是灾害之间发生的先后次序,主要采用时间点和时间段来表示(张雪英等,2012).时间点用于描述地质灾害发生或结束某个时刻,时间段则描述地质灾害从开始到结束经历的时间区间,地质灾害链中由于多个灾害之间的复杂关联关系,在同一时间段内可能存在多个灾害同时或先后发生.时间关系分类如表2所示.

地质灾害具有典型的地理属性,每一类地质灾害自身都具备空间属性.因此,本文中利用已有空间关系定义来描述地质灾害与地质灾害之间具有的空间位置关系.空间关系划分为拓扑关系、距离关系、方位关系(张雪英等,2012).拓扑关系涉及常见的六种基本关系(如包含、被包含、相等),方位关系代表常见的八种基本关系(如东、南、西、北等),度量关系代表的两个空间位置的相对距离之间的度量.如“该地层南侧被侏罗纪花岗岩吞噬,北侧与多彩蛇绿混杂岩断层接触”,方位关系表述为南侧、北侧.本文所定义的空间关系分类如图4所示.

2.3 地质灾害信息层次结构

2.3.1 地质灾害本体建模

地质灾害本体建模重点在于地质灾害分类与灾害间的关系表达.地质灾害分类主要依据《中华人民共和国国土资源行业标准(DZ-2000)地质灾害分类分级》和《中华人民共和国地质矿产行业标准(DZ0238-2004)地质灾害分类分级》中具体概念及层次关系,同时依据地质灾害产生机理,考虑不同类型地质灾害间的次生或者衍生关系,构建地质灾害基本概念与关系的描述.地质灾害按照类别可以划分为滑坡、崩塌、泥石流、地裂缝、地面沉降和地面塌陷等13种地质灾害,各个类别又可以继续划分为小类,如崩塌可分为巨型崩塌、大型崩塌、中型崩塌和小型崩塌等.

除了在概念层次之间的类别关系,不同类别地质灾害间往往还存在诱发关系,最终导致灾害链的产生.同时,不同类别地质灾害的产生机理及影响的对象不同,产生的灾害链也不相同.如暴雨可能引发滑坡及泥石流等灾害,最终对房屋、基础设施、农田等造成严重影响,由此形成暴雨灾害链;大气寒流可引发严厉霜冻等灾害,造成植被破坏、土地沙漠化、气候干旱化等影响,形成大气寒流灾害链.

地质灾害本体中的基础框架包括概念及相关关系,而实例、属性及约束进一步丰富并完善了本体框架的逻辑结构.面向地质灾害实例及本体概念的具体表现,从而验证本体描述的准确性及表达的有效性.就地质灾害属性而言,时空属性是其典型的一种特性,还包括非时空属性,同时还需考虑不同地质灾害间通用属性与特有属性信息,部分地质灾害通用属性与特有属性如表3所示.面向地质灾害约束的重要内容包括地质灾害属性限定范围,例如受灾范围及面积表达的合理性.

2.3.2 地理对象本体建模

地理对象本体建模主要依据《基础地理信息要素分类与代码》(GB13923-2006)中地理信息要素分类层次结构及其相关概念.主要内容包括交通、地表与地下水、居民地与建筑设施、境界与行政区、植被与土壤、管线、定位基础几大类.其中各类别又可依据上述标准进行细分,如交通可细分为铁路、城际公路、城市道路、乡村道路、道路附属设施、水运设施、航线、空运设施与其他交通设施.地质灾害发生时相关地理对象成为地质灾害链中的必不可少的一环,它既是被地质灾害影响的受灾因素,也是应急响应处置的对象.如云南普洱市发生地震灾害时需对受灾的行政范围、灾区建筑物和民房受损情况进行应急评估与鉴定,及时抢通被破坏的道路、桥梁等交通基础设施,对森林火灾进行预防,灾后对受损的管线进行修复等,案例涉及到行政区、居民地与建筑物、交通、管线、植被与土壤等相关地理对象.

地理对象本体中概念的属性既包含面积、距离、长度、数量等几何度量属性,也包括名称等语义描述.地理对象关系包含空间关系与非空间关系两大类.前者含方位关系、拓扑关系等,后者包含等价关系、从属关系、部分/整体关系等描述概念与概念、概念与实例之间以及实例与实例之间的语义关系.方位关系描述东、南、西、北、东南、东北、西南、西北8个方位的度量,如某村庄位于所属县城的西南部,该村庄和县城的方位关系为西南.拓扑关系具体分为包含、邻接和关联.如某国道与某省道表现为拓扑邻接关系.

2.3.3 地质环境本体建模

地质环境代表的是地球表面各类环境因素及其相互关系形成的综合体,是人类生存的客观世界存在的地质实体,也是人类从事经济与工程活动的载体,当然也是一类可利用的资源.地质灾害的发生与地质环境密切相关,它是地质环境发生不利变化后产生的后果,对人类的生命财产及经济建设造成严重的危害及损失.从分类上看,地质灾害的发生包括由地质作用诱发的自然地质灾害及人类经济与工程活动等人为因素造成的地质灾害.地质环境是地质灾害形成与发展的基础和条件.地质灾害的空间分布及其危害程度与地形地貌、地质构造格局、新构造运动的强度与方式、岩土体工程地质类型、水文地质条件、气象水文及植被条件、人类工程活动的类型等有着极为密切的关系.如危岩体地质结构、危岩体及周边的地层岩性、危岩体及周边的水文地质条件、危岩体周边及底界以下地质体的工程地质特征、危岩体变形发育史、危岩体形成的动力因素等.

地质灾害作用下的地质环境本体建模涉及自然因素及人为因素引起的诸多地质环境对象,其基本概念和关系制定依据《地质灾害调查规范》中的概念及具体层次关系.地质环境类别包含地形地貌环境、岩土体工程地质环境、地质构造环境3大类,各类别又可继续划分,如岩土体工程地质环境可划分为地层岩性、岩层产状、强度特性、风化程度、土体、坡体结构.

2.3.4 应急处置本体建模

应急处置本体建模的主要依据为《地质灾害防治条例》、《国家突发公共事件总体应急预案》相关文件.依据灾害风险管理及应急处置基础理论,将地质灾害发生的全过程划分成为灾前、灾中和灾后3个不同阶段层次,其每个阶段目标及任务不同.灾前应急目标主要是为了灾前预防及预警,对应应急任务包括地质灾害风险预警与监测、地质灾害风险评估;灾中应急目标包括地质灾害的响应及快速处置,其应急任务包括灾害快速评估、救助资源快速配置与协调、灾害应急演练等;灾后主要目标是恢复及重建以及对地质灾害的总结与分析,其对应应急任务包括综合性评估及恢复后的效果推演等.

3 地质灾害链知识图谱数据层构建

地质灾害链知识图谱数据层旨在模式层中4类本体库的概念框架指导下,针对地质灾害数据库(如国家地质灾害数据库)、地质灾害报告文献及其他泛在互联网文本资源等多源异构数据源,采用算法抽取实体、关系及属性,并进行数据的融合,继而将抽取三元组知识存储到图数据库(如Neo4j;黄权隆等,2018; Mario et al.,2018;崔斌等,2019)中.对于地质灾害数据库目前大部分采用GIS平台对数据进行展示与分析,大量非结构化的地质灾害数据还未得到充分利用与挖掘.

3.1 基于序列标注的地质灾害实体及关系抽取

面向不同的知识数据来源,需设计对应的实体、关系及属性抽取方法.结构化的数据由于数据库字段定义清晰,通过设计字段与关键词映射规则即可直接从数据库中获取地质灾害实体及对应属性信息,地质灾害对象间语义关系也可通过数据库中建立的字段关联进行映射;针对非结构化文本数据(包括基于爬虫清洗后数据),需要通过数据预处理、中文分词、模板匹配、规则定义等文本处理方法结合机器学习等抽取地质灾害目标实体及关系,获取原始的目标实体及对应关系.

面向文本数据的地质灾害实体及关系抽取是知识抽取中的难点问题.地质灾害本体、地理对象本体、地质环境本体及应急处置本体4类要素在模式层已经清晰地定义及覆盖了实体名称,基于本体库中不同粒度分类概念体系如何有效从文本数据中准确抽取4类要素本体是其中的一项关键内容.

深度学习是目前实体及关系抽取任务中一种主流机器学习模型.本文实验采用BERT(Bidirectional Encoder Representations from Transformers)-BiLSTM(Bi-directional Long Short-Term Memory)-Attention-CRF(Conditional Random Field)架构.BERT模型将词转换为向量形式,基于采用的双向Transformer架构,使得输入更好地结合上下文的信息;BiLSTM主要由3个门函数构成,分别为输入门、遗忘门和输出门,解决了长时间训练过程中存在的梯度消失和梯度爆炸等问题,具有长时记忆功能.Attention注意力层可使得在命名实体识别的过程中动态的利用词向量和字符向量之间的信息.CRF层使得模型考虑每个标签之间的相关性,通过概率大小输出标签会使得结果更具有顺序性.实验采用BIO标注体系来表明地质灾害实体名称位置,其中B代表实体的起始位置,I代表实体中除起始位置的其他位置,O则代表非实体.选取了地质报告文本数据,对15篇地质灾害报告18 928个句子进行人工标注,选择其中13 249个句子作为训练集,5 678个句子作为验证集.算法评价指标采用准确率、召回率和综合度量F值3类.

3.2 多源地质灾害知识融合

在构建地质灾害链知识图谱中,地质灾害实体在不同类型数据中的实体名称、实体描述、类别均存在差异性,需要消除各类地质灾害实体的歧义,并将相同含义实体进行知识融合.例如蒸发盐类塌陷,岩盐塌陷二者表达的本质内容其实是一致的.

本文综合衡量数据融合对象在名称、层次类别及属性等内容上的相似性,确定是否属于同一实体,通过设置相似性阈值控制是否对实体进行融合.融合对象基本属性包括所属类别、对象功能、对象具体描述、时间信息、位置信息等.特别是针对融合对象时间属性,当文本相似度较高时,选择时间属性较新的实体作为候选实体.具体操作如下:对识别的地质灾害实体进行中文分词、计算分词词频,构建实体名称向量,通过词向量将其从语义空间转换到向量空间,计算向量之间的夹角余弦值,通过余弦值设置合理阈值判断实体间相似程度,最终实现实体融合.实验中经过测试,相似性阈值设置为0.6,实体融合效果最好,如表4所示.

3.3 知识存储

通过上述处理流程,将不同数据源中的信息数据转换成结构化的知识.由于图数据库对结构层次清晰、面向实体关系及实体属性类的数据具有明显的存储优势,能够实现对地质灾害链知识图谱从概念层次、实体层次、属性层次等多个维度进行可视化展示(黄权隆等,2018; Mario et al.,2018;崔斌等,2019).

针对实体关系及实体属性信息,图数据库存储时以(实体,关系,实体)及(实体,属性,属性值)三元组形式形成多条知识,首尾部分存储为图中的节点,属性信息及关系信息存储为边,以实现结构化知识到图数据库中三元组知识间的映射,基于构建的地质灾害链知识图谱,联合图查询语言及挖掘算法能够实现知识图谱的补全及知识推理等应用.

4 地质灾害链知识图谱实例分析

4.1 知识获取及效果验证

知识获取是构建知识图谱重要步骤,本文根据地质灾害数据的多样性,结合地质灾害数据类型,基于不同的数据来源获取数据.针对结构化数据类型,例如国家地质灾害数据库、灾情统计数据库等,直接获取所需数据记录;针对地质灾害专业网站、地质灾害调查行业网页等半结构化数据,通过网络爬虫方式对网页结构信息进行解析、清洗、模板匹配等获取地质灾害相关数据;对于领域专业文献资料等文本类的非结构化数据,利用文献搜索引擎,设置检索关键字,利用网页爬虫获取领域文献数据(本文主要以微博数据为主),3种方式相结合,从而获取较为全面的数据源.同时,重点以汶川地震灾害为例,从多源数据中获取该地震灾害发生的时间、位置、发生的地质环境、区域历年来发生的所有灾害记录以及人口、房屋、经济等损失信息,通过信息抽取与知识融合后进行可视化展示.

实验中所有的对比实验均采用统一数据集,模型的参数经过多次调整为最佳训练参数.为验证BERT-BiLSTM-Attention-CRF模型在命名实体识别中的效果,本文同时进行了规则匹配、BiLSTM、BiLSTM-CRF、BiLSTM- Attention-CRF四种对比实验,实验结果如表5表6所示.相比其他4种模型,BERT-BiLSTM-Attention-CRF模型获得的准确率和召回率更高,分别达到了96.5%和68%,综合度量F值也达到79.78%;针对关系抽取实验,所有深度学习方法准确率较高,但召回率不高,最终导致F值提升不大.通过对比实验结果可以得出,BERT-BiLSTM-Attention-CRF模型对命名实体识别及实体关系抽取具有最优效果.表7表8展示了部分实体及关系抽取结果.

4.2 地质灾害链知识图谱模式层

按照本研究中所呈现的自顶向下地质灾害链知识图谱构建方法,首先构建地质灾害链知识图谱模式层,构建包含地质灾害事件、地质环境、地理对象及应急处置4类核心要素的地质灾害链本体,同时对本体概念间层次关系(如父子关系)、要素属性关系及概念间语义关系进行形式化定义,最终构建模式层(图5).从图中可以看出,所构建的地质灾害链模式层能够对地质灾害链时空演化过程及地质灾害事件进行完整性描述,同时也能够将地质环境、地理对象及应急处置间语义关系进行表达,形成对地质灾害链的整体描述,理清各灾种之间的成因关系、相互转化机理和潜在风险,查明并掌握其发生、发展和转换等演变规则,可为防灾减灾提供可靠的理论依据和技术支撑,以提高灾害的防治水平.

4.3 地质灾害链知识图谱数据层

模式层到数据层的映射主要是通过建立地质灾害实体、语义关系和自然语言描述对照词典实现关联,如拓扑相离关系和拓扑包含关系对应方位词,拓扑相交关系对应空间动词.基于自顶向上的方法从国家灾害网、地质灾害专业网、地质灾害报告、互联网文献获取多源数据.按照地质灾害链本体结构,从多源数据中获取了地质灾害发生的时间、位置、发生的地质环境、区域历年来发生的所有灾害记录以及人口、房屋、经济等损失信息,对地质灾害链实例进行实体、关系及属性值的抽取.从多源数据中抽取实体共5 897个,按照知识融合后得到实体3 587个,关系135个,属性值198个.利用图数据库Neo4j存储上述抽取实体及关系,部分的地质灾害链知识图谱数据层的部分节点及关系如图6所示.其中,基础地理对象是地质灾害链知识图谱中重要的组成部分,如气候、地形地貌、降雨量等;应急管理对象表示灾情中密切关注的场景对象,如应急指挥部、医院、避难场所、救援物资、救援路线等;次生灾害代表由地震引起的各类二次灾害的事件,如泥石流、堰塞湖、崩塌、爆炸等;地质环境是灾害发生的孕灾体,如海拔高度、地层、地形坡度、岩性等.

图6较为完整地展示了地质灾害链中的地质灾害事件与地质环境、地理对象、应急处置实体间语义关系及实体属性关系.其中橙色节点“汶川地震灾害”关联了“彭州市回龙沟崩塌”及“北川县王家岩滑坡”,代表了地质灾害的链式反应,与节点“汶川地震灾害”相关的节点有灾害发生地点、发生时间、灾害类型等属性节点,以及对应的应急任务节点(绿色).地质灾害发生灾前、灾中、灾后不同的应急过程具有所对应的应急任务,如在灾中关联灾害救援,灾后关联重建与评估.

在查询某一条地质灾害链知识时,地质灾害链知识图谱系统通过知识图谱中构建的语义网络查询实体信息,并对这一类型下知识结构进行可视化展示(图7),对地质灾害链知识图谱知识进行查询,查询结果展示了不同地质灾害实体信息、地质环境信息和灾害属性信息等类型实体信息间的关联关系,展示了地质灾害链实体(地震‒滑坡‒泥石流)、地质环境、地理对象、应急处置等在实际应用表现及其之间的信息关联,实现了地质灾害信息在深度和广度层面上的知识关联和梳理分析.

在信息查询方面,依据关键词信息筛选地质灾害链应急响应三元组组合,输出与之相关的实体内容,如图8所示,查询北川县苏宝河泥石流应急响应措施,依据“北川县苏宝河泥石流”和“措施”这两个关键词,建立了“北川县苏宝河泥石流(地质灾害对象)‒学校(场景)‒泥石流避难措施(应急处置服务)‒避难路线规划(应急处置服务)”的关联脉络,调用了避难路线规划功能,计算到紧急避难点的疏散路线.有效关联了场景信息、防灾减灾策略和功能服务实体,由此运用地质灾害防治知识网络实现了针对用户需求的智能化信息查询.

5 结论

知识图谱的相关理论与方法为信息‒知识‒应用提供了一种全新的手段,为地质灾害减灾防灾和知识服务拓展了方向.本文针对海量地学数据未得到充分利用造成地质灾害管理关键知识匮乏问题,研究了地质灾害链知识图谱构建方法.以知识图谱理论与方法为指导,构建了地质灾害链统一逻辑表达框架,对地质灾害领域中的地质灾害事件、地质环境本体、地理对象本体及应急处置本体4类核心要素进行了定义与构建,对其中的概念间、实例间属性及语义关系进行了本体层上的分类及定义.并以多源地质灾害数据为例进行了实验案例分析,通过数据预处理、基于深度学习的地质灾害实体及关系抽取构建了地质灾害链知识图谱.实验结果表明本文所构建的地质灾害链知识图谱能够清晰描述地质灾害事件、地质环境、地理对象及应急处置内容,并能清晰及准确表达地质灾害实体间、实体与属性间丰富的语义关系,有效验证了本文所提出的地质灾害链知识图谱构建方法的可行性与有效性,为地学知识图谱的构建与研究提供了思路.

通过构建地质灾害链知识图谱能够将复杂地质灾害事件与应急响应资源信息进行结构化表达,有效建立各类实体之间的时空及语义关系,将地质灾害事件及相应的应急响应知识进行抽取并加以关联,有助于实现对应急救援资源信息的整合与共享,帮助应急决策者更加直观地了解灾害事件信息,实现历史事件相似分析;同时,还能结合制定的推理规则推理出满足实际救援需要的应急方案,为应急决策者提供智慧化辅助支撑.但是,本研究还存在不足,后续的研究工作中,将采用更丰富的数据源,完善知识抽取方法,扩展知识图谱规模,建立高质量知识图谱,提高地质灾害防治信息服务智能化水平.

参考文献

[1]

Cui, B., Gao, J., Tong, Y.X., et al., 2019. Progress and Trend in Novel Data Management System. Journal of Software, 30(1): 164-193 (in Chinese with English abstract).

[2]

Du, W.J., Sheng, Q., Yang, X.H., et al., 2022. Chain Generation Process of Landslide Blocking River Based on Two-Phase Double-Point Material Point Method. Advanced Engineering Sciences, 54(3): 36-45 (in Chinese with English abstract).

[3]

Du, Z.Q., Gu, J.Y., 2016. A Domain Ontology Construction Method of Disaster Chain—Case Study of Rainstorm Flood Disaster Chain. Geomatics World, 23(4): 7-13 (in Chinese with English abstract).

[4]

Du, Z.Q., Li, Y., Zhang, Y.T., et al., 2020. Knowledge Graph Construction Method on Natural Disaster Emergency. Geomatics and Information Science of Wuhan University, 45(9): 1344-1355 (in Chinese with English abstract).

[5]

Guan, S.P., Jin, X.L., Jia, Y.T., et al., 2018. Knowledge Reasoning over Knowledge Graph: A Survey. Journal of Software, 29(10): 2966-2994 (in Chinese with English abstract).

[6]

Han, J.L., Wu, S.R., Wang, H.B., 2007. Preliminary Study on Geological Hazard Chains. Earth Science Frontiers, 14(6): 11-23 (in Chinese with English abstract).

[7]

Han, X., Yin, Y., Wu, Y., et al., 2021. Risk Assessment of Population Loss Posed by Earthquake-Landslide- Debris Flow Disaster Chain: A Case Study in Wenchuan, China. ISPRS International Journal of Geo- Information, 10(6): 363.

[8]

Hou, M.W., Wei, R., Lu, L., et al., 2018. Research Review of Knowledge Graph and Its Application in Medical Domain. Journal of Computer Research and Development, 55(12): 2585-2599 (in Chinese with English abstract).

[9]

Huang, Q. L., Huang, Y. X., Shao, Y. X., et al., 2018. Hybrig: A Distributed Storage Architecture for Efficiently Processing Property Graph with Massive Multi- Edges. Chinese Journal of Computers, 41(8): 1766-1779 (in Chinese with English abstract).

[10]

Jia, K.C., Zhuang, J.Q., Zhan, J.W., et al., 2022. Reconstruction of the Dynamic Process of the Holocene Gelongbu Landslide-Blocking-Flood Geological Disaster Chain Based on Numerical Simulation. Earth Science, 1-20 (in Chinese with English abstract).

[11]

Jia, M.S., Zhang, Y., Pan, T.T., et al., 2020. Ontology Modeling of Marine Environmental Disaster Chain for Internet Information Extraction: A Case Study on Typhoon Disaster. Journal of Geo-Information Science, 22(12): 2289-2303 (in Chinese with English abstract).

[12]

Jiao, L., Xing, S., Wang, D.D., et al., 2021. A Biohazard Emergency Response Geo-Ontology Model. Geomatics and Information Science of Wuhan University, 46(4): 586-594 (in Chinese with English abstract).

[13]

Kong, J.X., Zhuang, J.Q., Peng, J.B., et al., 2021. Spatial and Temporal Distribution Characteristics and Risk Simulation of Loess Micro Geomorphic Disaster Chain in Laolang Gully, Lanzhou. Journal of Engineering Geology, 29(5): 1401-1415 (in Chinese with English abstract).

[14]

Li, H.R., Wang, Z.H., Yang, Q.F., et al., 2021. Evolutionary Model and Risk Analysis of Metro Disaster Chain under Complex Network. China Safety Science Journal, 31(11): 141-147 (in Chinese with English abstract).

[15]

Li, J.Z., Hou, L., 2017. Reviews on Knowledge Graph Research. Journal of Shanxi University (Natural Science Edition), 40(3): 454-459 (in Chinese with English abstract).

[16]

Li, L., Liu, Y., Zhu, H.H., et al., 2016. A Bibliometric and Visual Analysis of Global Geo-Ontology Research. Computers & Geosciences, 99:1-8.

[17]

Li, Z. H., Zhang, C. L., Chen, B., et al., 2022. A Technical Framework of Landslide Prevention Based on Multi-Source Remote Sensing and Its Engineering Application. Earth Science, 47(6): 1901-1916 (in Chinese with English abstract).

[18]

Liao, Y.F., Zhao, F., Wang, Z.Q., et al., 2013. Spatial Pattern Analysis of Natural Disasters in China from 2000 to 2011. Journal of Catastrophology, 28(4): 55-60 (in Chinese with English abstract).

[19]

Liu, J., Liu, L., Xue, Y., et al., 2017. Grid Workflow Validation Using Ontology-Based Tacit Knowledge: A Case Study for Quantitative Remote Sensing Applications. Computers & Geosciences, 98: 46-54.

[20]

Liu, J.P., Li, B., Shi, L.H., et al., 2011. An Automated Retrieval Method of Geo-Spatial Event Information Based on Ontology. Acta Geodaetica et Cartographica Sinica, 40(4): 502-508 (in Chinese with English abstract).

[21]

Liu, J. Q., Liu, Q., Liu, Q. H., et al., 2021. Discussion of Geological Hazard Data Management and Application Model in Big Data Era. Bulletin of Geological Science and Technology, 40(6): 276-282, 292 (in Chinese with English abstract).

[22]

Liu, W., He, S., 2018. Dynamic Simulation of a Mountain Disaster Chain: Landslides, Barrier Lakes, and Outburst Floods. Natural Hazards, 90(2): 757-775.

[23]

Liu, X.H., Cui, J., Cai, F., 2018. Geo-Ontology Modeling and Reasoning of Geohazard Emergency Response Knowledge. Geography and Geo-Information Science, 34(4): 1-6 (in Chinese with English abstract).

[24]

Liu, Z., Zhang, P., Liu, N.J., et al., 2018. Characteristics of Natural Disasters in Key Regions of One-Belt-One-Road Initiative. Journal of Catastrophology, 33(4): 65-71 (in Chinese with English abstract).

[25]

Luo, G., Cheng, Q. G., Shen, W. G., et al., 2022. Research Status and Development Trend of the High- Altitude Extremely-Energetic Rockfalls. Earth Science, 47(3): 913-934 (in Chinese with English abstract).

[26]

Ma, L.L., Li, H.W., Lian, S.W., et al., 2016. A Method of Modeling Natural Disaster Event Domain Ontology. Geography and Geo-Information Science, 32(1): 12-17 (in Chinese with English abstract).

[27]

Mario, M., Fabio, M., Mirko, C., et al., 2018. GraphDBLP:A System for Analyzing Networks of Computer Scientists through Graph Databases. Multime-Dia Tools & Applications, 77(14):18657-18688.

[28]

Nickel, M., Murphy, K., Tresp, V., et al., 2015. A Review of Relational Machine Learning for Knowledge Graphs: From Multi-Relational Link Prediction to Automated Knowledge Graph Construction. IEEE, 104(1): 11-33. https://arxiv.org/abs/1503.00759

[29]

Peng, J. B., Sun, X. H., Wang, W., et al., 2016. Characteristics of Land Subsidence, Earth Fissures and Related Disaster Chain Effects with Respect to Urban Hazards in Xi’an, China. Environmental Earth Sciences, 75(16): 1-15.

[30]

Qiu, Q., Xie, Z., Wu, L., et al., 2019. Geoscience Keyphrase Extraction Algorithm Using Enhanced Word Embedding. Expert Systems with Applications, 125: 157-169.

[31]

Rao, Z.Y., Zhang, Y., Liu, J.T., et al., 2021. Recommendation Methods and Systems Using Knowledge Graph. Acta Automatica Sinica, 47(9): 2061-2077 (in Chinese with English abstract).

[32]

Shi, P.J., 2002. Theory on Disaster Science and Disaster Dynamics. Journal of Natural Disasters, 11(3): 1-9 (in Chinese with English abstract).

[33]

Shi, Q. H., Wei, H. L., Tan, F., et al., 2022. Analyzing the Characteristics and Reason for the Ground Collapse Hazard in Shenzhen. Bulletin of Geological Science and Technology, 41(2): 123-129 (in Chinese with English abstract).

[34]

Song, Y.H., Lü, B.B., Lü, W., 2021. Study on Causes Analysis and Disaster Chain Construction of Dammed Lakes in China. Journal of Safety Science and Technology, 17(9): 45-51 (in Chinese with English abstract).

[35]

Tao, K.W., Zhao, Y.Y., Zhu, P., et al., 2020. Knowledge Graph Construction for Integrated Disaster Reduction. Geomatics and Information Science of Wuhan University, 45(8): 1296-1302 (in Chinese with English abstract).

[36]

Tian, D.W., Qiu, A.G., Zhang, Z.R., 2019. Domain Ontology Construction and Application of Multi-Level Geological Disasters. Science of Surveying and Mapping, 44(6): 330-336 (in Chinese with English abstract).

[37]

Wang, F., Jiang, W.Y., Liu, B.B., et al., 2020. Disaster Model Service Chain Orchestration Method Using Disaster Chain Rules. Geomatics and Information Science of Wuhan University, 45(8): 1168-1178 (in Chinese with English abstract).

[38]

Wang, Y.N., Liu, G., 2011. Research and Application of Geological Hazard Domain Ontology. Geography and Geo-Information Science, 27(6): 36-40 (in Chinese with English abstract).

[39]

Wang, Y.S., Cheng, W.Q., Liu, J.W., 2022. Forming Process and Mechanisms of Geo-Hazards in Luding Section of the Sichuan-Tibet Railway. Earth Science, 47(3): 950-958 (in Chinese with English abstract).

[40]

Wang, Z.Y., Yu, Q., Wang, N., et al., 2020. Survey of Intelligent Question Answering Research Based on Knowledge Graph. Computer Engineering and Applications, 56(23): 1-11 (in Chinese with English abstract).

[41]

Xie, Y.H., Wang, L., Dong, C., et al., 2021. Research on the Construction Method of Earthquake Disaster Prevention Knowledge Graph. Science of Surveying and Mapping, 46(10): 219-226 (in Chinese with English abstract).

[42]

Zhang, S., Guo, H., Zhu, K., et al., 2017. Multistage Assignment Optimization for Emergency Rescue Teams in the Disaster Chain. Knowledge-Based Systems, 137: 123-137.

[43]

Zhang, X.Y., Zhang, C.J., Wu, M.G., et al., 2020. Spatiotemporal Features Based Geographical Knowledge Graph Construction. Scientia Sinica (Informationis), 50(7): 1019-1032 (in Chinese).

[44]

Zhang, X.Y., Zhang, C.J., Zhu, S.N., 2012. Annotation for Geographical Spatial Relations in Chinese Text. Acta Geodaetica et Cartographica Sinica, 41(3): 468-474 (in Chinese with English abstract).

[45]

Zhang, Y.S., Cheng, Y.L., Yao, X., et al., 2013. The Evolution Process of Wenchuan Earthquake-Landslide-Debris Flow Geohazard Chain. Geological Bulletin of China, 32(12): 1900-1910 (in Chinese with English abstract).

[46]

Zhou, C.H., Wang, H., Wang, C.S., et al., 2021. Research on Geo-Knowledge Map in the Age of Big Data. Scientia Sinica (Terrae), 51(7): 1070-1079 (in Chinese).

[47]

Zuo,R.G.,2021. Mineral Exploration Using Subtle or Negative Geochemical Anomalies. Journal of Earth Science, 32(2): 439-454. https://doi.org/10.1007/s12583-020-1079-2

[48]

崔斌, 高军, 童咏昕, 等, 2019. 新型数据管理系统研究进展与趋势. 软件学报, 30(1): 164-193.

[49]

杜文杰, 盛谦, 杨兴洪, 等, 2022. 基于两相双质点MPM的滑坡堵江灾害链生全过程分析. 工程科学与技术, 54(3): 36-45.

[50]

杜志强, 顾捷晔, 2016. 灾害链领域本体构建方法: 以暴雨洪涝灾害链为例. 地理信息世界, 23(4): 7-13.

[51]

杜志强, 李钰, 张叶廷, 等, 2020. 自然灾害应急知识图谱构建方法研究. 武汉大学学报(信息科学版), 45(9): 1344-1355.

[52]

官赛萍, 靳小龙, 贾岩涛, 等, 2018. 面向知识图谱的知识推理研究进展. 软件学报, 29(10): 2966-2994.

[53]

韩金良, 吴树仁, 汪华斌, 2007. 地质灾害链. 地学前缘, 14(6): 11-23.

[54]

侯梦薇, 卫荣, 陆亮, 等, 2018. 知识图谱研究综述及其在医疗领域的应用. 计算机研究与发展, 55(12): 2585-2599.

[55]

黄权隆, 黄艳香, 邵蓥侠, 等, 2018. HybriG: 一种高效处理大量重边的属性图存储架构. 计算机学报, 41(8): 1766-1779.

[56]

贾珂程,庄建琦,占洁伟,等,2022.基于数值模拟的戈龙布滑坡‒堵江‒溃决洪水地质灾害链动力学过程重建.地球科学, 1-20.

[57]

贾梦姝, 张宇, 潘婷婷, 等, 2020. 面向互联网信息抽取的海洋环境灾害链本体构建: 以台风灾害为例. 地球信息科学学报, 22(12): 2289-2303.

[58]

焦麟, 邢帅, 王丹菂, 等, 2021. 面向生物危害应急响应的地理本体模型设计与构建. 武汉大学学报(信息科学版), 46(4): 586-594.

[59]

孔嘉旭, 庄建琦, 彭建兵, 等, 2021. 兰州老狼沟黄土微地貌灾害链时空分布特征与危险性模拟研究. 工程地质学报, 29(5): 1401-1415.

[60]

李浩然, 王子恒, 杨起帆, 等, 2021. 复杂网络下地铁灾害链演化模型与风险分析. 中国安全科学学报, 31(11): 141-147.

[61]

李涓子, 侯磊, 2017. 知识图谱研究综述. 山西大学学报(自然科学版), 40(3): 454-459.

[62]

李振洪, 张成龙, 陈博, 等, 2022. 一种基于多源遥感的滑坡防灾技术框架及其工程应用. 地球科学, 47(6): 1901-1916.

[63]

廖永丰, 赵飞, 王志强, 等, 2013.2000-2011年中国自然灾害灾情空间分布格局分析. 灾害学, 28(4): 55-60.

[64]

刘纪平, 栗斌, 石丽红, 等, 2011. 一种本体驱动的地理空间事件相关信息自动检索方法. 测绘学报, 40(4): 502-508.

[65]

刘军旗, 刘强, 刘千慧, 等, 2021. 大数据时代地质灾害数据管理及应用模式探讨. 地质科技通报, 40(6): 276-282, 292.

[66]

刘晓慧, 崔健, 蔡菲, 2018. 突发地质灾害应急响应知识地理本体建模及推理. 地理与地理信息科学, 34(4): 1-6.

[67]

刘哲, 张鹏, 刘南江, 等, 2018. “一带一路” 中国重点区域自然灾害特征分析. 灾害学, 33(4): 65-71.

[68]

罗刚, 程谦恭, 沈位刚, 等, 2022. 高位高能岩崩研究现状与发展趋势. 地球科学, 47(3): 913-934.

[69]

马雷雷, 李宏伟, 连世伟, 等, 2016. 一种自然灾害事件领域本体建模方法. 地理与地理信息科学, 32(1): 12-17.

[70]

饶子昀, 张毅, 刘俊涛, 等, 2021. 应用知识图谱的推荐方法与系统. 自动化学报, 47(9): 2061-2077.

[71]

史培军, 2002. 三论灾害研究的理论与实践. 自然灾害学报, 11(3): 1-9.

[72]

施秋华, 魏会龙, 谭飞, 等, 2022. 深圳城市地面塌陷灾害特征及其成因分析. 地质科技通报, 41(2): 123-129.

[73]

宋英华, 吕贝贝, 吕伟, 2021. 我国堰塞湖致因分析及灾害链构建研究. 中国安全生产科学技术, 17(9): 45-51.

[74]

陶坤旺, 赵阳阳, 朱鹏, 等, 2020. 面向一体化综合减灾的知识图谱构建方法. 武汉大学学报(信息科学版), 45(8): 1296-1302.

[75]

田董炜, 仇阿根, 张志然, 2019. 多层次地质灾害领域本体构建与应用. 测绘科学, 44(6): 330-336.

[76]

王飞, 姜文宇, 刘彬彬, 等, 2020. 利用灾害链规则的灾害模型服务链编制方法. 武汉大学学报(信息科学版), 45(8): 1168-1178.

[77]

王艳妮, 刘刚, 2011. 地质灾害领域本体的研究与应用. 地理与地理信息科学, 27(6): 36-40.

[78]

王运生, 程万强, 刘江伟, 2022. 川藏铁路廊道泸定段地质灾害孕育过程及成灾机制. 地球科学, 47(3): 950-958.

[79]

王智悦, 于清, 王楠, 等, 2020. 基于知识图谱的智能问答研究综述. 计算机工程与应用, 56(23): 1-11.

[80]

谢炎宏, 王亮, 董春, 等, 2021. 面向地震灾害防治的知识图谱构建方法研究. 测绘科学, 46(10): 219-226.

[81]

张雪英, 张春菊, 吴明光, 等, 2020. 顾及时空特征的地理知识图谱构建方法. 中国科学(信息科学), 50(7): 1019-1032.

[82]

张雪英, 张春菊, 朱少楠, 2012. 中文文本的地理空间关系标注. 测绘学报, 41(3): 468-474.

[83]

张永双, 成余粮, 姚鑫, 等, 2013. 四川汶川地震‒滑坡‒泥石流灾害链形成演化过程. 地质通报, 32(12): 1900-1910.

[84]

周成虎, 王华, 王成善, 等, 2021. 大数据时代的地学知识图谱研究. 中国科学(地球科学), 51(7): 1070-1079.

基金资助

国家自然科学基金原创性探索项目(42050101)

国家自然科学基金项目(41871311)

中国博士后科学基金项目(2021M702991)

湖北省自然科学基金项目(2022CFB640)

AI Summary AI Mindmap
PDF (2987KB)

766

访问

0

被引

详细

导航
相关文章

AI思维导图

/