基于知识图谱多跳推理的中文矿物知识问答方法与系统

季晓慧 ,  董雨航 ,  杨中基 ,  杨眉 ,  何明跃 ,  王玉柱

地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 37 -46.

PDF (2371KB)
地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 37 -46. DOI: 10.13745/j.esf.sf.2024.5.11
知识图谱与智能推理

基于知识图谱多跳推理的中文矿物知识问答方法与系统

作者信息 +

Mineral question-answering system in Chinese based on multi-hop reasoning in knowledge graphs

Author information +
文章历史 +
PDF (2427K)

摘要

已有相关矿物数据库用于存储和查询相关矿物知识,常用的搜索引擎也可以对矿物知识进行查询,但无法回答用自然语言进行提问的矿物问题,查询返回的答案需要进一步筛选。亦有基于知识图谱进行矿物知识问答的相关研究,但只能回答涉及知识图谱中一个三元组的简单问题,无法回答涉及多个三元组的多跳复杂问题。为此,本文提出基于知识图谱多跳推理的矿物复杂知识问答方法,采用ComplEx模型将矿物实体、关系和问句表示为复数向量,以更好地获取相互之间的语义及推理关系。输入矿物问句后,通过Bert-LSTM-CRF获取其中心词,采用基于编辑距离及分词的方法获得中心词的候选实体集合,然后采用全连接网络确定最相关的实体作为推理起点,与矿物问句拼接后通过全连接网络获得当前跳的最相关关系。根据当前跳的起始实体及最相关关系,在矿物知识图谱中获得另一实体作为下一跳的推理起点,并将下一跳的问句更新为原问句,与当前跳最相关关系拼接,以将当前跳的推理信息带入到下一跳推理中,直到获得的最相关推理关系为预定义的结束标识符,推理结束,返回最后一跳的实体为答案,并给出推理路径。采用Python语言,在Tensorflow框架下实现了本文提出的矿物复杂知识问答并与相关模型进行对比,证明了本文方法的有效性。采用前后端分离架构,使用RESTful API、React、Ajax、echarts和Flask等框架和技术,开发了基于知识图谱多跳推理的矿物复杂知识问答系统,为矿物知识获取及相关地质研究提供了平台和工具。

关键词

矿物 / 问答系统 / 知识图谱 / 多跳推理

Key words

mineral / question answering / knowledge graph / multi-hop reasoning

引用本文

引用格式 ▾
季晓慧,董雨航,杨中基,杨眉,何明跃,王玉柱. 基于知识图谱多跳推理的中文矿物知识问答方法与系统[J]. 地学前缘, 2024, 31(4): 37-46 DOI:10.13745/j.esf.sf.2024.5.11

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

如何更好地组织并充分应用矿物知识是极其有价值的工作[1-2]。知识图谱是由节点和边构成的有向图,节点之间的联系映射着具体实体之间的联系,包含着语义关系,具有强大的语义处理与开放组织能力[3-7]。根据包含信息的种类,可分为通用领域知识图谱和垂直领域知识图谱。通用领域知识图谱包含更全面的信息,涉及简单概念;而垂直领域知识图谱针对某一特定领域,尽可能包含领域内的全部知识。目前已构建了相关矿物的垂直领域知识图谱,如周永章等[5]构建了钦杭成矿带斑岩铜矿知识图谱;冉一早等[8]构建了铌钽矿床知识图谱;张春菊等[9]构建了金矿知识图谱;张悦[10]、Liu等[2]构建了矿物领域知识图谱;燕群[11]构建了矿床知识图谱;陈忠良等[12]构建了中文岩石知识图谱。在基于矿物知识图谱的应用上,周永章等[5]进行了矿产资源预测评价;冉一早等[8]对中国铌钽矿床空间-时间-构造背景-成因类型多维分布特征以及矿石矿物共生组合特征与铌钽矿床多维分布之间的关联进行了分析;Liu等[2]对矿物知识进行了简单问答;燕群[11]进行了找矿预测。上述工作已将矿物相关知识进行了很好的组织并进行了初步应用,但在矿物知识问答上,目前仅见Liu等[2]进行了只涉及单跳推理的简单矿物问答,无法进行涉及知识图谱多跳推理的复杂矿物问答。

目前基于知识图谱的多跳问答,方法较为多样,Yih等[13]提出一种由图结构表示的逻辑-形式查询图,先确定问题主干的推理路径,再不断添加约束条件到路径链上。这种提前解析确定推理路径的方法需要检索整个推理空间来确定,并且根据问题进行单次路径匹配会对准确率造成影响。Zheng等[14]提出了分解-执行-连接的策略,将复杂问题分解成多个简单问题,最终结果通过逻辑形式的合取或组合得到。这种方法采用了大量语义逻辑的模板来匹配子问题。但是对于垂直领域的问题,过多模板难以设计。

本文研发一种基于迭代增量序列的矿物知识图谱问答方法与系统,只需少数问句模板,并在推理过程中动态确定推理路径,不断缩小搜索空间,以便更准确、高效地回答相关矿物问题,推进矿物和相关地学研究的进一步发展。

1 基于知识图谱多跳推理的中文矿物知识问答

知识图谱用大量<实体,关系,实体>三元组组成的图表示和存储知识[3-7]。知识图谱推理,根据问题的复杂度可以划分为单跳推理和多跳推理。单跳推理根据一条三元组就可以确定最后问题的答案。而多跳推理需要多个连接的三元组共同作用[15-17]。以一个矿物问答问题“硅钨锰矿属于什么晶系”为例,现有的单个三元组中,保存了“矿石-晶类”“晶类-晶系”的对应关系,没有直接存储矿物与所属晶系的联系,因此该问题是多跳推理,可以将该问题拆解为两个单跳推理问题“硅钨锰矿属于哪个晶类”和“该晶类属于哪个晶系”,逐步推理解答,得到正确结果。

本文基于知识图谱多跳推理的中文矿物知识问答方法如图1所示。

图1中知识图谱用于存储问答需要的矿物知识。在文献[10]构建的16 338个实体、43 521条关系的矿物知识图谱基础上,通过网络爬虫爬取IMA矿产属性数据库[18]、矿物数据库Mineralogy Database[19]、矿物数据库Mindat[20]、美国矿物学家晶体结构数据库[21]和国家岩矿化石标本资源共享平台[22],数据清洗后对已有的矿物知识图谱进行了补充,获得包括50 286个实体、180 987条关系的矿物知识图谱,存储于图数据库Neo4j中用于问答。

用户的矿物领域问题输入后,本文方法首先定位到问题的中心词,然后使用实体链接模型找到中心词对应的知识图谱中的实体。获得中心实体后,采用多跳推理模型来完成推理决策和答案生成,最后将答案和推理路径可视化展示给用户。

同其他使用知识图谱的方法一样,本文方法需要用于学习的数据集。

1.1 基于知识图谱多跳推理的矿物知识问答数据集

本文采用文献[2,23]所述的基于模板的方法生成问句,根据构建的矿物知识图谱定义“英文名”“物理特性”“化学特性”“矿物分类”“晶系”“晶类”“产地”“形成年代”“主要用途”“储量”“共/伴生”“技术手段”等12类问句模板,并引入“是什么”“在哪里”“何时”“有多少”“如何”等疑问词,从已构建的矿物知识图谱中随机抽取实体、关系/属性,与已引入的相关疑问词进行组合并根据已构建的问句模板构造只涉及矿物知识图谱中一个三元组的单跳简单问句,并标出其答案。为了回答复杂问题,通过扩充已构造的单跳问句构建多跳问句,具体为:首先对单跳问句中包含的中心实体e0进行检索,找到第一跳的关系r1,再将检索到的相关三元组<e0,r1,e1>中的e0以相应的“什么”“哪里”等疑问词替换后修改单跳问题,得到两跳问题,进一步可以继续检索三元组<e0,r1,e1>中的另一实体e1,找到第二条关系r2后将检索到的相关三元组<e1,r2,e2>中的e1以相应的“什么”“哪里”等疑问词替换后修改两跳问题,得到三跳问题,以此类推。同目前多数研究一样,本文构建的最大跳数为3。为了使问答系统能处理更多样的问句,通过同义转换、句式重构和汉英互译转换等方式对生成的问句进行处理,以增加问句数量,提高模型泛化能力[2,23]。每条问句与为回答此问句所需的三元组序列{e0,r1,e1,r2,e2,...,ei, r i + 1, e i + 1,...,en,[STOP]}构成一条数据,[STOP]为用于标识路径结束的标识符。

1.2 基于ComplEx的矿物文本表示

矿物知识图谱中的实体和关系以及用户提问输入的问句跟其他自然语言处理任务一样需要转换为数学向量后才能进行相应问答。本文采用基于语义匹配模型中的ComplEx[24-25],以便更准确地挖掘矿物实体和关系中的潜在语义联系,并更好地为后续的问答推理提供语义支持。

1.2.1 矿物实体及关系表示

将矿物知识图谱中的实体集合表示为E={e1,e2,...,en},关系集合表示为R={r1,r2,...,rm,[STOP]}(为后续判定多跳推理是否结束,将[STOP]视为特殊关系并转换为相应向量)。用ComplEx模型将矿物实体和关系都映射为d(d<n,d<m+1)维的低维复数向量,前d/2维表示复数的实部,后d/2维表示复数的虚部。使得按公式(1)[24-25]计算三元组<ei,rk,ej>得分Sikj时,如果三元组<ei,rk,ej>存在于矿物知识图谱中,其得分Sikj为1,如果三元组<ei,rk,ej>不存在于矿物知识图谱中,其得分Sikj为0,公式(1)中Re表示取复数的实部, e ¯ jej的共轭复数。

训练时采用如公式(2)[24-25]所示的损失函数。公式(2)中Sikj为存在于矿物知识图谱中的三元组(也叫正例三元组)的得分,Si'kj'为不存在于矿物知识图谱中的三元组(也叫负例三元组)的得分,负例三元组通过将每个正例三元组<ei,rk,ej>的头实体和尾实体随机替换为其他矿物实体得到,正例三元组集合表示为T={<ei,rk,ej>}时,负例三元组集合可表示为T'={<ei',rk,ej>|ei'∈E,<ei',rk,ej>∉T}∩{<ei,rk,ej'>|ej'∈E,<ei,rk,ej'>∉T}。正例三元组的标签为1,负例三元组的标签为0,共同组成矿物实体及关系表示模型ComplEx的训练数据。

Sikj=Re( e i Trk e ¯ j)
L = < e i , r k , e j > T < e i ' , r k , e j ' > T ' m a x ( 0,1 - S i k j + S i ' k j ' )

1.2.2 矿物问句表示

将矿物实体和关系映射为d维低维复数向量后,将问句也映射为d维低维复数向量,以令问句与实体及关系产生关联,方便后续推理。矿物问句表示模型如图2所示,为获得矿物问句的语义信息,首先在问句的开始位置增加[CLS]标识符后输入Bert[26]模型,之后将[CLS]标识符对应的包含矿物问句完整信息的输出输入到堆叠全连接层,使用公式(3)所示的二值交叉熵损失函数微训练后得到对应的矿物问句向量。公式(3)中Ø为公式(4)或(5)所示的约束函数,为了提高三元组语义信息的结合量,使用问句q的句向量wq代替公式(1)所示的评分函数中的关系r的位置,ζ为属于问句q的推理路径上的所有实体集合,eh为推理路径上的头实体,et为推理路径上的尾实体, e t *为非问句q推理路径上的实体,训练过程中要求公式(4)和(5)所示的约束函数成立,即在问句q的推理路径上的头尾实体与问句向量wq的评分大于0,而未在问句q的推理路径上的头尾实体与问句向量wq的评分要小于0,Re代表取复数的实部。

构造问句表示模型的训练数据时,先根据1.1节中构造的数据集中的问句q和解答问句的推理路径{e0,r1,e1,r2,e2,...,ei,ri+1,ei+1,...,en,[STOP]}从中提取出e0作为约束函数(4)和(5)中的eh,将e1,...,en分别作为正例et,然后从知识图谱中随机获得实体作为负例 e t *。公式(3)中yi为<eh,wq,et>的目标值,hζ并且tζ时的目标值为1,即正例三元组的目标值为1;hζ或者tζ的目标值为0,即负例三元组的目标值为0,σ为sigmoid函数。

L = - 1 N i = 1 N y i · l o g ( σ ( Ø ) ) + ( 1 - y i ) · l o g ( 1 - σ ( Ø ) )
Ø ( w q , e h , e t ) = R e ( l = 1 d w q l e h l e t l ¯ ) > 0 ; h ζ a n d t ζ
Ø ( w q , e h , e t * ) = R e ( l = 1 d w q l e h l e t * l ¯ ) < 0 ; t * ζ

1.3 矿物问答多跳推理

图1所示,矿物领域问句输入后首先定位问句的中心词,然后使用实体链接模型找到中心词对应的知识图谱实体,获得中心实体后,采用多跳推理模型完成推理决策和答案生成。

1.3.1 矿物问句中心词识别

矿物问句中心词识别从输入的问句中解析出中心词,以中心词为出发点对知识图谱进行搜索获得答案。本文通过对数据集中的问句进行BIO标注,使用如图3所示的Bert-BiLSTM-CRF模型进行矿物问句中心词识别。BIO标注方法中B表示实体开头,I表示实体中间,O代表无关词,通过BIO标注将自然语言问句映射为由B、I和O字母组成的且和原问句长度相同的标注序列,以B开头I结束的词即为中心词。Bert-BiLSTM-CRF模型中的Bert层用于获得矿物问句的语义信息,BiLSTM层用于捕捉问句前后部分的双向依赖关系,CRF层用于学习输出的依赖关系,采用负对数似然损失函数对Bert-BiLSTM-CRF进行训练。

1.3.2 矿物问句实体链接

矿物问句q中识别出的中心词可能对应矿物知识图谱中的多个实体,需要在矿物知识图谱中筛选出所有可能与中心词相关的候选实体,并进行实体匹配,以得到与中心词最相关的矿物实体作为关系推理的出发点。

采用基于编辑距离和切词的方法进行候选实体筛选。基于编辑距离算法的候选实体筛选通过计算知识图谱中实体与中心词的编辑距离,来判定实体是否属于候选实体,即通过统计对某知识图谱实体进行删除、插入、替换任何一个字的操作次数,来判定该知识图谱实体与中心词之间的相似度;基于切词的候选实体筛选是通过先对中心词进行切词,然后将每个切出来的词都在知识图谱中寻找到相关实体的方式来获取候选实体。

本文使用jieba作为分词处理工具,并从矿物知识图谱中导出矿物名形成矿物领域专业字典,以避免对专有矿物名称错误切分。将基于编辑距离和基于切词的方法筛选出的候选实体归纳到一起,作为整体的候选实体,依次与自然语言问句q,共同输入实体匹配模型来得到与问句q的中心词最相关的实体。

采用如图4所示的基于知识图谱文本表示的实体匹配模型,将候选实体e输入如1.2.1节所述的矿物实体表示模型,获得候选实体的词向量v,将自然语言问句q输入到如1.2.2节所述的问句,表示模型获得问句向量u,然后将uv两个向量拼接输入到全连接层中,使用Softmax激活函数输出候选实体e与中心词相关的概率。概率最大的实体即为矿物问句中心词对应的实体,作为推理起点开始推理。

1.3.3 矿物问句多跳推理

通过图4所示模型获得与自然语言问句q的中心词最相关的实体e0后,将e0作为后续矿物知识图谱问答推理的出发点。首先从知识图谱中获得e0所有的一度链出关系集合Rζ,从Rζ中找到最能反映问句q与实体e0相关的关系r1,然后根据实体e0和关系r1从知识图谱中定位到实体e1,然后从实体e1开始重复上述流程,直到停止推理。

本文采用如图5所示的矿物问答多跳推理模型,左边表示从问句输入到停止推理的运行流程,右边是第i跳推理时的具体模型,其输出为候选关系ri能够正确对推理决策进行语义匹配的概率。第i跳推理时将当前实体ei-1ei-1的一个一度关系ri(ri包括[STOP])通过1.2.1所述的模型转换为复数空间C上的词向量,同时将问句q通过1.2.2节所述的模型也转换为复数空间C上的句向量wq,由于第i跳的推理会受第i-1跳的影响,问句向量wq与前一跳推理中的关系向量ri-1拼接后输入全连接层得到包含r1,r2,...,ri-1前置推理关系的新问句向量wq',在第i+1跳推理时新问句向量wq'再与关系向量ri拼接后输入全连接层得到包含r1,r2,...,ri-1,ri前置推理关系的新问句向量,以此类推,如果能够正确对推理决策进行语义匹配的概率最大,则推理停止。矿物问答多跳推理模型的训练采用交叉熵损失函数。

2 实现方法与实现结果

2.1 实现方法

本文使用Python 3.6和深度学习框架Tensorflow 2.4.0实现了前述的矿物知识问答系统。知识图谱采用图数据库Neo4j进行存储及操作,模型训练使用的GPU为Tesla P100-PCIE。

采用如1.1节所述的方法,生成17 698条矿物问答数据集,其中7 000条为多跳问答数据。多跳问答数据中80%为2跳问答、20%为3跳问答。按7∶3的比例划分为训练集和测试集。

本文的主要模型都可以归类为分类模型:矿物问句中心词识别模型的输出为B、I和O 3种分类,为多分类模型;实体链接和推理决策模型的输出为待选实体或者关系是否为相关的实体或者关系,为二分类模型。因此本文选择常用于分类模型的评价指标:准确率、召回率和F1评分。

首先根据数据集中的每个输入样本输入到模型中得到的预测值,与输入样本相对应的输出样本的实际值计算出混淆矩阵。在二分类任务中,实际值与预测值只会有真假两个输出,因此在混淆矩阵中得到了正样本成功预测为正(Ture Positive,TP)、负样本错误预测为正(False Positive,FP)、负样本正确预测为负(True Negative,TN)和正样本错误预测为负(False Negative,FN)4种情况。

准确率代表所有预测为真的样本中实际值也为真的概率,计算公式为

Precision= T P T P + F P

召回率代表所有实际为真的样本中,被成功预测为真的概率,计算公式为

Recall= T P T P + F N

F1评分是对准确率和召回率的综合,由召回率和准确率的调和平均计算得到

F1= 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l

以上是二分类的准确率、召回率和F1评分的计算过程,多分类可以用这种原理进行拓展。

对于由关键任务组成的完整的问答模型,本文采用F1的平均值作为评价指标。F1的平均值同样由准确率P和召回率R共同决定。其中,Ai代表数据集中问题qi对应的真实答案的集合,Oi代表由问答方法从知识图谱中得到的答案集合。

Pi= | A i O i | O i
Ri= | A i O i | A i
F 1 = 1 N i = 1 N 2 × P i × R i P i + R i

2.2 实现结果

2.2.1 矿物问句中心词识别

将本文采用的Bert-BiLSTM-CRF模型与仅使用Bert和Bert-BiLSTM的模型,使用如表1所示的参数进行对比,结果如表2所示。可见,本文采用的Bert-BiLSTM-CRF模型,相对于基础Bert模型, 精确率提升了7.35%,召回率提升了3.59%,F1提升了4.46%。相对于Bert-BiLSTM模型,精确率提升了2.03%,召回率提升了2.57%,F1提升了2.88%。这是因为BiLSTM层的加入使得模型能够对输入问句的每一个位置,都综合考虑其前后文对当前位置的影响,能够将整体的句义嵌入到问句的每一个位置中,使得模型的每一个位置对应的输出向量能更加充分地知晓其在整个句子中的含义,因此,对于矿物问句中常见的一些长名词,能够提升其识别准确率;而CRF层的加入能够更加充分地学习到各个标签之间的关系,对标签的输出,增加了前后标签关系的约束,综合考虑不同的标签在句子中的合理位置关系,有效地限制了标签的输出。

以上3种模型训练过程的F1曲线如图6所示。可以看出,相较于其他两种方法,本文提出的方法无论是最终效果还是收敛速度都具有优势。

2.2.2 矿物问句实体链接

将本文采用的基于知识图谱文本表示的模型与使用Bert的模型采用如表3所示的参数进行实体链接对比,结果如表4所示。

表4可知,本文模型在实体链接上有更高的精确度和F1评分,说明本文使用的基于知识图谱文本表示的模型,在实体链接上好于直接使用Bert的模型。

图7是两种模型在训练过程中的F1曲线。可以看出,无论是收敛速度还是实际效果都是本文的方法更具优势。

2.2.3 矿物问答多跳推理

同实体链接一样,将本文采用的基于知识图谱文本表示的模型与使用Bert的模型采用如表3所示的参数,进行矿物问句多跳推理对比,结果如表5所示。

表5可知,本文使用基于知识图谱文本表示的矿物问答模型好于基于Bert的问答模型,将问句向量和词向量都映射到同一复数空间,并在问句向量生成中增加蕴涵矿物知识图谱相关推理关系的约束,使得在推理过程中能充分利用隐含的矿物推理关系,并在推理过程中不断更新推理路径,这使得本文方法具有更好的矿物自然语言问答效果。

两个模型训练过程的F1指标如图8所示,虽然在训练过程中基于Bert的模型收敛较快,但是最后的效果是本文的方法更具优势。

2.2.4 基于知识图谱多跳推理的矿物问答系统实现

本文采用前后端分离架构,通过RESTful API进行数据交互。前端采用React技术,输入框输入矿物问句后通过Ajax技术将用户问句传递给后端进行解答,返回答案后通过echarts将答案可视化到界面中。后端使用Python语言的web框架Flask来实现,接收前端提问,并返回答案。

图9图10是分别在本方法和ChatGPT上的测试效果。ChatGPT是当前效果最好的通用问答模型,但对于矿物的多跳问题,它无法导向正确的推理路径,甚至单跳问答的准确性都很差。

3 结论

矿物知识作为地质研究的重要材料,对其快速准确的检索、挖掘是地学研究的必要一环。基于自然语言的知识图谱问答是学习成本最低的检索方式,但是这种问答方式面临着复杂问题语义理解困难、答案推理不准确等问题。本文采用基于知识图谱文本表示的模型,进行中心词识别、实体链接、多跳推理,构建了一个完整、精确的可以回答复杂问题的基于矿物知识图谱的问答系统。

本文取得的主要成果如下。

(1)在中心词识别任务上,采用Bert-BiLSTM-CRF模型与Bert-BiLSTM和Bert模型相比,F1最多提升4.46%,且训练速度最快。

(2)在实体链接任务上,采用基于知识图谱文本表示的模型与Bert相比,F1提升3.13%,且训练速度更快。

(3)在多跳推理任务上,采用基于知识图谱文本表示的模型与Bert相比,F1提升4.55%。

随着ChatGPT的火热,LLM(Large Language Model,大规模语言模型)技术正在迅速迭代发展,这种预训练的大型模型有着更好的自然语言理解能力,更适用于实体抽取、语义分解等领域。但是LLM的问题在于其部署运行成本较大,且在回答问题时会出现不准确的情况。因此将我们的方法与LLM进行结合,有望在减少运行成本的同时提高问题回答的准确率。

参考文献

[1]

YU Y Q, WANG Y Z, MU J Q, et al. Chinese mineral named entity recognition based on BERT model[J]. Expert Systems with Applications, 2022, 206: 117727.

[2]

LIU C J, JI X H, DONG Y H, et al. Chinese mineral question and answering system based on knowledge graph[J]. Expert Systems with Applications, 2023, 231: 120841.

[3]

周永章, 张良均, 张奥多, 地球科学大数据挖掘与机器学习[M]. 广州: 中山大学出版社, 2018.

[4]

周永章, 陈川, 张旗, 地质大数据分析的若干工具与应用[J]. 大地构造与成矿学, 2020, 44(2): 173-182.

[5]

周永章, 张前龙, 黄永健, 钦杭成矿带斑岩铜矿知识图谱构建及应用展望[J]. 地学前缘, 2021, 28(3): 67-75.

[6]

周永章, 左仁广, 刘刚, 数学地球科学跨越发展的十年: 大数据、 人工智能算法正在改变地质学[J]. 矿物岩石地球化学通报, 2021, 40(3): 556-573, 777.

[7]

周成虎, 王华, 王成善, 大数据时代的地学知识图谱研究[J]. 中国科学: 地球科学, 2021, 51(7): 1070-1079.

[8]

冉一早, 董少春, 王汝成, 铌钽矿床知识图谱的构建及应用实践[J]. 高校地质学报, 2023, 29(3): 359-371.

[9]

张春菊, 刘文聪, 张雪英, 基于本体的金矿知识图谱构建方法[J]. 地球信息科学学报, 2023, 25(7): 1269-1281.

[10]

张悦. 矿物领域知识图谱构建技术研究与实现[D]. 北京: 中国地质大学(北京), 2021.

[11]

燕群. 矿床知识图谱构建方法及找矿预测应用: 以甘肃寨上-马坞金矿集区为例[D]. 长春: 吉林大学, 2022.

[12]

陈忠良, 袁峰, 李晓晖, 基于BERT-BiLSTM-CRF模型的中文岩石描述文本命名实体与关系联合提取[J]. 地质论评, 2022, 68(2): 742-750.

[13]

YIH W T, CHANG M W, HE X D, et al. Semantic parsing via staged query graph generation: question answering with knowledge base[C]//Proceedings of the 53rd annual meeting of the association for computational linguistics and the 7th international joint conference on natural language processing (volume 1:long papers). Stroudsburg, USA: Association for Computational Linguistics, 2015: 1321-1331.

[14]

ZHENG W G, YU J X, ZOU L, et al. Question answering over knowledge graphs[J]. Proceedings of the VLDB Endowment, 2018, 11(11): 1373-1386.

[15]

SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-hop question answering over knowledge graphs using knowledge base embeddings[C]// Proceedings of the 58th annual meeting of the association for computational linguistics. Stroudsburg, USA: Association for Computational Linguistics, 2020: 4498-4507.

[16]

张天杭, 李婷婷, 张永刚. 基于知识图谱嵌入的多跳中文知识问答方法[J]. 吉林大学学报(理学版), 2022, 60(1): 119-126.

[17]

叶蕾, 张宇迪, 杨旭华. 利用知识图谱的多跳可解释问答[J/OL]. 小型微型计算机系统, 2023: 1-11[2024-04-24]. https://kns.cnki.net/kcms/detail/21.1106.TP.20230519.0923.002.html.

[18]

DOWNS B. IMA Mineral List[EB/OL]. (2018-03-04)[2024-04-24]. https://rruff.info/ima/.

[19]

BARTHELMY D. Mineralogy database[DB/OL]. (2009-03-05)[2024-04-24]. http://webmineral.com/.

[20]

Hudson Institute of Mineralogy. Mindat[EB/OL]. (2020-05-15)[2024-04-24]. https://www.mindat.org/.

[21]

Mineralogical Society of America. American mineralogist crystal structure database[DB/OL]. (2019-04-01)[2024-04-24]. http://rruff.geo.arizona.edu/AMS/amcsd.php.

[22]

中国地质大学北京. 国家岩矿化石标本资源共享平台[EB/OL]. (2003-01-01)[2024-04-24]. http://www.nimrf.net.cn/.

[23]

ABUJABAL A, YAHYA M, RIEDEWALD M, et al. Automated template generation for question answering over knowledge graphs[C]// Proceedings of the 26th international conference on World Wide Web. Perth, Australia: ACM, 2017: 1191-1200.

[24]

TROUILLON T, WELBL J, RIEDEL S, et al. Complex embeddings for simple link prediction[C]// Proceedings of the 33rd international conference on machine learning, New York: ACM, 2016: 2071-2080.

[25]

WANG Q, MAO Z D, WANG B, et al. Knowledge graph embedding: a survey of approaches and applications[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(12): 2724-2743.

[26]

DEVLIN J, CHANG M, LEE K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[C]//Proceedings of the 2019 conference of the North American chapter of the association for computational linguistics:human language technologies. Minneapolis, Minnesota: Association for Computational Linguistics, 2019: 4171-4186.

基金资助

国家科技资源共享服务平台——国家岩矿化石标本资源库子项目(NCSTI-RMF20230107)

AI Summary AI Mindmap
PDF (2371KB)

264

访问

0

被引

详细

导航
相关文章

AI思维导图

/