一种利用词典扩展数据库模式信息的Text2SQL方法

于晓昕, 何东, 叶子铭, 陈黎, 于中华

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (01) : 84 -94.

PDF
四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (01) : 84 -94. DOI: 10.19907/j.0490-6756.2024.012004

一种利用词典扩展数据库模式信息的Text2SQL方法

作者信息 +

Author information +
文章历史 +
PDF

摘要

现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法.

关键词

数据库模式 / 语义扩展 / 解释信息 / Text2SQL

Key words

引用本文

引用格式 ▾
于晓昕, 何东, 叶子铭, 陈黎, 于中华. 一种利用词典扩展数据库模式信息的Text2SQL方法[J]. 四川大学学报(自然科学版), 2024, 61(01): 84-94 DOI:10.19907/j.0490-6756.2024.012004

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

1

访问

0

被引

详细

导航
相关文章

AI思维导图

/