基于ETL技术的多源异构数据融合方法研究

杨国立, 姜树明

齐鲁工业大学学报 ›› 2024, Vol. 38 ›› Issue (04) : 18 -24.

PDF
齐鲁工业大学学报 ›› 2024, Vol. 38 ›› Issue (04) : 18 -24. DOI: 10.16442/j.cnki.qlgydxxb.2024.04.003

基于ETL技术的多源异构数据融合方法研究

    杨国立, 姜树明
作者信息 +

Author information +
文章历史 +
PDF

摘要

在多源大数据融合阶段处理历年异构的数据时,涉及到多指标和多维度的问题,需要清洗、转换、映射和对齐等操作。相关数据处理工具和方法逐步涌现,但仍难以解决大量数据的交叉融合问题。为此,研究了基于ETL技术的多源异构数据融合方法,分析了常用的ETL工具和数据融合技术,包括数据抽取、转换、加载工具以及数据处理算法。分析了面向灵活需求、业务交叉较多和实时数据流场景时,遇到的数据源异构、数据结构差异、数据更新频率困难等问题,并从模块化设计、逻辑和参数分离、标准化构件库、轻量级JSON格式的配置文件等方面研究了ETL工具模块化扩展和构件重复使用的方法,以便更好地处理大规模异构数据。解决了多源大数据融合阶段的交叉融合问题,对提高数据处理效率、确保数据质量以及支持更深入的数据分析和决策具有重要意义。

关键词

教育统计 / 数据挖掘 / 转换-抽取-加载 / 软件工程

Key words

引用本文

引用格式 ▾
基于ETL技术的多源异构数据融合方法研究[J]. 齐鲁工业大学学报, 2024, 38(04): 18-24 DOI:10.16442/j.cnki.qlgydxxb.2024.04.003

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

291

访问

0

被引

详细

导航
相关文章

AI思维导图

/