FeaDB:基于内存的多版本在线特征存储

高歌, 胡卉芪

华东师范大学学报(自然科学版) ›› 2023, Vol. 0 ›› Issue (5) : 65 -76.

PDF
华东师范大学学报(自然科学版) ›› 2023, Vol. 0 ›› Issue (5) : 65 -76.

FeaDB:基于内存的多版本在线特征存储

    高歌, 胡卉芪
作者信息 +

Author information +
文章历史 +
PDF

摘要

特征管理是搭建人工智能数据管道中的重要一环.特征存储要求在模型训练和推理阶段提供有效版本的特征推送服务.为响应这一需求,特征存储需要为特征实时更新和版本管理提供保证,以协同上游的特征摄取,为模型服务系统提供数据动力.在人工智能辅助决策的在线预测任务中,为了提供更好的用户体验,模型服务系统需要实时响应决策请求,实时特征检索面临更低延迟的挑战.聚焦这一挑战,开发基于内存的多版本在线特征存储FeaDB.使用时间序列建模特征,并提供特征版本管理语义,满足特征从生产到消费的版本管理需求;采用追加写方式保证实时特征加载性能,设计基于版本的索引减少读延迟;为进一步减小特征消费延迟,提出版本快照机制,实验证明采用快照读机制增加了特征集版本的检索效率.

关键词

人工智能数据管理系统 / 多版本存储 / 在线特征存储

Key words

引用本文

引用格式 ▾
FeaDB:基于内存的多版本在线特征存储[J]. 华东师范大学学报(自然科学版), 2023, 0(5): 65-76 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/