PDF
摘要
为更好地利用海量开源生态数据为社区开发和协作提供洞察,开发了OSS Insight.其系统架构和查询引擎的创新在于,利用HTAP(Hybrid Transactional Analytical Processing)数据库高效存储和查询GitHub数十亿事件数据,通过前端可视化实时生成洞察;其时空数据的深度挖掘在于,基于事件时间序列和开发者地理信息,对开发者行为模式和开源生态演变进行建模分析;其与LLM(Large Language Model)集成应用Data Explorer,利用LLM将自然语言查询自动转换为SQL(Structured Query Language),实现了对开源数据的智能问答和趋势洞察. Kubernetes案例的实证研究从开发者洞察、项目演进和组织协作这3方面进行了开源洞察分析.实验表明, OSS Insight能够对超大规模开源数据进行高效、全面的分析,其LLM驱动的交互式探索降低了数据分析门槛,可辅助用户进行数据洞察,可为开源社区治理提供实用的分析工具.
关键词
Key words
OSS Insight:开源生态时空数据分析和智能洞察平台[J].
华东师范大学学报(自然科学版), 2025, 0(5): 170-182 DOI: