PDF
摘要
以识别GitHub长期活跃高星仓库帮助开源社区构建和数字基础设施建设为背景,提出了一种基于时间序列预测模型的GitHub高星仓库长期活跃度评估方法,旨在解决识别仓库是否能够保持长期活跃的问题.该方法首次引入开发者活跃周期作为关键特征,用以提升仓库发展趋势预测的准确性.通过对活动指标的时间序列数据进行建模与挖掘,该方法提出了全新的活跃度计算公式DTA(Development Trendbased Activity),实现了对仓库活跃水平的准确量化评估.设计并制作了一个时间粒度细、覆盖范围广的基准数据集,并系统评估了多种预测模型的表现,最终确定了适用于开源仓库活跃度预测的最优模型.实验结果验证了所提方法的有效性,能够准确预测仓库的长期活跃情况.因此,引入DTA对仓库活跃度进行评估,能够帮助开源参与者识别长期活跃的仓库,确定参与重心,促进开源社区的构建和数字基础设施建设.
关键词
Key words
基于DTA的GitHub高星仓库活跃度评估方法[J].
华东师范大学学报(自然科学版), 2025, 0(5): 140-150 DOI: