PDF
摘要
大数据时代,抽样调查依然是一种不可或缺的数据获取和统计推断方法,但抽样调查方法需要适应大数据的新时代情境,才能更好地体现其应有的价值。其中,如何抽取到对研究变量有代表性的样本是最值得关切的问题。本文提出一种基于切片逆回归的综合得分抽样法,利用切片逆回归能将因变量信息融入到自变量的特点,先对大数据进行切片逆回归分析,改进其降维过程,再计算各个体主成分综合得分作为入样概率进行抽样。数据模拟分析结果显示,在大数据情境下,相比于未实施抽样和简单随机抽样估计而言,本文提出的方法均具有更好的抽样估计效果,且当个体差别较大时抽样估计效果会更好。最后,实际数据检验也证实了此方法的可行性和有效性。
关键词
大数据
/
切片逆回归
/
主成分分析
/
综合得分
/
抽样估计
Key words
大数据情境下基于切片逆回归的抽样方法研究[J].
广西师范大学学报(自然科学版), 2022, 40(01): 91-99 DOI:10.16088/j.issn.1001-6600.2021060903