当前各种平台(京东、微信、支付宝等)收集了大量网络数据,如何有效地分析所获得的数据尤为重要.为了刻画网络数据度一致性的特征,在无向网络中,文献[
1 ]研究了一类被称为
β 的网络模型的极大似然估计量的相合性;文献[
2 ]进一步分析了该模型极大似然估计量的渐近正态性;文献[
3 ]证明了极大熵模型极大似然估计量的相合性;文献[
4 ]进一步研究了该模型极大似然估计量的渐近正态性;文献[
5 ]研究了一类由顶点强度参数化的随机图模型,并使用矩估计法证明了该类模型矩估计量的渐近理论;文献[
6 ]证明了有序网络所有矩估计量线性组合的中心极限定理.网络数据有时也有方向,如在信息网络中,服务器a向服务器b发送信息等.文献[
7 ]研究了当网络顶点个数趋于无穷时,三类有向加权网络模型(二元权重,无穷离散权重,无穷连续权重)的极大似然估计量的相合性和渐近正态性;文献[
8 ]研究了有限离散有向加权网络模型极大似然估计量的相合性和渐近正态性;文献[
9 ]证明了有限离散有向加权网络模型极大似然估计量线性组合的中心极限定理.基于此,本文将研究有向Poisson网络模型极大似然估计量的渐近性.
1 基础知识
1.1 有向网络模型
首先建立一个具有n 个顶点的有向随机图G n ,顶点依次标记为:1,2 , ⋯ , n .令a i , j 表示顶点i 到顶点j 的权重,其中a i , j ∈ Ω , Ω = ( 1,2 , ⋯ ) ,则G n 的邻接矩阵为A = ( a i , j ) n × n .在本文中,考虑离散取值为无穷的情况,即Ω = ( 1,2 , ⋯ , ∞ ) ,且假定G n 没有自循环,即a i , i = 0 .定义d i = ∑ j ≠ i n a i , j 为顶点i 的出度,b j = ∑ i ≠ j n a i , j 为顶点j 的入度,则d = ( d 1 , ⋯ , d n ) T 为图G n 的出度序列,b = ( b 1 , ⋯ , b n ) T 为图G n 的入度序列,{ d , b } 为图G n 的双度序列.图G n 的概率质量函数是标准的指数形式,且以双度序列为充分统计量,即:
P ( G n ) = e x p ( α T d + β T b - z ( α , β ) ) , (1)
其中
z ( α , β ) 是关于参数
α 和
β 的函数,
α = ( α 1 , ⋯ , α n ) T 是出度序列的参数向量,
β = ( β 1 , ⋯ , β n ) T 是入度序列的参数向量,
α i 量化了顶点
i 到顶点
j j ≠ i 出边的影响力,
β j 量化了顶点
i i ≠ j 到顶点
j 入边的影响力.由上述定义可以得到
∑ i = 1 n d i = ∑ j = 1 n b j .如果将
( α , β ) 转换为
( α - c , β + c ) ,概率质量函数
P ( G n ) 不会改变,因此有必要对
α 和
β 进行约束.根据文献[
7 ],图
G n 共有
n × ( n - 1 ) 个相互独立的随机变量
a i , j , i ≠ j ,且为保证参数的可识别性,本文设置
β n = 0 .假设
a i , j 满足参数为
λ = e α i + β j 的Poisson分布,即:
P ( a i , j = a ) = e a ( α i + β j ) a ! e x p ( - e α i + β j ) , a = 0,1 , ⋯ , (2)
令θ = ( α 1 , ⋯ , α n , β 1 , ⋯ , β n - 1 ) T , g = ( d 1 , ⋯ d n , b 1 , ⋯ b n - 1 ) T , z ( θ ) = ∑ i = 1 n ∑ j = 1 , j ≠ i n e α i + β j .
1.2 极大似然估计
在满足上式(2) 中假定分布的情况下,可以得到以下似然函数和似然方程组.
似然函数如下:
l ( θ ) = ∑ i = 1 n α i d i + ∑ j = 1 n β j b j - ∑ i = 1 n ∑ j = 1 , j ≠ i n e α i + β j . (3)
似然方程组:
d i = E ( d i ) = ∑ j = 1 , j ≠ i n E ( a i , j ) = ∑ j = 1 , j ≠ i n e α i + β j , i = 1 , ⋯ n , b j = E ( b j ) = ∑ i = 1 , i ≠ j n E ( a i , j ) = ∑ i = 1 , i ≠ j n e α i + β j , j = 1 , ⋯ n - 1 . (4)
定义系统函数:
F i θ = d i - E d i = ∑ j = 1 , j ≠ i n a i , j - e α i + β j , i = 1 , ⋯ n , F n + j θ = b j - E b j = ∑ i = 1 , i ≠ j n a i , j - e α i + β j , j = 1 , ⋯ n - 1 , F θ = F 1 θ , ⋯ , F n θ , F n + 1 θ , ⋯ , F 2 n - 1 θ T , (5)
由似然方程组构建的系统函数可以为后续计算F ' θ 提供方便.F θ = 0 的解是极大似然估计方程g = E g 诱导出的θ 的极大似然估计值,用θ ^ 表示满足F θ ^ = 0 的θ 的极大似然估计值,其中θ ^ = ( α ^ 1 , ⋯ , α ^ n , β ^ 1 , ⋯ , β ^ n - 1 ) T .考虑参数空间:
D = α , β ∈ R n : 0 < q n ≤ α i + β j ≤ Q n , 1 ≤ i ≠ j ≤ n ,
其中,q n = m i n i ≠ j α i + β j , Q n = m a x i ≠ j α i + β j .
1.3 预备知识及相关引理
对于向量x = x 1 , ⋯ , x n T ∈ R n ,x ∞ = m a x 1 ≤ i ≤ n x i 表示向量x 的l ∞ 范数.对于任意一个n × n 阶矩阵J = J i , j ,定义J ∞ = m a x x ≠ 0 J x ∞ x ∞ = m a x 1 ≤ i ≤ n ∑ j = 1 n J i , j ,定义A = a i , j 的矩阵范数 · 为A = m a x i , j a i , j .引进一类矩阵,给定两个正数m 和M 且满足M ≥ m > 0 ,如果满足以下条件,就说2 n - 1 × 2 n - 1 的矩阵V = v i , j ∈ ℒ n m , M :
m ≤ v i , i - ∑ j = n + 1 2 n - 1 v i , j ≤ M , i = 1 , ⋯ , n - 1 ; v n , n = ∑ j = n + 1 2 n - 1 v n , j , v i , j = 0 , i , j = 1 , ⋯ , n , i ≠ j , v i , j = 0 , i , j = n + 1 , ⋯ , 2 n - 1 , i ≠ j , m ≤ v i , j = v j , i ≤ M , i = 1 , ⋯ , n , j = n + 1 , ⋯ , 2 n - 1 , j ≠ n + i , v i , n + i = v n + i , i = 0 , i = 1 , ⋯ , n - 1 , v i , i = ∑ k = 1 n v k , i = ∑ k = 1 n v i , k , i = n + 1 , ⋯ , 2 n - 1 . (6)
显然,如果矩阵
V = v i , j ∈ ℒ n m , M ,则
V 是一个
2 n - 1 × 2 n - 1 的主对角占优的对称非负定矩阵.定义
v 2 n , i = v i , 2 n = v i , i - ∑ j = 1 , j ≠ i 2 n - 1 v i , j , v 2 n , 2 n = ∑ i = 1 2 n - 1 v 2 n , i , i = 1 , ⋯ , 2 n - 1 .文献[
7 ]中建议用
S = s i , j 来近似
V 的逆,即
V - 1 ,有如下定义:
s i , j = δ i , j v i , i + 1 v 2 n , 2 n , i , j = 1 , ⋯ , n , - 1 v 2 n , 2 n , i = 1 , ⋯ , n j = n + 1 , ⋯ , 2 n - 1 , - 1 v 2 n , 2 n , i = n + 1 , ⋯ , 2 n - 1 j = 1 , ⋯ , n , δ i , j v i , i + 1 v 2 n , 2 n , i , j = n + 1 , ⋯ , 2 n - 1 , (7)
其中,当i = j , δ i , j = 1 ; i ≠ j , δ i , j = 0 .
引理1[7 ] 假设
V = v i , j ∈ ℒ n m , M 且
M / m = o n ,对于足够大的
n ,
这里的c 1 是与M , m , n 都无关的常数.
引理2[7 ] 假设
V = v i , j ∈ ℒ n m , M 且
M / m = o n ,对于向量
x ∈ R 2 n - 1 ,
V - 1 x ∞ ≤ V - 1 - S x ∞ + S x ∞ ≤ 2 n - 1 c 1 M 2 m 3 n - 1 2 x ∞ + x 2 n v 2 n , 2 n + m a x i = 1 , ⋯ , 2 n - 1 x i v i , i , (9)
其中,x 2 n = ∑ i = 1 n x i - ∑ i = n + 1 2 n - 1 x i ,c 1 是与M , m , n 都无关的常数.
引理3[10 ] 若
e 2 Q n - q n = o n 1 / 4 ,当
n → ∞ ,
d i - E d i v i , i 和
b j - E b j v n + j , n + j 服从均值为0、方差为1的渐近正态分布,其中
i = 1 , ⋯ , n , j = 1 , ⋯ , n - 1 .
引理4[10 ] 若
e 7 Q n - 6 q n = o n l o g n ,当
n → ∞ 时,极大似然估计量
θ ^ 以概率趋近于1存在,且满足:
θ ^ - θ * ∞ = O e 4 Q n - 3 q n l o g n n = o 1 . (10)
引理5[7 ] 令
R = V - 1 - S , U = C o v R g - E g , W = S ( E - V S ) , 则有:
U ≤ V - 1 - S + W ≤ c 1 M 2 m 3 n - 1 2 + 3 M m n - 1 2 . (11)
命题1 假设A ∈ P θ * . 若e 2 Q n - q n = o n 1 / 4 ,当n → ∞ 时,对任意固定的k ≥ 1 ,向量S g - E g 的前k 个元素服从均值为0、协方差为S * 左上角k × k 矩阵的多元渐近正态分布,S * 为矩阵S 中真实值θ * 替换θ 得到.
基于上述命题1可以得到下面的引理6.
引理6[10 ] 若
e 4 Q n - 3 q n = o n 1 / 6 l o g n 1 / 3 和
e 2 Q n - q n = o n 1 / 4 ,当
n → ∞ 时,对任意固定的
k ≥ 1 ,
θ ^ - θ * 的前
k 个元素服从均值为0、协方差为
S * 左上角
k × k 矩阵的多元渐近正态分布.
引理7 令R = V - 1 - S , U = C o v R g - E g , 若e Q n - q n = o n 1 / 3 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,则有:
证明 根据二次型展开的形式和有关结论以及(11)式可得:V a r c R g - E g = c V a r R g - E g c T = c U c T ≤ U ∑ i , j = 1 n λ i λ j v i , i v j , j 1 / 2 + ∑ i , j = 1 n - 1 k i k j v n + i , n + i v n + j , n + j 1 / 2 + 2 ∑ i = 1 n ∑ j = 1 n - 1 λ i k j v i , i v n + j , n + j 1 / 2 ≤ M n - 1 U ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j 2 ≤ O M m 3 1 n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j 2 ,
若e Q n - q n = o n 1 / 3 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,V a r c R g - E g = o 1 , 引理得证.
2 主要结果及证明
文献[
7 ]证明了有向网络模型极大似然估计量的相合性和渐近正态性.基于此,本文进一步研究了当网络顶点个数趋于无穷时,所有极大似然估计量线性组合的中心极限定理并得到了定理1.下面给出
F ' θ 的基本结论,根据计算公式可以得到:
∂ F i ∂ α i = - ∑ j = 1 , j ≠ i n e α i + β j , i = 1 , ⋯ , n , ∂ F i ∂ α j = 0 , i ≠ j , ∂ F i ∂ β j = - e α i + β j , j ≠ i , ∂ F i ∂ β i = 0 , ∂ F n + j ∂ β j = - ∑ i = 1 , i ≠ j n e α i + β j , j = 1 , ⋯ , n - 1 , ∂ F n + j ∂ β i = 0 , i ≠ j , ∂ F n + j ∂ α i = - e α i + β j , i ≠ j , ∂ F n + j ∂ α j = 0 . (13)
令
V = v i , j = - F ' θ ,不难得出
V 为参数
θ 的Fisher信息矩阵且满足
ℒ n m , M ,又因为
e x 是个单调递增函数,满足
0 < q n ≤ α i + β j ≤ Q n ,可以得到
m = e q n , M = e Q n .根据
ℒ n m , M 的定义,可以得到
m n - 1 ≤ v i , i ≤ M n - 1 , i = 1 , ⋯ , 2 n - 1 . 根据Billingsley(1968)
[11 ] 中的定理4.2可以得到命题2.
命题2 假设A ∈ P θ * . 若e 2 Q n - q n = o n 1 / 4 ,当n → ∞ 时,c S g - E g 服从均值为0,方差为σ 2 的渐近正态分布,其中:
σ 2 = ∑ i = 1 n λ i 2 + ∑ i , j = 1 n λ i λ j H i H j + ∑ i = 1 n - 1 k i 2 + ∑ i , j = 1 n - 1 k i k j H n + i H n + j - 2 ∑ i = 1 n ∑ j = 1 n - 1 λ i k j H i H n + j .
基于上述命题2可以得到下面的定理1.
定理1 若下述条件成立:
(i)e 23 2 Q n - 9 q n = o n 1 / 2 l o g n , e 2 Q n - q n = o n 1 / 4 ;
(ii)∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,
当n → ∞ 时,∑ i = 1 n λ i v i , i 1 / 2 ( α ^ i - α i * ) + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 ( β ^ j - β j * ) 服从均值为0、方差为σ 2 的渐近正态分布.
σ 2 = ∑ i = 1 n λ i 2 + ∑ i , j = 1 n λ i λ j H i H j + ∑ i = 1 n - 1 k i 2 + ∑ i , j = 1 n - 1 k i k j H n + i H n + j - 2 ∑ i = 1 n ∑ j = 1 n - 1 λ i k j H i H n + j ,
其中,H i = v i , i / v 2 n , 2 n 1 / 2 , H n + j = v n + j , n + j / v 2 n , 2 n 1 / 2 .
证明 E a i , j 是仅关于α i + β j 的函数,令E a i , j = μ α i + β j ,可以得到:
E d i = ∑ j = 1 , j ≠ i n μ α i + β j , i = 1 , ⋯ , n , E b j = ∑ i = 1 , i ≠ j n μ α i + β j , j = 1 , ⋯ , n - 1 ,
由引理4可得ρ ^ n = m a x 1 ≤ i ≤ 2 n - 1 θ ^ i - θ i * = O e 4 Q n - 3 q n l o g n n ,μ · 在α i * + β j * 点处进行泰勒展开到二阶且令γ ^ i j = α ^ i + β ^ j - α i * - β j * ,对任意的i ≠ j 有:
μ α ^ i + β ^ j - μ α i * + β j * = μ ' α i * + β j * γ ^ i j + 1 2 μ ' ' θ ^ i j γ ^ i j 2 ,
进一步可以得到:
d i - E ( d i ) = ∑ j = 1 , j ≠ i n μ α ^ i + β ^ j - μ α i * + β j * = ∑ j = 1 , j ≠ i n μ ' α i * + β j * γ ^ i j + h i , b j - E ( b j ) = ∑ i = 1 , i ≠ j n μ α ^ i + β ^ j - μ α i * + β j * = ∑ i = 1 , i ≠ j n μ ' α i * + β j * γ ^ i j + h j , (14)
其中:
h i j = 1 2 μ ' ' θ ^ i j γ ^ i j 2 , θ ^ i j = α i * + β j * + ϕ i j γ ^ i j , 0 ≤ ϕ i j ≤ 1 , h i = ∑ j = 1 , j ≠ i n h i j , i = 1 , ⋯ , n , h n + j = ∑ i = 1 , i ≠ j n h i j , j = 1 , ⋯ , n - 1 , h 2 n = ∑ i = 1 n h i - ∑ j = 1 n - 1 h n + j = ∑ i = 1 n - 1 h i , n ,
将上式(14) 写成矩阵形式,可以得到:
g - E g = V θ ^ - θ * + h , h = h 1 , ⋯ , h 2 n - 1 T , (15)
(15)式通过矩阵变换,等价转化为:
θ ^ - θ * = V - 1 g - E g - V - 1 h = S g - E g + R g - E g - S h - R h ,
要证∑ i = 1 n λ i v i , i 1 / 2 ( α ^ i - α i * ) + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 ( β ^ j - β j * ) = c θ ^ - θ * 的渐近正态性,即证:
其中,c = λ , k = λ 1 v 1,1 1 / 2 , ⋯ , λ n v n , n 1 / 2 , k 1 v n + 1 , n + 1 1 / 2 , ⋯ , k n - 1 v 2 n - 1,2 n - 1 1 / 2 .
下面分3部分证明其渐近正态性.
h i j = 1 2 μ ' ' θ ^ i j γ ^ i j 2 = 1 2 e θ ^ i j γ ^ i j 2 ≤ 1 2 e Q n 2 ρ ^ n 2 = 2 e Q n O e 8 Q n - 6 q n l o g n n = O e 9 Q n - 6 q n l o g n n ,
可以得到h i ≤ n - 1 O e 9 Q n - 6 q n l o g n n = O e 9 Q n - 6 q n l o g n .
(i)首先证明n → ∞ 时,c S h = ∑ i = 1 n λ i v i , i 1 / 2 S h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 S h n + j → 0 ,
S h i = h i v i , i + - 1 I i > n h 2 n v 2 n , 2 n ≤ 1 m n - 1 h i + h 2 n ≤ 2 m n - 1 O e 9 Q n - 6 q n l o g n = O e 9 Q n - 7 q n l o g n n , i = 1 , ⋯ , 2 n - 1 ,
c S h = ∑ i = 1 n λ i v i , i 1 / 2 S h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 S h n + j ≤ M n - 1 O e 9 Q n - 7 q n l o g n n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j = O e 19 2 Q n - 7 q n l o g n n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j ,
若e 19 2 Q n - 7 q n = o n l o g n 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,则:
c S h = ∑ i = 1 n λ i v i , i 1 / 2 S h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 S h n + j → 0 .
(ii)再证明n → ∞ 时,c R h = ∑ i = 1 n λ i v i , i 1 / 2 R h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 R h n + j → 0 ,
R h i ≤ 2 n - 1 R h i ≤ 2 n - 1 c 1 M 2 m 3 n - 1 2 O e 9 Q n - 6 q n l o g n = O e 11 Q n - 9 q n l o g n n , i = 1 , ⋯ , 2 n - 1 ,
c R h = ∑ i = 1 n λ i v i , i 1 / 2 R h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 R h n + j ≤ M n - 1 O e 11 Q n - 9 q n l o g n n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j = O e 23 2 Q n - 9 q n l o g n n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j ,
若e 23 2 Q n - 9 q n = o n l o g n 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,则:
c R h = ∑ i = 1 n λ i v i , i 1 / 2 R h i + ∑ j = 1 n - 1 k j v n + j , n + j 1 / 2 R h n + j → 0 ,
由(i)和(ii)可得c V - 1 h = c S h + c R h ≤ O e 23 2 Q n - 9 q n l o g n n ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j ,
若e 23 2 Q n - 9 q n = o n l o g n 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,则:
c V - 1 h ≤ O e 23 2 Q n - 9 q n l o g n n 1 / 2 ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j → o 1 .
(iii)最后证明当n → ∞ ,c R g - E g 依概率收敛于0.
由切比雪夫不等式及引理7可得:
P c R g - E g > ε ≤ V a r c R g - E g ε 2 ≤ 1 ε 2 M n - 1 U × ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j 2 ≤ 1 ε 2 O M 3 m 3 n - 1 × ∑ i = 1 n λ i + ∑ j = 1 n - 1 k j 2 ,
若e Q n - q n = o n 1 / 3 和∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ ,则c R g - E g = o p 1 ,
由(i)~(iii)可得:
c θ ^ - θ * = c S g - E g + c R g - E g - c S h + R h = c S g - E g + o p 1 ,
再由命题2可以得出定理1.
本文未直接选择极大似然估计量
θ ^ 的线性组合,即
∑ i ∞ λ i α ^ i - α i * + ∑ j ∞ k j β ^ j - β j * ,根据文献[
7 ],
α ^ i 和
β ^ j 的渐近方差分别为
1 v i , i , 1 v n + j , n + j , 它可能会导致
α ^ i 和
β ^ j 有不同的收敛速率.因此,利用极大似然估计量归一化版本的线性组合合理且便于计算.
3 数值研究
本节通过数值模拟来验证Poisson模型所有极大似然估计量的线性组合的渐近正态性,并将本方法应用到一个实际数据之中.
3.1 数值模拟
参考文献[
10 ]中的模拟设置方法,选取一组线性形式参数值,但是在参数的设置和步长的选择上有所不同.令参数
α i + 1 * = 0.2 + n - 1 - i · L / n - 1 , i = 0 , ⋯ , n - 1 , β i * = α i * , β n * = 0 .本文选取的顶点个数为
n = 150 , 200 ,考虑
L = - l o g l o g n 1 / 3 , - 1 / 3 l o g n 1 / 3 , - l o g n , - 1 / 2 l o g l o g n 1 / 2 四种不同的步长值.设定
λ i = i - 2 , κ j = j - 2 i = 1 , ⋯ , n , j = 1 , ⋯ , n - 1 ,且满足
∑ i = 1 ∞ λ i < ∞ , ∑ j = 1 ∞ k j < ∞ . 根据定理1可知,
∑ i = 1 n λ i v ^ i , i 1 / 2 ( α ^ i - α i * ) + ∑ j = 1 n - 1 k j v ^ n + j , n + j 1 / 2 ( β ^ j - β j * ) 服从均值为0、方差为
σ 2 的渐近正态分布,其中
v ^ i , i 1 / 2 是用
α ^ i 替换
α i * , β ^ i 替换
β i * 得到的估计值.本文将采用QQ图来评估极大似然估计量
∑ i = 1 n λ i v ^ i , i 1 / 2 ( α ^ i - α i * ) + ∑ j = 1 n - 1 k j v ^ n + j , n + j 1 / 2 ( β ^ j - β j * ) / σ 的渐近正态性,每种情况模拟10000次.
针对
n = 150 , 200 模拟得到的QQ图如
图1 所示,图中横轴和纵轴分别为理论分位数和经验分位数,红色直线对应于参考线
y = x .从
图1 很明显可以看出,当
L = - l o g l o g n 1 / 3 , - 1 / 3 l o g n 1 / 3 , - 1 / 2 l o g l o g n 1 / 2 时,经验分位数与标准正态分位数总体来说吻合比较好;当
L = - 1 / 2 l o g l o g n 1 / 2 时,
n = 150 对应的QQ图直线首端略有偏差,而
n = 200 时对应的QQ图直线首端拟合变好,随着
n 的增大,总体吻合度提高.此外,发现当
L = - l o g n 时,无论
n 取何值,参数
θ 的极大似然估计值均不存在,在这种情况下无法得到QQ图.
表1 记录了
c θ ^ - θ * 的均值和方差.当步长取值为
L = l o g l o g n 1 / 3 , - 1 / 3 l o g n 1 / 3 , - 1 / 2 l o g l o g n 1 / 2 时,
c θ ^ - θ * 的均值会随着
n 的增大而趋近于0;当
L = - l o g n 的极大似然估计不存在,表明
L 取值不合理时,会产生很大的误差,本文中
L 应该小于
- l o g n .
3.2 数据示例
本文从Residence hall数据集(Webster)获取数据,该数据集可从网站Networks(konect.cc)上获得.该有向网络包含住在澳大利亚国立大学校园宿舍楼217名居民之间的友谊情况.
图2 是该数据集的可视化网络图,图中包含217个节点,代表217个体,有2762条有向边.每条边的权值反映了居民
i 对居民
j j ≠ i 的友谊等级,但是当顶点的入度或者出度为0时,度的估计参数不存在.因此排除出度或者入度为0的节点,对剩下的214个节点进行分析.
将Residence hall网络生成
214 × 214 的非对称邻接矩阵带入模型中,计算得到的每个节点的度及它们的影响参数
α ^ i 和
β ^ j 及参数方差(
表2 ).
4 结论
本文证明了Poisson模型中所有极大似然估计量线性组合的中心极限定理,通过数值模拟,验证了理论的正确性,并展示了其在实际统计推断中的应用潜力.在模拟过程中产生的网络是稠密的,这与实际中常见的稀疏网络有所差异,因此,深入探索双度序列在稀疏网络环境下的渐近性质,不仅是对现有研究的补充,也对理解和分析现实世界的网络结构有重要意义,此领域的进一步研究将有助于提高模型的适用性和预测的准确性.