有向Poisson网络模型的渐近性理论

罗敬 ,  秦兆伦

中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (01) : 118 -125.

PDF (1376KB)
中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (01) : 118 -125. DOI: 10.20056/j.cnki.ZNMDZK.20250114
数学与统计学科学

有向Poisson网络模型的渐近性理论

作者信息 +

Asymptotic theory of directed Poisson network models

Author information +
文章历史 +
PDF (1408K)

摘要

研究了有向Poisson网络模型极大似然估计量的渐近性理论.考虑当网络顶点的个数趋于无穷大时,推导出有向Poisson网络模型极大似然估计量线性组合的中心极限定理.此外,通过数值模拟对理论结果进行了验证,期望能够为有向加权网络模型的统计推断提供坚实的理论基础.

Abstract

This research explores the asymptotic theory of maximum likelihood estimators in directed Poisson network models. It particularly focuses on deriving the central limit theorem for linear combinations of these estimators as the number of network vertices grows to infinity. Additionally, the paper validates the theoretical results through numerical simulations, aiming to provide a robust theoretical foundation for statistical inference in directed weighted network models.

Graphical abstract

关键词

有向网络 / Poisson模型 / 极大似然估计 / 中心极限定理 / 渐近正态性

Key words

directed network / Poisson model / MLE / central limit theorem / asymptotic normality

引用本文

引用格式 ▾
罗敬,秦兆伦. 有向Poisson网络模型的渐近性理论[J]. 中南民族大学学报(自然科学版), 2025, 44(01): 118-125 DOI:10.20056/j.cnki.ZNMDZK.20250114

登录浏览全文

4963

注册一个新账户 忘记密码

当前各种平台(京东、微信、支付宝等)收集了大量网络数据,如何有效地分析所获得的数据尤为重要.为了刻画网络数据度一致性的特征,在无向网络中,文献[1]研究了一类被称为β的网络模型的极大似然估计量的相合性;文献[2]进一步分析了该模型极大似然估计量的渐近正态性;文献[3]证明了极大熵模型极大似然估计量的相合性;文献[4]进一步研究了该模型极大似然估计量的渐近正态性;文献[5]研究了一类由顶点强度参数化的随机图模型,并使用矩估计法证明了该类模型矩估计量的渐近理论;文献[6]证明了有序网络所有矩估计量线性组合的中心极限定理.网络数据有时也有方向,如在信息网络中,服务器a向服务器b发送信息等.文献[7]研究了当网络顶点个数趋于无穷时,三类有向加权网络模型(二元权重,无穷离散权重,无穷连续权重)的极大似然估计量的相合性和渐近正态性;文献[8]研究了有限离散有向加权网络模型极大似然估计量的相合性和渐近正态性;文献[9]证明了有限离散有向加权网络模型极大似然估计量线性组合的中心极限定理.基于此,本文将研究有向Poisson网络模型极大似然估计量的渐近性.

1 基础知识

1.1 有向网络模型

首先建立一个具有n个顶点的有向随机图Gn,顶点依次标记为:1,2,,n.令ai,j表示顶点i到顶点j的权重,其中ai,jΩ , Ω=(1,2,) ,则Gn的邻接矩阵为A=(ai,j)n×n.在本文中,考虑离散取值为无穷的情况,即Ω=(1,2,,),且假定Gn没有自循环,即ai,i=0.定义di=jinai,j为顶点i的出度,bj=ijnai,j为顶点j的入度,则d=(d1,,dn)T为图Gn的出度序列,b=(b1,,bn)T为图Gn的入度序列,{d,b}为图Gn的双度序列.图Gn的概率质量函数是标准的指数形式,且以双度序列为充分统计量,即:

P(Gn)=exp(αTd+βTb-z(α,β)),

其中z(α,β)是关于参数αβ的函数,α=(α1,,αn)T是出度序列的参数向量,β=(β1,,βn)T是入度序列的参数向量,αi量化了顶点i到顶点jji出边的影响力,βj量化了顶点iij到顶点j入边的影响力.由上述定义可以得到i=1ndi=j=1nbj.如果将(α,β)转换为(α-c,β+c),概率质量函数P(Gn)不会改变,因此有必要对αβ进行约束.根据文献[7],图Gn共有n×(n-1)个相互独立的随机变量ai,j,ij,且为保证参数的可识别性,本文设置βn=0.假设ai,j满足参数为λ=eαi+βj的Poisson分布,即:

P(ai,j=a)=ea(αi+βj)a!exp(-eαi+βj),    a=0,1,,

θ=(α1,,αn,β1,,βn-1)T,g=(d1,dn,b1,bn-1)T,  z(θ)=i=1nj=1,jineαi+βj.

1.2 极大似然估计

在满足上式(2)中假定分布的情况下,可以得到以下似然函数和似然方程组.

似然函数如下:

l(θ)=i=1nαidi+j=1nβjbj-i=1nj=1,jineαi+βj.

似然方程组:

di=E(di)=j=1,jinE(ai,j)=j=1,jineαi+βj, i=1,n,bj=E(bj)=i=1,ijnE(ai,j)=i=1,ijneαi+βj, j=1,n-1.

定义系统函数:

Fiθ=di-Edi=j=1,jinai,j-eαi+βj,     i=1,n,Fn+jθ=bj-Ebj=i=1,ijnai,j-eαi+βj,  j=1,n-1,Fθ=F1θ,,Fnθ,Fn+1θ,,F2n-1θT,

由似然方程组构建的系统函数可以为后续计算F'θ提供方便.Fθ=0的解是极大似然估计方程g=Eg诱导出的θ的极大似然估计值,用θ^表示满足Fθ^=0θ的极大似然估计值,其中θ^=(α^1,,α^n,β^1,,β^n-1)T.考虑参数空间:

D=α,βRn:0<qnαi+βjQn,1ijn,

其中,qn=minijαi+βj,Qn=maxijαi+βj.

1.3 预备知识及相关引理

对于向量x=x1,,xnTRnx=max1inxi表示向量xl范数.对于任意一个n×n阶矩阵J=Ji,j,定义J=maxx0Jxx=max1inj=1nJi,j,定义A=ai,j的矩阵范数 · A=maxi,jai,j.引进一类矩阵,给定两个正数mM且满足Mm>0,如果满足以下条件,就说2n-1×2n-1的矩阵V=vi,jnm,M

mvi,i-j=n+12n-1vi,jM,  i=1,,n-1;    vn,n=j=n+12n-1vn,j,vi,j=0,   i,j=1,,n,   ij,vi,j=0,   i,j=n+1,,2n-1,   ij,mvi,j=vj,iM,  i=1,,n,   j=n+1,,     2n-1,   jn+i,vi,n+i=vn+i,i=0,  i=1,,n-1,vi,i=k=1nvk,i=k=1nvi,k,  i=n+1,,2n-1.

显然,如果矩阵V=vi,jnm,M,则V是一个2n-1×2n-1的主对角占优的对称非负定矩阵.定义v2n,i=vi,2n=vi,i-j=1,ji2n-1vi,j, v2n,2n=i=12n-1v2n,i, i=1,,2n-1.文献[7]中建议用S=si,j来近似V的逆,即V-1,有如下定义:

si,j=δi,jvi,i+1v2n,2n, i,j=1,,n,-1v2n,2n,        i=1,,n  j=n+1,,2n-1,-1v2n,2n,        i=n+1,,2n-1   j=1,,n,δi,jvi,i+1v2n,2n, i,j=n+1,,2n-1, 

其中,当i=j, δi,j=1;   ij, δi,j=0.

引理17 假设V=vi,jnm,MM/m=on,对于足够大的n

 V-1-S c1M2m3n-12,

这里的c1是与M,m,n都无关的常数.

引理27 假设V=vi,jnm,MM/m=on,对于向量xR2n-1

 V-1x  V-1-Sx + Sx                      2n-1c1M2m3n-12 x +x2nv2n,2n+maxi=1,,2n-1xivi,i,

其中,x2n=i=1nxi-i=n+12n-1xic1是与M,m,n都无关的常数.

引理310e2Qn-qn=on1/4,当ndi-Edivi,ibj-Ebjvn+j,n+j服从均值为0、方差为1的渐近正态分布,其中i=1,,n,   j=1,,n-1.

引理410e7Qn-6qn=onlogn,当n时,极大似然估计量θ^以概率趋近于1存在,且满足:

 θ^-θ* =Oe4Qn-3qnlognn=o1.

引理57R=V-1-S, U=CovRg-Eg, W=S(E-VS),则有:

 U  V-1-S + W c1M2m3n-12+3Mmn-12.

命题1 假设APθ*.e2Qn-qn=on1/4,当n时,对任意固定的k1,向量Sg-Eg的前k个元素服从均值为0、协方差为S*左上角k×k矩阵的多元渐近正态分布,S*为矩阵S中真实值θ*替换θ得到.

基于上述命题1可以得到下面的引理6.

引理610e4Qn-3qn=on1/6logn1/3e2Qn-qn=on1/4,当n时,对任意固定的k1θ^-θ*的前k个元素服从均值为0、协方差为S*左上角k×k矩阵的多元渐近正态分布.

引理7R=V-1-S, U=CovRg-Eg, eQn-qn=on1/3i=1λi<,j=1kj<,则有:

VarcRg-Eg=cUcT=o1.

证明 根据二次型展开的形式和有关结论以及(11)式可得:VarcRg-Eg=cVarRg-EgcT=cUcT Ui,j=1nλiλjvi,ivj,j1/2+i,j=1n-1kikjvn+i,n+ivn+j,n+j1/2+      2i=1nj=1n-1λikjvi,ivn+j,n+j1/2Mn-1 U i=1nλi+j=1n-1kj2       OMm31ni=1nλi+j=1n-1kj2,

eQn-qn=on1/3i=1λi<,j=1kj<VarcRg-Eg=o1,引理得证.

2 主要结果及证明

文献[7]证明了有向网络模型极大似然估计量的相合性和渐近正态性.基于此,本文进一步研究了当网络顶点个数趋于无穷时,所有极大似然估计量线性组合的中心极限定理并得到了定理1.下面给出F'θ的基本结论,根据计算公式可以得到:

Fiαi=-j=1,jineαi+βj,  i=1,,n,  Fiαj=0, ij,Fiβj=-eαi+βj,      ji,      Fiβi=0,Fn+jβj=-i=1,ijneαi+βj,   j=1,,n-1,  Fn+jβi=0, ij,Fn+jαi=-eαi+βj,       ij,    Fn+jαj=0.

V=vi,j=-F'θ,不难得出V为参数θ的Fisher信息矩阵且满足nm,M,又因为ex是个单调递增函数,满足0<qnαi+βjQn,可以得到m=eqn,M=eQn.根据nm,M的定义,可以得到mn-1vi,iMn-1,   i=1,,2n-1.根据Billingsley(1968)11中的定理4.2可以得到命题2.

命题2 假设APθ*.e2Qn-qn=on1/4,当n时,cSg-Eg服从均值为0,方差为σ2的渐近正态分布,其中:

σ2=i=1nλi2+i,j=1nλiλjHiHj+i=1n-1ki2+i,j=1n-1kikjHn+iHn+j-2i=1nj=1n-1λikjHiHn+j.

基于上述命题2可以得到下面的定理1.

定理1 若下述条件成立:

(i)e232Qn-9qn=on1/2logn,e2Qn-qn=on1/4

(ii)i=1λi<,j=1kj<

n时,i=1nλivi,i1/2(α^i-αi*)+j=1n-1kjvn+j,n+j1/2(β^j-βj*)服从均值为0、方差为σ2的渐近正态分布.

σ2=i=1nλi2+i,j=1nλiλjHiHj+i=1n-1ki2+i,j=1n-1kikjHn+iHn+j-2i=1nj=1n-1λikjHiHn+j,

其中,Hi=vi,i/v2n,2n1/2,  Hn+j=vn+j,n+j/v2n,2n1/2.

证明Eai,j是仅关于αi+βj的函数,令Eai,j=μαi+βj,可以得到:

Edi=j=1,jinμαi+βj,     i=1,,n,Ebj=i=1,ijnμαi+βj,     j=1,,n-1,

由引理4可得ρ^n=max1i2n-1θ^i-θi*=Oe4Qn-3qnlognnμ·αi*+βj*点处进行泰勒展开到二阶且令γ^ij=α^i+β^j-αi*-βj*,对任意的ij有:

μα^i+β^j-μαi*+βj*=μ'αi*+βj*γ^ij+12μ''θ^ijγ^ij2,

进一步可以得到:

di-E(di)=j=1,jinμα^i+β^j-μαi*+βj*=j=1,jinμ'αi*+βj*γ^ij+hi,bj-E(bj)=i=1,ijnμα^i+β^j-μαi*+βj*=i=1,ijnμ'αi*+βj*γ^ij+hj,

其中:

hij=12μ''θ^ijγ^ij2,  θ^ij=αi*+βj*+ϕijγ^ij,  0ϕij1,hi=j=1,jinhij,   i=1,,n,   hn+j=i=1,ijnhij,   j=1,,n-1,h2n=i=1nhi-j=1n-1hn+j=i=1n-1hi,n,

将上式(14)写成矩阵形式,可以得到:

g-Eg=Vθ^-θ*+h, h=h1,,h2n-1T,

(15)式通过矩阵变换,等价转化为:

θ^-θ*=V-1g-Eg-V-1h=Sg-Eg+Rg-Eg-Sh-Rh,

要证i=1nλivi,i1/2(α^i-αi*)+j=1n-1kjvn+j,n+j1/2(β^j-βj*)=cθ^-θ*的渐近正态性,即证:

cSg-Eg+cRg-Eg-cSh+Rh,

其中,c=λ,k=λ1v1,11/2,,λnvn,n1/2,k1vn+1,n+11/2,,kn-1v2n-1,2n-11/2.

下面分3部分证明其渐近正态性.

hij=12μ''θ^ijγ^ij2=12eθ^ijγ^ij212eQn2ρ^n2=2eQnOe8Qn-6qnlognn=Oe9Qn-6qnlognn,

可以得到hin-1Oe9Qn-6qnlognn=Oe9Qn-6qnlogn.

(i)首先证明n时,cSh=i=1nλivi,i1/2Shi+j=1n-1kjvn+j,n+j1/2Shn+j0,

Shi=hivi,i+-1Ii>nh2nv2n,2n1mn-1hi+h2n2mn-1Oe9Qn-6qnlogn=Oe9Qn-7qnlognn,i=1,,2n-1,
cSh=i=1nλivi,i1/2Shi+j=1n-1kjvn+j,n+j1/2Shn+jMn-1Oe9Qn-7qnlognni=1nλi+j=1n-1kj=Oe192Qn-7qnlognni=1nλi+j=1n-1kj,

e192Qn-7qn=onlogni=1λi<,j=1kj<,则:

cSh=i=1nλivi,i1/2Shi+j=1n-1kjvn+j,n+j1/2Shn+j0.

(ii)再证明n时,cRh=i=1nλivi,i1/2Rhi+j=1n-1kjvn+j,n+j1/2Rhn+j0,

Rhi2n-1 R hi2n-1c1M2m3n-12Oe9Qn-6qnlogn=Oe11Qn-9qnlognn, i=1,,2n-1,
cRh=i=1nλivi,i1/2Rhi+j=1n-1kjvn+j,n+j1/2Rhn+jMn-1Oe11Qn-9qnlognni=1nλi+j=1n-1kj=Oe232Qn-9qnlognni=1nλi+j=1n-1kj,

e232Qn-9qn=onlogni=1λi<,j=1kj<,则:

cRh=i=1nλivi,i1/2Rhi+j=1n-1kjvn+j,n+j1/2Rhn+j0,

由(i)和(ii)可得cV-1h=cSh+cRhOe232Qn-9qnlognni=1nλi+j=1n-1kj,

e232Qn-9qn=onlogni=1λi<,j=1kj<,则:

cV-1hOe232Qn-9qnlognn1/2i=1nλi+j=1n-1kjo1.

(iii)最后证明当ncRg-Eg依概率收敛于0.

由切比雪夫不等式及引理7可得:

PcRg-Eg>εVarcRg-Egε21ε2Mn-1 U ×i=1nλi+j=1n-1kj21ε2OM3m3n-1×i=1nλi+j=1n-1kj2,

eQn-qn=on1/3i=1λi<,j=1kj<,则cRg-Eg=op1,

由(i)~(iii)可得:

cθ^-θ*=cSg-Eg+cRg-Eg-cSh+Rh=cSg-Eg+op1,

再由命题2可以得出定理1.

本文未直接选择极大似然估计量θ^的线性组合,即iλiα^i-αi*+jkjβ^j-βj*,根据文献[7],α^iβ^j的渐近方差分别为1vi,i,1vn+j,n+j,它可能会导致α^iβ^j有不同的收敛速率.因此,利用极大似然估计量归一化版本的线性组合合理且便于计算.

3 数值研究

本节通过数值模拟来验证Poisson模型所有极大似然估计量的线性组合的渐近正态性,并将本方法应用到一个实际数据之中.

3.1 数值模拟

参考文献[10]中的模拟设置方法,选取一组线性形式参数值,但是在参数的设置和步长的选择上有所不同.令参数αi+1*=0.2+n-1-i·L/n-1,i=0,,n-1,βi*=αi*,βn*=0.本文选取的顶点个数为n=150, 200,考虑L=-loglogn1/3,-1/3logn1/3,-logn,-1/2loglogn1/2四种不同的步长值.设定λi=i-2,κj=j-2i=1,,n,  j=1,,n-1,且满足i=1λi<,j=1kj<.根据定理1可知,i=1nλiv^i,i1/2(α^i-αi*)+j=1n-1kjv^n+j,n+j1/2(β^j-βj*)服从均值为0、方差为σ2的渐近正态分布,其中v^i,i1/2是用α^i替换αi*,β^i替换βi*得到的估计值.本文将采用QQ图来评估极大似然估计量i=1nλiv^i,i1/2(α^i-αi*)+j=1n-1kjv^n+j,n+j1/2(β^j-βj*)/σ的渐近正态性,每种情况模拟10000次.

针对n=150, 200模拟得到的QQ图如图1所示,图中横轴和纵轴分别为理论分位数和经验分位数,红色直线对应于参考线y=x.从图1很明显可以看出,当L=-loglogn1/3,-1/3logn1/3,-1/2loglogn1/2时,经验分位数与标准正态分位数总体来说吻合比较好;当L=-1/2loglogn1/2时,n=150对应的QQ图直线首端略有偏差,而n=200时对应的QQ图直线首端拟合变好,随着n的增大,总体吻合度提高.此外,发现当L=-logn时,无论n取何值,参数θ的极大似然估计值均不存在,在这种情况下无法得到QQ图.

表1记录了cθ^-θ*的均值和方差.当步长取值为L=loglogn1/3,-1/3logn1/3,-1/2loglogn1/2时,cθ^-θ*的均值会随着n的增大而趋近于0;当L=-logn的极大似然估计不存在,表明L取值不合理时,会产生很大的误差,本文中L应该小于-logn.

3.2 数据示例

本文从Residence hall数据集(Webster)获取数据,该数据集可从网站Networks(konect.cc)上获得.该有向网络包含住在澳大利亚国立大学校园宿舍楼217名居民之间的友谊情况.图2是该数据集的可视化网络图,图中包含217个节点,代表217个体,有2762条有向边.每条边的权值反映了居民i对居民jji的友谊等级,但是当顶点的入度或者出度为0时,度的估计参数不存在.因此排除出度或者入度为0的节点,对剩下的214个节点进行分析.

将Residence hall网络生成214×214的非对称邻接矩阵带入模型中,计算得到的每个节点的度及它们的影响参数α^iβ^j 及参数方差(表2).

4 结论

本文证明了Poisson模型中所有极大似然估计量线性组合的中心极限定理,通过数值模拟,验证了理论的正确性,并展示了其在实际统计推断中的应用潜力.在模拟过程中产生的网络是稠密的,这与实际中常见的稀疏网络有所差异,因此,深入探索双度序列在稀疏网络环境下的渐近性质,不仅是对现有研究的补充,也对理解和分析现实世界的网络结构有重要意义,此领域的进一步研究将有助于提高模型的适用性和预测的准确性.

参考文献

[1]

CHATTERJEE SDIACONIS P, SLY A. Random graphs with a given degree sequence[J]. The Annals of Applied Probability201121(4):1400-1435.

[2]

YAN TXU J. A central limit theorem in the β-model for undirected random graphs with a diverging number of vertices[J]. Biometrika2013100(2):519-524.

[3]

HILLAR CWIBISONO A. Maximum entropy distributions on graphs[J]. arXiv: 2013,1301.3321.

[4]

YAN TZHAO YQIN H. Asymptotic normality in the maximum entropy models on graphs with an increasing number of parameters[J]. Journal of Multivariate Analysis2015133:61-76.

[5]

YAN TQIN HWANG H. Asymptotics in undirected random graph models parameterized by the strengths of vertices[J]. Statistica Sinica201626(1):273-293.

[6]

许芷萌,肖可君,罗敬.有序网络模型中矩估计量的渐近性理论[J].中南民族大学学报(自然科学版)202342(3):408-414.

[7]

YAN TLENG CZHU J. Asymptotics in directed exponential random graph models with an increasing bi-degree sequence[J]. The Annals of Statistics201644(1):31-57.

[8]

YONG ZCHEN SQIN Het al. Directed weighted random graphs with an increasing bi-degree sequence[J]. Statistics & Probability Letters2016119:235-40.

[9]

LUO JQIN HWANG Z. Asymptotic distribution in directed finite weighted random graphs with an increasing bi-degree sequence[J]. Acta Mathematica Scientia202040(2):355-368.

[10]

范一凡.若干随机图模型中的渐近理论[D].武汉:华中师范大学,2021.

[11]

BILLINGSLEY P. Convergence of probability measures[M]. New York: John Wiley & Sons, 2013.

基金资助

教育部人文社会科学研究青年项目资助(24YJC910006)

AI Summary AI Mindmap
PDF (1376KB)

138

访问

0

被引

详细

导航
相关文章

AI思维导图

/