面向数据不平衡的社交机器人检测框架

张诗博 ,  陈鸿昶 ,  刘树新 ,  刘书文 ,  张荣

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (06) : 731 -739.

PDF (3686KB)
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (06) : 731 -739. DOI: 10.3969/j.issn.1671-0673.2025.06.014
网络空间安全

面向数据不平衡的社交机器人检测框架

作者信息 +

A Social Bot Detection Framework for Data Imbalance

Author information +
文章历史 +
PDF (3773K)

摘要

针对基于传统图神经网络(GNN)的社交机器人检测方法在现实场景下面临数据不平衡问题,提出一种面向数据不平衡的多模态社交机器人检测框架。首先,整合用户语义与行为元数据等多模态特征,形成全面的用户表示。其次,设计具备局部-全局双重聚合机制的异质图神经网络(HGNN),有效捕捉结构与语义信息,实现对用户行为模式的深层刻画。最后,引入自适应代价敏感学习模块,通过动态调整训练过程中不同类别样本的损失权重,以缓解数据不平衡带来的模型偏差,显著提升对少数类的识别性能。实验证明,所提方法在多个真实数据集上优于现有方法,为机器人检测中的类别不平衡问题提供有效解决方案。

Abstract

To address the data imbalance issue faced by traditional graph neural network (GNN) based social bot detection methods in real-world scenarios, a multi-modal social bot detection framework specifically designed for imbalanced data is proposed. Firstly, user semantic and behavioral metadata are integrated to form a comprehensive user representation. Secondly, a heterogeneous graph neural network (HGNN) with a local-global dual aggregation mechanism is designed to effectively capture structural and semantic information, enabling deep characterization of user behavior patterns. Finally, an adaptive cost-sensitive learning module is introduced to dynamically adjust the loss weights of different class samples during training, thereby mitigating model bias caused by data imbalance and significantly improving the detection performance for minority classes. Experimental results show that the proposed method outperforms existing approaches on multiple real-world datasets, providing an effective solution to the class imbalance problem in bot detection.

Graphical abstract

关键词

异质图 / 代价敏感学习 / 社交机器人 / 多模态检测

Key words

heterogeneous graph / cost-sensitive learning / social bots / multi-modal detection

引用本文

引用格式 ▾
张诗博,陈鸿昶,刘树新,刘书文,张荣. 面向数据不平衡的社交机器人检测框架[J]. 信息工程大学学报, 2025, 26(06): 731-739 DOI:10.3969/j.issn.1671-0673.2025.06.014

登录浏览全文

4963

注册一个新账户 忘记密码

随着社交机器人等异常自动化程序的大量出现,对社交网络安全构成了严重威胁。社交机器人是由程序控制的自动化代理,可完全或部分模拟人类行为,在网络上从事各种恶意活动[1]。这类由算法程序控制的自动化账号从事包括虚假信息传播、舆论操纵和选举干预等恶意活动[2]。随着AI智能生成内容技术(Artificial Intelligence Generated Content, AIGC)的快速发展[3],社交机器人能更逼真地模仿人类互动。因此,提升社交机器人检测技术对保障网络信息准确性与公共安全至关重要。
研究人员已探索多种方法应对日益复杂的机器人伪装技术。传统方法主要依赖基于特征的手段,从用户信息和文本内容中提取数值和语义特征,以此区分机器人和真实用户[4]。然而,当面对先进的伪装技术和深度伪造技术时,这些方法往往存在显著的局限性,因为机器人能够轻易模仿真实用户的特征。为应对这一问题,一些研究开始转向基于社交网络拓扑结构的检测方法,其理论依据在于社交机器人通常呈现出与真实用户显著不同的连接模式,而图神经网络(Graph Neural Network, GNN)的崛起为这一领域提供了新的解决方案[5]。这类方法通过图论中的节点和边来表示社交网络中的用户及其相互关系,从而能够在检测过程中充分考虑到网络结构信息。例如,Ali等[6]首次将社交关系图构建为社交网络,结合账户的元数据特征,构建账户的初始特征,再通过多层图卷积神经网络学习社交图特征,最终输入分类网络进行分类。后续研究进一步对社交网络的异质性进行更深入的建模,并通过图卷积网络和关系图变换器等架构,提升模型的性能。
此外,Zhou等[7]提出的半监督初始残差关系注意力网络(Semi-supervised Initial Residual Relation Attention Networks, SIRAN),通过结合关系注意力机制和残差连接技术,增强了在异构社交图谱中区分不同类型节点的能力。文献[8]提出基于多视图图对比学习的检测算法,利用结构熵揭示层次化社区结构,并通过多任务学习方法增强对抗行为的鲁棒性。
近年来,多模态方法兴起[9],这类方法融合多种信息源检测社交机器人。例如,文献[10]通过专家混合机制,对不同类型的账户信息进行分析,并融合结果来判断账户是否为社交机器人。文献[11]则整合了文本和图模态,并采用基于文本—图相似度权重的交互模块,借助语义一致性模型检测高级社交机器人。
然而,真实社交网络普遍存在的数据不平衡问题,导致传统GNN检测方法对少数类样本的识别性能显著下降[12]。此外,鉴于社交网络节点与连接关系的多元异构特性,现有异构图分析方法多聚焦于关系内或关系间聚合的单一维度,未能实现两种聚合机制的协同优化,难以充分挖掘复杂网络结构蕴含的深层信息。为应对上述挑战,本研究提出一种基于局部—全局双重聚合机制与代价敏感学习的多模态社交机器人检测框架,以应对真实社交场景下的数据不平衡问题。

1 面向数据不平衡的社交机器人检测

本文提出基于面向数据不平衡的多模态社交机器人检测框架。如图1所示,该框架由多模态用户特征编码器、基于双重聚合的异构图编码、自适应代价敏感学习组成。

首先,通过提取并融合用户发布文本语义与行为元数据等多模态特征,形成全面的用户表示。其次,通过基于双重聚合机制的异构图神经网络(Heterogeneous Graph Neural Network, HGNN),有效融合网络拓扑结构与用户多模态特征,实现对全局与局部信息的全面捕捉。最后,设计了一种自适应的代价敏感学习模块,通过动态调整训练过程中不同类别样本的损失权重,以缓解数据不平衡带来的模型偏差。

1.1 问题陈述

检测社交机器人的任务可被构建为一个节点分类问题。设G=(V,U,E,Y)表示一个异构图,其中V={v1,v2,,vn}是用户节点集合,U={u1,u2,,un}表示这些节点对应的特征向量。每个ui包含多模态属性,包括数值数据、分类信息、推文内容和用户资料详情。边集E={ErrR}包含多种类型的关系,其中R表示关系类型的集合,例如关注、朋友、转发、评论、提及关系,每种关系r由邻接矩阵Ar{0,1}n×n表征。这里,Aijr=1表示从节点vi到节点vj存在一条类型为r的有向边。集合Y={y1,y2,,yn}包含真实标签,其中yi{0,1}yi=0表示人类用户(正样本),yi=1表示社交机器人(负样本)。目标是通过最小化预测标签y^i与真实标签之间的差异,准确预测标签y^i,从而有效识别社交机器人。

1.2 多模态用户表示

准确刻画用户节点特征是异质图神经网络有效应用的基础,在社交机器人检测任务中尤为重要。用户节点特征包含多模态信息,主要有文本语义特征(如用户简介和帖子)以及行为元数据特征(如数值和布尔特征)。语义文本数据有助于分析用户的语言模式,用于检测内容层面的异常;而行为元数据特征则提供用户的行为统计,有助于捕捉违反常规行为的统计异常。

对于文本语义特征,设用户简介为p,帖子S={s1,,sM}M为帖子总数。文本编码过程使用RoBERTa[13]模型将用户简介文本转换为上下文嵌入:

hp=RoBERTap,hpRds×1

式中,ds是嵌入维度。通过一个带有可学习参数WpRd/4×ds、偏置bpRd/4×1的线性变换,以及Leaky-ReLU激活函数ϕ,得到用户简介表示:

tp=ϕWphp+bp,tpRd/4×1

对于每个帖子sm,以类似方式编码为hm=RoBERTasm,对所有帖子进行平均池化得到聚合表示:

hs=1Mm=1Mhm,hsRds×1

应用与用户简介相同的变换(参数为Ws,bs,得到帖子表示ts。通过拼接形成文本语义向量:

Ttext=Concattp;ts

对行为元数据特征,设数值特征为FRnf,布尔特征为G{0,1}ng,nfng为对应特征向量的维度。为处理特征噪声,对数值特征进行参数化变换:

F˜=σWfF

式中:σ是Sigmoid激活函数;Wf为可学习参数。布尔特征B˜以类似方式处理:

B˜=σWlB

式中,Wl为可学习参数。

最终的用户节点表示U将所有模态信息拼接起来:

U=Concat[F˜;B˜;Ttext]

这种编码方法有效利用了用户的多模态信息,生成具有判别性的节点表示。

1.3 双重聚合的异构图编码

本文提出一种双聚合消息传递机制,以高效处理不同类型的节点和边。与传统图卷积网络(Graph Convolutional Network, GCN)单一关系均值聚合和图注意力网络(Graph Attention Network, GAT)单一空间注意力机制不同,双聚合消息传递机制实现了多关系语义的层次化建模。局部聚合通过对每种关系类型内节点特征进行独立聚合,强化特定关系空间中语义表征强度。全局聚合则通过跨关系的信息融合捕获复杂的结构依赖。

1)局部聚合。局部聚合着重于整合每种关系类型内的节点特征,包括在图优化过程中提取的相似关系。关系内聚合能够有效对异常机器人节点的特征表示进行聚类。

对于关系子图GrG,采用均值聚合:

hintra=A˜UWr

其中,归一化邻接矩阵和度矩阵定义如下:

A˜r=Dr-1Ar;Dr=diagjN(r,i)Ar,ij.

式中:Nr,i为节点vi在关系子图Gr中的邻域;Wr是特定于关系的可学习参数矩阵。

2)全局聚合。全局聚合专注于整合不同关系类型间的节点特征,捕捉各种关系之间的交互。该环节参考了Simple-HGN[14]中的注意力机制进行全局聚合,关系间聚合增强了对图结构的整体理解。注意力系数计算如下:

α^ij=expLeakyReLUaTWUiWUjWrrψ(i,j)kN(i)expLeakyReLUaTWUiWUjWrrψ(i,k)

式中:WraT是可学习参数;ψ(i,j)表示节点ij之间的边类型;ψ(i,k)表示节点ik之间的边类型;式中分母表示对同一个中心节点i的所有邻居k进行遍历;Ni表示节点vi在全局的邻域。

注意力得分通过混合因子β[0,1]进行平滑处理,该因子结合了当前层和历史层的信息,l为层数:

αij(l)(1-β)α^ij(l)+βαij(l-1)

最终的节点表示通过多头注意力聚合,然后进行L2归一化得到:

hinter=Concatk=1KσjN(i)αijkWkhj+Wreskhi2

式中:K为多头注意力机制中注意力头的总数;αijk为第k头的注意力得分;Wk是第k头的可学习权重;Wresk为第k头的残差连接权重。

通过学习到的权重将局部特征和全局特征进行拼接:

h=σγhinter(1-γ)rRhintra

式中,γ是可学习的权重参数。

1.4 自适应代价敏感学习

非平衡图背景下,基于异质图编码获得的节点嵌入往往难以实现最优分类性能。为解决这一问题,本文引入一种自适应代价敏感机制,该机制根据样本类别属性对误分类施加差异化惩罚。

设计一个代价敏感损失矩阵C,该矩阵根据节点v的嵌入表示hv调整其分类概率pc(v)。针对二分类问题,误分类代价矩阵M的数学表达形式为

M=M00M01M10M11

代价敏感分类框架中,误分类代价矩阵M的元素Mij[0,)表示将类别i的样本错误分类为类别j所需承担的代价。Mij取值越大,表明对该类误分类行为的惩罚力度越强。

基于节点嵌入的类别概率通过以下代价敏感变换计算得到:

pc(v)=Mv,cexp(zv[c])c'Mv,c'exp(zv[c'])

式中:Mv,c表示节点v与类别c相关联的误分类代价;zv[c]则代表节点v的嵌入向量hv在第c个维度上的分量值;zv[c']为第c'个维度的分量值。

本文在解决数据不平衡问题时的关键挑战在于,如何使模型能够根据动态变化的数据分布自适应地调整误分类代价。传统代价敏感学习方法通常依赖于静态的专家预设参数,例如固定的类别惩罚系数或基于初始数据分布定义的代价矩阵。这类方法虽能在特定分布下提升对少数类的识别,但由于缺乏对数据分布动态性的适应能力,在社交机器人检测这类数据分布持续演变的场景中表现受限。为此,本文提出一种自适应代价敏感学习机制,通过整合3个关键矩阵来动态调整误分类代价。

1)数据分布直方图矩阵H,有:

H(i,j)=max(histo(i),histo(j)),ij;histo(i),i=j.

式中:histo(i)表示类别i的直方图分布。该矩阵能够有效捕捉类别分布的不平衡性,为代价敏感学习提供依据。

2)全局离散度矩阵D。类内离散度矩阵Dintra和类间离散度矩阵Dinter的计算公式如下:

Dintra=1nii=1kj=1ni(xi,j-mi)(xi,j-mi)T;Dinter=i=1K(mi-m)(mi-m)T.

式中:xi,j表示类别i中第j个样本的嵌入向量;mi表示类别i的平均嵌入向量;ni表示类别i的样本数量。最终的归一化离散度矩阵定义为

D=DintraDinter

D值越小,类别的聚类效果和分离度越好。

3)混淆矩阵R

R(i,j)=vy^v=j,yv=i|V|

式中:y^v=argmaxcpc(v)表示样本v的预测类别;yv表示其真实标签。

优化目标是通过Hadamard乘积和高斯核函数将这些矩阵进行组合:

T=θH°D°R

式中,θ为超参数。目标代价矩阵与当前代价矩阵之间的损失函数计算如下:

Lcost(M,T)=12T-M22+Eval(ξ,M)

式中,Eval表示在当前模型参数ξ下的验证误差,即验证集上的误分类率。

代价敏感学习中的一个关键挑战在于代价矩阵M的初始化。传统的权重初始化方法存在若干不足:首先,与神经网络参数相比,M的维度显著较小,使得基于随机化的方法效果不佳;其次,这些方法无法与少数类偏差校正的核心目标相匹配。

为克服这一局限,提出了一种基于不平衡感知的初始化策略。M的初始值根据类别不平衡比例NIR(定义为少数类与多数类样本数量之比)计算得出。具体而言,对NIR的倒数施加对数变换ln(1+1/NIR),从而确保初始代价值的无偏性。最优代价矩阵通过最小化以下目标函数获得:

M*=argminLcostM,T

梯度更新方向由下式给出:

Lcost(M,T)=(va-vb)(va-vb)T=-(va-vb)IT

式中:va=vec(T)为目标代价矩阵展开的向量;vb=vec(M)表示当代价矩阵M展开成的向量;I为单位矩阵。在调整代价矩阵后,损失函数更新为

L=-vVyvlog2(pc(v))

2 性能评估

2.1 数据集

本文在3个广泛使用的社交机器人基准数据集上进行实验评估:Cresci-15[15]、Twibot-20[16] 和MGTAB-22[17]表1详细展示了各数据集的基本统计特征。其中,Cresci-15和Twibot-20包括关注和朋友关系,MGTAB-22包括关注、朋友、转发、评论、提及等7种用户间的关系。

2.2 实验设置

为保障实验可复现性,模型超参数配置详见表2。训练阶段采用Adam优化器,并引入Dropout正则化以抑制过拟合,提升泛化能力。

为保持与既有研究的可比性,数据划分方案严格遵循基准测试中的既定设置。算法基于PyTorch框架实现,实验环境为Linux服务器,硬件配置包括GeForce RTX 3090 GPU、64 GB内存及Intel(R) Xeon(R) Gold 5218 CPU@2.30 GHz(16核)。

为全面评估本文方法的性能,将其与几种先进的社交机器人检测技术进行对比。对比算法包括一般的基于图的算法,如GCN[18]、GAT[19]、马尔可夫驱动图卷积网络(Markov-Driven Graph Convolutional Network, MDGCN)[20]、图采样与聚合(Graph Sample and Aggregate, GraphSAGE)[21]和过采样图神经网络(Over-Sampling Graph Neural Network, OSGNN)[12]等方法。

此外,对比算法还包括考虑图异质性的算法,如异质图卷积网络(Heterophily Graph Convolutional Network, H2GCN)[22]、通用PageRank图神经网络(Generalized PageRank Graph Neural Network, GPR-GNN)[23]、超越低频信息的图卷积网络(Frequency Adaptive Graph Convolutional Network, FAGCN)[24]、自适应通道混合图卷积网络(Adaptive Channel Mixing Graph Convolutional Network, ACMGCN)[25]、结构熵引导的多视图对比学习社交机器人检测(Structural Entropy Guided Multi-view Contrastive Learning for Social Bot Detection, SEBOT)[8]、基于关系图卷积网络的推特机器人检测(Twitter Bot Detection with Relational Graph Convolutional Network, BotRGCN)[26]和关系图Transformer(Relational Graph Transformer, RGT)[27]方法。

2.3 实验结果

实验采用准确率与F1分数作为核心评价指标,其中准确率衡量整体分类的正确率,而F1分数则综合考察模型在少数类样本上的查准率与查全率。完整的实验结果如表3所示。由表3可得,本文方法在Cresci-15、Twibot-20和MGTAB-22数据集上分别取得了98.12%、89.01%和91.31%的准确率,表现出卓越性能。

对比分析表明,传统同构图GNN方法(如GCN、GAT、MDGCN)在简单数据集表现良好,但在复杂场景下性能显著下降。而异构图模型(如RGT、H2GCN、FAGCN、ACMGCN、SEBOT)对数据分布变化具有更强鲁棒性,在社交机器人检测任务中优势明显,这验证了多关系图架构的有效性。

然而现有方法在面对数据不平衡问题时仍存在明显局限。OS-GNN通过为少数类节点生成特征空间来缓解类别不平衡,但由于其依赖同质图结构且未考虑深度伪装,性能提升有限。相较之下,本文方法融合了针对数据拓扑不平衡的自适应代价敏感学习与双重聚合的机制,在复杂场景中展现出更强的泛化能力和稳定性。

本文方法的计算复杂度主要来自异构图编码和代价敏感学习模块。异构图编码中,局部聚合复杂度为O(rEd2)r为关系总数,E为边的总数,d为特征维度;全局聚合为O(KEd2)K为多头注意力机制中注意力头。代价敏感学习的自适应优化复杂度为O(VdC2)V为节点总数,C为矩阵维度。通过批处理和并行计算可优化实际运行效率。该框架在保持合理复杂度的同时,通过双重聚合与自适应代价敏感学习的协同作用,在数据不平衡场景下展现出优越的泛化性能。

2.4 消融实验

本文方法的性能通过系统地移除关键组件来评估,包括w/o CS(自适应代价敏感学习)、w/o LA(局部聚合)和w/o GA(全局聚合)表示。如图2所示,完整模型性能显著优于所有简化版本,去除任一组件均会导致模型性能下降,这一现象有力地验证了模型设计的有效性。

图2可得,移除全局聚合(GA)模块会导致最显著的性能衰减,凸显跨关系聚合机制在异质图学习中的核心作用。去除局部聚合(LA)模块后,模型无法通过关系特异性聚合有效聚合同一关系内节点的特征,从而对整体性能产生负面影响。成本敏感(CS)策略的缺失削弱了模型处理类不平衡的能力,导致准确性降低。系统性实验结果表明,本文方法的各个组件通过协同作用共同提升了社交机器人检测任务的性能,其中全局聚合模块对模型性能的贡献度最为显著。

为评估不同模态对模型性能的影响,分别移除用户属性、语义内容及网络拓扑信息,并将消融模型与完整架构进行对比,如图3所示。

多模态融合策略显著优于单一模态,通过特征整合大幅提升检测准确率。任一模态的缺失均会导致性能下降,且不同模态的影响因数据集而异:在Twibot-20中,元数据对检测效果起决定作用;MGTAB-22更依赖文本中的语义信息;Cresci-15主要受益于拓扑结构特征。这一现象表明,社交机器人可能采用差异化的特征伪装策略,进一步验证了多模态融合对于提升模型鲁棒性与检测精度的重要性。

为进一步探讨不同关系对检测效果的影响,针对Cresci-15和Twibot-20数据集中的关注关系和朋友关系进行消融实验。对于MGTAB-22数据集,则消融了关注、朋友、转发和评论4种主要关系。实验结果显示,在Cresci-15和Twibot-20数据集中,好友关系占比最大,因此在消融过程中对检测结果的影响也最为显著,检测效果下降约2%左右。而在MGTAB-22数据集上,关注和朋友关系的占比最高,消融后的检测效果下降约1.5%,转发和评论的消融导致的效果下降约为1%。

2.5 可视化

为更有效地展示实验结果,采用t-SNE方法对MGTAB-22数据集进行可视化。t-SNE的主要目的是对高维数据进行降维,并将其投影到二维平面上,以便于观察数据分布。在t-SNE可视化中,不同类别的数据点之间距离较大,且边界清晰,这表明分类性能优异。如图4所示,本文方法成功区分了真实用户和社交机器人,分类边界更加清晰。相比之下,其他基线方法的数据点存在相当大的重叠部分,凸显了本文方法在区分这两类数据方面具有更高的有效性。

2.6 敏感性分析

图5对MGTAB-22数据集中关键超参数β(用于全局聚合的混合因子)、γ(权重参数)进行性能分析。

实验结果表明,βγ的参数变化对模型性能影响较小,模型在不同设定下均保持稳定表现,但γ在0.7时表现最好,有效说明全局聚合的作用。

2.7 鲁棒性分析

社交机器人通过动态行为模拟与优化交互策略,能够高度拟真地复现真实用户特征,有效隐匿其身份特征,从而对检测系统构成严峻挑战。为评估检测模型的鲁棒性,采用对抗学习对本文框架进行压力测试。测试结果如表4所示。

本次选取两种针对性攻击策略:一是针对节点属性与网络拓扑双重攻击的灰盒方法Metattack;二是专注于网络结构的白盒技术PGD。实验基于高质量MGTAB数据集开展,充分利用其标注节点优势。由表4可得,在对抗条件下所有方法的检测准确率和F1值都有所下降。然而,尽管受到这些扰动的影响,本文所提框架也展示了卓越的鲁棒性,其检测性能降低的最少。

3 结束语

针对社交机器人检测中普遍存在的数据不平衡问题,提出一种基于双重聚合机制与自适应代价敏感学习的检测框架。该框架通过双聚合机制有效融合节点间类型内与类型间的结构语义信息,显著增强了复杂关系建模能力;同时引入的自适应代价敏感学习策略能够根据实时数据分布动态调整分类边界,从而在模型层面根本性解决类别不平衡带来的识别偏差问题。在多个基准数据集上的实验结果表明,本文方法在准确性和鲁棒性方面均优于现有方法。然而,本文提出的框架在标注数据依赖性方面仍存在局限。未来将探索无监督预训练方法,通过自监督学习从海量未标注数据中提取通用特征,以降低标注成本的同时增强对未知类别社交机器人的检测能力,进一步提升模型的实际应用价值。

参考文献

[1]

卢昊宇,刘峰,王博雅,.基于链接预测匹配的动态社交机器人检测方法[J].信息工程大学学报202425(3):285-291.

[2]

CUI LSEO HTABAR Met al. Deterrent: knowledge guided graph attention network for detecting healthcare misinformation [C]∥Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York,USA: ACM, 2020:492-502.

[3]

隋然.网络空间安全与人工智能研究综述[J].信息工程大学学报202122(5):584-589.

[4]

ILIAS LROUSSAKI I. Detecting malicious activity in Twitter using deep learning techniques[J]. Applied Soft Computing2021,107:No.107360.

[5]

LI Y YJI Y PLI S Net al. Relevance-aware anomalous users detection in social network via graph neural network[C]∥Procecdings of the 2021 International Joint Conference on Neural Networks. Piscataway, USA: IEEE, 2021:1-8.

[6]

ALHOSSEINI S ALITAREAF R BINNAJAFI Pet al. Detect me if you can: spam bot detection using inductive representation learning[C]∥Proceedings of the 2019 World Wide Web Conference. New York,USA: ACM, 2019:148-153.

[7]

ZHOU MFENG W ZZHU Y Fet al. Semi-supervised social bot detection with Initial residual relation attention networks[C]∥Procecdings of the Machine Learning and Knowledge Discovery in Databases: Applied Data Science and Demo Track. Cham, Switzerland: Springer, 2023:207-224.

[8]

YANG Y GWU QHE B Yet al. SEBot: structural entropy guided multi-view contrastive learning for social bot detection[C]∥Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2024:3841-3852.

[9]

唐永旺,刘会景,靳彦青,.基于Transformer的时序多模态融合特征的异常网络流量检测方法[J].信息工程大学学报202324(4):468-474.

[10]

LIU Y HTAN Z XWANG Het al. BotMoE: twitter bot detection with community-aware mixtures of modal-specific experts[C]∥Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA: ACM, 2023:485-495.

[11]

LEI Z YWAN H RZHANG W Qet al. BIC: Twitter bot detection with text-graph interaction and semantic consistency[C]∥Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics. Stroudsburg, USA: ACL, 2023:10326-10340.

[12]

SHI S HQIAO KCHEN Cet al. Over-sampling strategy in feature space for graphs based class-imbalanced bot detection[C]∥Proceedings of the ACM Web Conference 2024. New York, USA: ACM, 2024:738-741.

[13]

LIU Y, OTT M, GOYAL Net al. RoBERTa: a robustly optimized BERT pretraining approach[DB/OL].(2019-07-26)[2025-11-25].

[14]

LYU Q SDING MLIU Qet al. Are we really making much progress?: revisiting, benchmarking and refining heterogeneous graph neural networks[C]∥Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York, USA: ACM, 2021:1150-1160.

[15]

CRESCI SDI PIETRO RPETROCCHI Met al. Fame for sale: efficient detection of fake Twitter followers[J]. Decision Support Systems201580:56-71.

[16]

FENG S BWAN H RWANG N Net al. TwiBot-20: a comprehensive twitter bot detection benchmark[C]∥Proceedings of the 30th ACM International Conference on Information & Knowledge Management. New York, USA: ACM, 2021:4485-4494.

[17]

SHI S HQIAO KLIU Z Het al. MGTAB: a multi-relational graph-based Twitter account detection benchmark[J]. Neurocomputing2025,647:No.130490.

[18]

SHA A SWANG BWU X Fet al. Semi-supervised classification for hyperspectral images using edge-conditioned graph convolutional networks[C]∥Proceedings of the 2019 IEEE International Geoscience and Remote Sensing Symposium. Piscataway, USA: IEEE, 2019:2690-2693.

[19]

VELIČKOVIĆ PGUILHEM CARANTXA Cet al. Graph attention networks [DB/OL].(2017-10-30)[2025-11-25].

[20]

DENG L YWU C WLIAN D Fet al. Markov-driven graph convolutional networks for social spammer detection[J]. IEEE Transactions on Knowledge and Data Engineering202335(12):12310-12322.

[21]

HAMILTON W LYING RLESKOVEC J. Inductive representation learning on large graphs [DB/OL].(2017-06-07)[2025-11-25].

[22]

ZHU JYAN Y JZHAO L Xet al. Beyond homophily in graph neural networks: current limitations and effective designs[DB/OL].(2020-06-20)[2025-11-25].

[23]

CHIEN EPENG J HLI Pet al. Adaptive universal generalized pagerank graph neural network[DB/OL].(2020-06-14)[2025-11-25].

[24]

BO DWANG XSHI Cet al. Beyond low-frequency information in graph convolutional networks[C]∥Proceedings of the 35th AAAI Conference on Artificial Intelligence. Palo Alto, USA: AAAI Press, 202135(5):3950-3957.

[25]

LUAN S THUA C QLU Q Cet al. Revisiting heterophily for graph neural networks[DB/OL].(2022-10-14)[2025-11-25].

[26]

FENG S BWAN H RWANG N Net al. BotRGCN: Twitter bot detection with relational graph convolutional networks[C]∥Proceedings of the 2021 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. New York, USA: ACM, 2021:236-239.

[27]

FENG S BTAN Z XLI Ret al. Heterogeneity-aware twitter bot detection with relational graph transformers[C]∥Proceedings of the 36th AAAI Conference on Artificial Intelligence. Palo Alto, USA: AAAI Press, 202236(4):3977-3985.

基金资助

嵩山实验室项目(纳入河南省重大科技专项)(221100210700-02)

AI Summary AI Mindmap
PDF (3686KB)

100

访问

0

被引

详细

导航
相关文章

AI思维导图

/