自适应的邻接关系:去相关图方法在下个兴趣点推荐的应用

王世杰 ,  李艳红 ,  徐昊翔 ,  张法

中南民族大学学报(自然科学版) ›› 2026, Vol. 45 ›› Issue (02) : 191 -201.

PDF (2272KB)
中南民族大学学报(自然科学版) ›› 2026, Vol. 45 ›› Issue (02) : 191 -201. DOI: 10.20056/j.cnki.ZNMDZK.20250831
物理与电子信息科学

自适应的邻接关系:去相关图方法在下个兴趣点推荐的应用

作者信息 +

Adaptive adjacency relationships: Application of decorrelated graph methods in next POI recommendation

Author information +
文章历史 +
PDF (2326K)

摘要

下个兴趣点(POI)推荐在社交网络服务中扮演了相当重要的角色,它的任务是基于用户的历史访问足迹,预测用户在下个时刻最可能访问的POI.现有方法普遍使用预定义图的方式为POI构建关系图,仅有少量的工作对自适应图方法进行研究,而自适应图表示学习能学习到更具潜在意义的图结构,使得图神经网络(GNN)后续的传播过程能够学习到更有意义的邻接关系,从而得到更有价值的POI嵌入,使得下游的序列建模任务能够更好捕获到POI之间的潜在关系.然而现有工作对自适应图的研究仍处于较为初步的阶段.为下个POI推荐任务提出了去相关图表示增强的注意力网络(DGRAN).此外,还探讨了自注意力机制与自适应图学习之间的关系,为该领域的自注意力方法加入额外残差连接以加大梯度,保证自适应图结构高质量更新.在两个真实数据集上的结果证明所提出的方法超越了现有最先进基线的性能.

Abstract

The task of next Point-of-Interest (POI) recommendation plays a significant role in social networking services. Its goal is to predict the next POI that a user is most likely to visit, based on their historical check-in records. Existing methods generally construct relational graphs for POIs using predefined graphs, while only a few studies have explored adaptive graph approaches. Adaptive graph representation learning can capture more meaningful graph structures, enabling the subsequent propagation process in Graph Neural Networks (GNNs) to learn more significant adjacency relationships, and thus obtain more valuable POI embedding. This enables downstream sequence modeling tasks to capture potential relationships between POIs better. However, research on adaptive graphs remains in its early stages. In this paper, we propose a Decorrelated Graph Representation-enhanced Attention Network (DGRAN) for the next POI recommendation task. Additionally, this paper explores the relationship between the self-attention mechanism and adaptive graph learning, introducing extra residual connections to self-attention methods in this field to increase the gradient and ensure the hight quality updates of the adaptive graph structure. Results on two real-world datasets demonstrate that the method of this paper outperforms state-of-the-art baselines.

Graphical abstract

关键词

下个兴趣点推荐 / 自适应图 / 额外残差连接

Key words

next POI recommendation / adaptive graph / extra residual connections

引用本文

引用格式 ▾
王世杰,李艳红,徐昊翔,张法. 自适应的邻接关系:去相关图方法在下个兴趣点推荐的应用[J]. 中南民族大学学报(自然科学版), 2026, 45(02): 191-201 DOI:10.20056/j.cnki.ZNMDZK.20250831

登录浏览全文

4963

注册一个新账户 忘记密码

随着移动设备的普及,用户在Foursquare、Gowalla等基于位置的社交网络(Location-Based Social Networks,LBSNs)上产生了大量的兴趣点(Point-of-Interest,POI)访问信息,如商场、酒吧等.这些平台为了提升用户体验1,致力于提供更精准的推荐服务,因此POI推荐成为了研究的重点.下个POI推荐,作为POI推荐的一种特殊形式,主要通过分析用户的历史签到数据和当前位置信息,捕捉用户兴趣的动态变化,从而为用户提供更加个性化的推荐2-4.该任务的特点在于,它受到时间和地理因素的双重影响5-6.
早期的研究针对个性化推荐方法进行了广泛的探索,最初的模型主要集中于捕捉序列中元素之间的关系变化,通常采用传统方法,如马尔可夫链和矩阵分解等.随着深度学习的兴起,基于循环神经网络(Recurrent Neural Network,RNN)的方法也开始被引入下个POI推荐领域.然而,经典的RNN结构(包括传统RNN和长短期记忆网络LSTM)尽管在自然语言处理领域表现出色,但是对于POI推荐任务而言,它们并不能很好地把握时间和空间依赖关系.为此,研究者们尝试引入时间和空间等辅助信息,或者通过增加辅助任务和调整损失函数来提升推荐效果7-9.后来伴随着Transformer的横空出世,人们意识到自注意力机制在建模序列关系时的强大能力,使得许多学者转向研究自注意力网络在下个POI推荐任务中的应用10-12.
最近,基于图的方法受到了广泛关注13-14,特别是图神经网络(Graph Neural Network,GNN)在POI表示学习中的潜力备受瞩目.近期的研究15-16主要通过用户的签到序列构建图结构,从而进行POI表示学习.尽管这种方法能够生成质量较高的POI嵌入,但预定义的图结构往往受制于人为因素.这一问题促使了自适应图方法的出现17.自适应图方法继承了GNN中的邻居聚合和非线性变换思想,将邻接矩阵的构建过程交由POI嵌入来完成.这种方法在模型的学习过程中动态地生成图结构,从而提升学习到的POI嵌入质量.
尽管自适应图方法在一定程度上取得了良好的效果,但在缺乏明确指导的情况下,生成的POI嵌入往往不够理想.此外,作为图神经网络的一种,自适应图方法难以避免GNN自身的两个核心问题——过平滑18和过相关19,如何有效地缓解这两个问题,仍是当前面临的关键挑战.
另一方面,作为一种序列任务,无论将POI嵌入输入RNN类模型还是自注意力类模型,都不能忽视POI图结构学习与下游模型之间的联系.WANG等17的研究中,将POI嵌入直接用于扩展的自注意力机制.然而,这种简单的组合方式忽略了反向传播中从注意力模块传递至自适应图模块的梯度关系.由于这一缺陷,在多次前向传播和反向传播的过程中,自适应图模块难以学习到更优的图结构,从而无法生成更高质量的POI嵌入,最终导致注意力模块的预测效果未达到最佳水平.
为了解决上述问题,本文为下个POI推荐任务提出了去相关图表示增强的注意力网络(Decorrelated Graph Representation-enhanced Attention Network,DGRAN).为了在图学习的过程中减少人为因素的影响,本文通过探索图结构学习18提出去相关的自适应图方法,以在下个POI推荐任务中建模POI之间的复杂的地理依赖关系,从而学习富有表达能力的POI嵌入.具体来说,本文为简单GCN图卷积网络(Simple Graph Convolutional Network,SGCN)19重新构造了自适应邻接矩阵,然后将其每一层看作单独的图降噪过程,修改其前向传播的方法;接着,本文在做序列建模时,为注意力模块加入了额外的残差连接,使得反向传播时能为自适应图模块提供更大的梯度,进一步提升POI嵌入的质量.对两个真实世界LBSN数据集的研究表明,DGRAN优于最先进的基线方法.
本文的主要贡献如下:
(1)本文提出使用去相关的自适应简单图神经网络来学习POI;
(2)本文提出了DGRAN模型,在扩展的注意力网络中加入了额外的残差连接,阐释了注意力网络和自适应图网络之间的梯度关系,使得自适应图网络能够更有效地训练POI嵌入;
(3)在两个真实世界LBSN数据集上执行了实验,结果表明本文提出的DGRAN模型在下个POI推荐任务中超出了SOTA基线模型的性能.

1 相关工作

本节将简要介绍下个POI推荐以及图结构学习这两方面的工作.

1.1 下个POI推荐

下个POI推荐基于用户的历史签到数据,为用户推荐下一个可能访问的POI.早期的工作主要是基于矩阵分解和马尔科夫链.CHENG等4使用了矩阵分解技术为每个用户学习一个个性化的过渡矩阵,这种方法并不能够有效处理高阶的序列模式,并且在处理未观测到的数据时难以为其分配转变概率.FENG等2使用度量嵌入方法将POI映射到低维欧氏空间,通过欧氏距离来度量POI之间的相似度,这种映射方式并不能很有效地建模POI之间复杂的关系,使用过程也不能充分捕获用户的访问模式以及兴趣的变化.随着技术的更迭,包括RNN以及自注意力网络在内的深度学习模型被认为是更有效的序列建模方法.因此后续的学者们尝试对这两大类基础方法进行修改,以达到更高质量的推荐效果.LIU等8通过计算两个连续访问之间的时间和空间间隔,将其加入RNN以更好地建模连续访问的关系.HUANG等11通过将时间作为相似性判别方法进行显式的注意力计算,以此为注意力权重聚合LSTM的结果.

LIAN等12将地理坐标编码送入自注意力网络以构建位置关系,将该模块整合到Transformer上,以获得签到序列点对点的交互信息.LUO等10显式计算了所有签到之间的时空距离,通过一个双层注意力结构来考虑个性化项的频次.QIN等20使用频域的自相关方法捕获子序列之间的关系.但是这些基于序列的方法都是直接将POI转化为嵌入,忽视了对POI嵌入质量的追求,这就会导致下游任务在这种质量不高的嵌入上不能很好地把握用户偏好的变化.

近期的工作尝试使用图表示学习方法构建更具表达性的POI表示.LI等13通过图注意力网络将POI的嵌入以及类别信息的表示一同加入学习,从而生成具有类别信息的嵌入表示.YANG等21构建了一个全局的轨迹流图,然后以此为基础通过GCN来学习拓扑信息.RAO等16对图的权重做了进一步研究,除节点之间的连接性外,构建了富含多种关系的图结构,然后使用GCN学习其中的转变关系.尽管有了这些使用图神经网络的方法,但是如何构建一个高质量的图仍未被充分研究.YIN等22使用知识图谱的方法在复数域提取POI之间的关系,通过聚类方法来动态构建图结构.WANG等17设计了一种图结构随模型训练而更新的自适应图,通过这种结构来补充未被观测到的访问关系并去除噪声信息,进而学习到更具表达能力的POI嵌入.总的来说,基于预定义图的方法需要很多的领域知识才能达到不错的效果,图结构学习的方法却需要设计复杂的关系映射手段和结构选择方法,导致图的设计过于冗余.

1.2 图神经网络中的图结构学习

图神经网络(GNN)在许多监督、半监督以及零样本学习任务下大放异彩,GNN的成功主要得益于它的消息传播机制23,归根结底是邻接矩阵的设计,因此优秀的图结构的设计有助于图表示的学习.对于推荐任务而言,节点的异质性对于图结构设计而言是一个较大的挑战.目前预定义图的设计方案仍旧占据主导地位1624-26,仅有少数方法1727采用了图结构学习的思路.本文使用简化的图学习方案,并将图降噪方法融入其中,从而减少对先验知识的依赖.

2 准备工作

本节给出问题定义以及要进行改进的功能模块.

2.1 问题定义

定义1(签到序列) 令U={u1,u2,,um}表示所有的用户,L={l1,l2,,le}表示所有POI,其中每个POIli都与一个独一无二的地理坐标(longi,lati)相关联.每个用户的签到记录ruk-tq可以表示为三元组(uk,lzuk,tq),表示用户uk在时刻tq访问了POIlz.用户uk的签到序列可以表示为R(uk)={ruk-t1,ruk-t2,,ruk-tCuk}.

定义2(下个POI推荐) 给定一个用户uk以及他从时刻t1tq的签到序列R(uk),下个POI推荐任务的目标是基于他的历史轨迹产生下个时刻tq+1时该用户最有可能访问的top-k POI列表.

2.2 简单图卷积网络

本文使用了SGCN23.对于一个无向图G=(V,E,A),其中V,E,AN×N分别表示顶点集、边集、邻接矩阵,以此为基础的GCN第l层向后的传播规则为:

Hl+1=σD˜-12A¯D˜-12HlWl,

其中σ表示激活函数,A¯=A+IN×N表示加入自连接的邻接矩阵,D˜i,i=jNA¯i,jWl是可学习的矩阵.令A˜=D˜-12A¯D˜-12,SGCN将GCN传播规则线性化:

Y=A˜A˜···A˜H0W0W1···Wl=A˜lH0W,

与传统GNN不同的是,它直接构造了输出Y,而非定义每一层的传播过程,在将SGCN与GCN相对应时,可以将SGCN的传播过程视作:

Hl+1=A˜Hl,

值得注意的是,H(l+1)不是最后的输出,当需要用到SGCN的最后结果时,需要对Hl+1做一次无偏置项的线性变换.

2.3 时空间隔感知的自注意力机制

WANG在LI等提出的时间感知自注意力28的基础上拓展了空间信息17.对于某个用户uk,假定他的签到序列为R(uk)={ruk-t1,ruk-t2,,ruk-tn},计算该签到序列中任意两个访问之间的时间、空间间隔矩阵Mt,ukRn×nMs,ukRn×n,分别将这两组矩阵投影为两个嵌入矩阵EtK,uk,EtV,ukRn×n×dEsK,uk,EsV,ukRn×n×d.将用户序列中的每个POI转化为嵌入表示eiuiRd.用户uk的序列经过注意力模块的聚合结果hiuk为:

hiuk=j=1iαijejukWV+ei,jtV,uk+ei,jsV,uk+pj,

其中WVd×d是可学习的矩阵,ei,jtV, ukdEtV, uk的第i行第j列元素,ei,jsV, ukdEsV, uk的第i行第j列元素,pj是第j个位置的位置嵌入.αij表示注意力系数,它的计算方式如下:

αij=exp aijk=1iexp aik,
aij=LNeiukWQejukWK+ei,jtK,uk+ei,jSK,uk+pjd,

其中LN(·)代表层归一化(Layer Normalization)操作,WQ,WKd×d是可学习矩阵,etK,ukdEtK,uk的第i行第j列元素,esK,ukdEsK,uk的第i行第j列元素.

3 提出的方法

DGRAN模型的结构图如图1所示,可分为两部分:(1)去相关图学习模块.首先是将简单图设计成自适应的结构,然后再加入去相关方法修改图的传播过程;(2)具有额外残差连接的自注意力聚合模块,这部分在2.3节的注意力机制上添加了额外的残差连接.

3.1 去相关图学习

作为POI推荐领域提出并使用自适应图的先驱,WANG等17在构造图的时候沿袭了前人的度量方法以及设计模式(包括生成邻接矩阵时的权重矩阵、图的稀疏化以及用平均池化的方法缓解过平滑问题)27,并为图表示学习设计了额外的正则化方法.但他们的方法仍旧有些复杂,因此本文使用了一种更简单直接的思路来解决这些问题.

3.1.1 自适应简单图构建

在构造图结构之前,需要先为所有POI初始化嵌入EN×d以便于后续POI之间关系的学习.紧接着便是图结构的构建.在构造自适应图时,选择哪种距离度量方法构造邻接矩阵是首要问题.跟随现有的工作1727,本文选择余弦相似度作为度量方法,但与他们不同的是,本文舍弃了权重矩阵W,直接计算POI嵌入之间的距离.邻接矩阵的每一项Ai,j计算方式如下:

Ai,j=cosei,ej,

其中cos(·,·)表示计算两个向量之间的余弦相似度.注意,Ai,j [-1, 1],负数作为权重是不合理的.因此现有工作会选择某个值作为阈值来筛选不合理的数值,比如WANG等17选择了0,相当于在每个数值上使用了Relu函数,这会导致一部分邻接矩阵的元素无法反向传播,限制了POI嵌入的梯度大小,因此本文使用Sigmoid函数将其映射到[0,1],严谨地来说是[11+e-1,11+e1],由于[-1, 1]输入的范围避开了Sigmoid的饱和区间,那么当反向传播梯度流经邻接矩阵时,也不太容易出现梯度爆炸或梯度消失问题,这时候邻接矩阵可以表示为:

A=SigmoidcosE,E,

其中Sigmoid(·)表示逐元素的Sigmoid计算,本文用cos(A,B)表示先对矩阵AB进行行归一化得到ArnBrn,然后进行矩阵乘法ArnBrn.在后续的图传播过程中,本文仍保持A¯=A+I的做法,其中I是单位阵,以加强顶点自身的信息.

3.1.2 去相关方法

仅通过上述环节构造的图,效果显然是不够的,因为它失去了非线性激活,而且也没有一个可靠的方法指引它的学习过程,还会面临过平滑问题与过相关问题,这就会导致它学到低质量的POI嵌入.受到文[19]的启发,本文将SGCN的每层看作图降噪过程,通过将正交的正则化图信号降噪方法的梯度整合到图的传播过程中来提升学到的POI嵌入的质量.正交的正则化图信号降噪问题如下:

minE JE=12E-EinF2+λ12trEL˜E+λ24EE-IF2,

其中λ1,λ2是超参数.L˜=I-A˜=I-D˜-12(Sigmoid(cos(E,E))+I)D˜-12.使用公式(9)对SGCN逐层降噪时需要计算它对E的梯度,在对除了第0层以外的层求梯度时,公式如下:

JEE=El=El-Einl+λ1L˜El+λ2ElElEl-I,

但值得注意的是,公式(9)在对第0层的E求导时,L˜E0是有关的,公式(9)中第2项对E0的微分计算如下:

dtrEL˜EE=E0=dtrEI-A˜EE=E0=(dtrEE-dtrED˜-12SigmoidcosE,ED˜-12E-dtrED˜-1E)E=E0=(tr2EdE-2trED˜-12 SigmoidcosE,ED˜-12dE-trED˜-12 dSigmoidcosE,ED˜-12E-tr2ED˜-1dE)E=E0,

虽然上式并没有完全求解,但是可以看到其中复杂的矩阵乘法过程,值得注意的是矩阵ED的大小与POI的数目相关,所以在此直接求梯度就会成为一个相当耗费时间和空间的过程,本文建议直接忽略掉这一步,直接使用公式10来代替这一过程.

所以POI嵌入E在第0层的传播规则为:

El=El-1-γJEE=El-1=1-γ-γλ1-γλ2El-1+γEin+γλ1A˜El-1-γλ2El-1El-1El-1,

将SGCN看作逐层的单步图降噪,令Ein=El-1,修改后的传播规则为:

El=1-γλ1+γλ2El-1+γλ1A˜El-1-γλ2El-1El-1El-1,

为了避免梯度爆炸,本文在传播后对嵌入进行列归一化:

El=NormEl,

因此,当图具有lnum层时,去相关自适应简单图的做法是,先对输入E0K次带有列归一化的传播,然后做一次无偏置项的线性变换.经处理后的POI嵌入矩阵记为E˜N×d.

3.2 序列建模

在获得富有表达性的POI表示后,接下来介绍如何使用扩展的自注意力机制对用户的签到序列建模.

3.2.1 签到序列编码

下个POI推荐任务以用户的历史轨迹为依据来推测用户下个时刻最有可能访问的位置.首先将用户的访问足迹处理为固定长度n,如果长度大于n就截断,只保留最近的n条数据;如果长度小于n,那就向左填补直到长度为n.随后为处理后的访问序列R(uk)得到通过图方法获得的嵌入,将该序列的表示向量记为Ec(uk)={e˜1uk,e˜2uk,,e˜nuk},其中e˜iukE˜.

因为自注意力机制对位置先后顺序不敏感,所以此处使用了FOUMANI等29提出的绝对位置编码方式tAPE来感知位置信息:

pi2k=sin iωk,pi2k+1=cos iωk,ωk=10000-2kd×dn,

其中k在区间[0,d2]内,2k2k+1分别用于表示嵌入维度中偶数和奇数位置,n是序列长度,d是嵌入维度.该方法考虑了输入嵌入维度和长度,使得较低维度的嵌入在计算时也能正确表达距离关系.加入位置的用户访问序列记为Ec(uk)={e^1uk,e^2uk,,e^nuk}.

3.2.2 时空依赖编码

沿用WANG和LI等1728的方法,每个用户分别构建一个时间矩阵Mt, uk和空间矩阵Ms, uk,用于记录任意两个签到之间的时间间隔和空间间隔.对于两个矩阵中的元素,计算方式如下:

ti,juk=min tthr,tiuk-tjuktminuk,
si,juk=min sthr, haversineliuk,ljuk,

其中tminuk=min tiuk-tjuk,表示用户uk时间间隔的最小值.haversine(·,·)表示Haversine公式,用于计算两者之间坐标的距离.tthr, sthr分别代表时间间隔和空间距离的阈值,是超参数.在得到这些时间和空间关系之后,通过嵌入操作来分别获得两组嵌入矩阵EtK, uk,EtV, ukn×n×dEsK, uk,EsV, ukn×n×d.

3.2.3 扩展的自注意力模块

接下来展示如何使用处理好的序列信息以及时空上下文信息,即图1中的扩展的注意力模块.

WANG等16虽然在时空信息方面扩展了注意力机制,但是没有充分考虑自适应图与注意力模块的梯度关系.他们沿用了LI等28使用的自注意力模型,这是一种类似于Pre-LN型30Transformer的Encoder的实现形式,其中Attention表示时空间隔感知自注意力机制,图中简化了它原有的结构(具体的信息聚合过程没有画出,dropout层也被省去),FNN表示前馈神经网络.接下来的表述中,用“Attn”代替“Attention”,“LN”代替“Layer Norm”.假设输入为xd,该模块的输出Attnout可以表示为:

Attnout=FNNLNAttnLNx,x,x+LNx+LNAttnLNx,x,x+LNx,

上式对x的梯度为:

Attnoutx=FNNLNAttnLNx,x,x+LNxx+LNAttnLNx,x,x+LNxx,

值得注意的是,该结构内部较短的残差机制并不能给输入较大的梯度,受TAKASE等30的启发,本文在该模块中加入额外的残差机制,修改后自注意力模块的输出为:

Attnout=FNNLNAttnLNx,x,x+LNx+x+LNAttnLNx,x,x+LNx+x+x,

此时对x的梯度为:

Attnoutx=FNNLNAttnLNx,x,x+LNx+xx+LNAttnLNx,x,x+LNx+xx+I,

在反向传播时,更大的梯度值经过自注意力层传递到自适应图部分,能为自适应图习得更有效的POI嵌入,使得在下一轮前向传播时构建更优质的图结构.

此时注意力模块的处理过程为,将输入的用户签到序列Ec(uk)送入堆叠了N块的自注意力块:

xiuk=FNNLNAttnLNe^iuk,e^iuk,e^iuk+LNe^iuk+e^iuk+LNAttnLNe^iuk,e^iuk,e^iuk+LNe^iuk+e^iuk+e^iuk,e^iuk=xiuk,

其中i[1,n]. 将第N块的输出结果进行层归一化,得到扩展的自注意力模块的结果:

hiuk=LNxiuk.

3.3 预测和优化

3.3.1 模型预测

经过扩展的自注意力模块处理后得到的输出为H(uk)={h1uk,h2uk,...,hnuk},该序列充分捕获了用户的长期依赖和短期兴趣转变的倾向,因此当前用户在时刻t+1时对每个POI ll的兴趣分数可以通过如下方式计算:

y^t+1,luk=exp htuke˜lj=1|L|exp htuke˜j,

其中e˜i表示E˜的第i行,是通过去相关图学习方法得到的POI嵌入,htuk表示用户uk在时刻t的兴趣状态.在推荐评估阶段,根据兴趣分数为当前用户排列出他可能访问的POI,得到一个top-k列表.

3.3.2 模型优化

本文采用交叉熵损失函数来度量预测POI与目标POI之间的距离:

rec=-ukU iCuk j=1nyi,juklogy^i,juk,

其中yi,juk是真正例标签,当用户在时刻i访问位置lj时,其值为1,否则为0.因此,在加入多头注意力的正则化项后,最终的损失函数为:

L=rec+τθ2,

其中τ是超参数,θ2是模型所有参数的L2正则项.

4 实验

4.1 实验设置

4.1.1 数据集

本文在两个分别从Foursquare(https://sites.google.com/site/yangdingqi/home/foursquare-dataset)和Gowalla(https://snap.stanford.edu/data/loc-Gowalla.html)上收集到的真实数据集上执行实验.其中Foursquare数据集包括了从2012年4月到2013年9月在新加坡的签到数据,Gowalla数据集包括了从2009年3月到2010年10月在美国的加利福尼亚州和内华达州的签到数据.沿用现有工作的设定,实验中将被访问次数小于5的POI以及签到数目小于5的用户视作不流行的POI和不活跃的用户,在数据预处理时将其剔除.处理后的两个数据集的统计信息如表1所示.在数据集划分时,本文采用了留一法策略.

4.1.2 基线算法

本文将DGRAN与传统方法(FPMC)、基于RNN的方法(Flashback)、基于注意力的方法(TiSASRec和GeoSAN)、基于GNN的方法(Graph-Flashback和AGRAN)进行比较.

FPMC31:使用矩阵分解和马尔可夫链来建模POI之间转变关系.

Flashback9:使用时间和空间间距来增强上下文感知能力的基于RNN的模型.

TiSASRec28:基于自注意力机制的模型,通过使用签到序列中POI间的时间间隔信息,使得注意力机制能更好地感知时间关系.

GeoSAN12:基于自注意力机制的模型,通过网格映射来编码地理位置关系,在序列处理时额外建模位置关系.

Graph-Flashback16:为学习POI表示构建了一个时空知识图谱.为了公平性,本文除去了它的社会关系.

AGRAN17:使用自适应图学习POI表示,并为自注意力机制扩展了时间和空间信息.

4.1.3 评估指标

本文使用了推荐系统里的两个标准评估方法,截断到前k的召回率Recall(Recall@k)以及截断到前k的归一化折损累计增益NDCG(NDCG@k):

Recall@k=1UukULukTLukRLukT,

其中LukT是真正例列表,LukR是用户uk的top-k推荐列表.

NDCG@k=1log2 rankl+1,  ranklk0,                               rankl>k,

其中rankl表示目标POI ll在排名列表里的位置.k的取值范围为{2,5,10}.

4.1.4 实现细节

所有实验在一个NVIDIA RTX 4060ti 16 GB GPU上执行.为了公平起见,本文将所有模型的POI嵌入维度设置为64,其他参数使用模型表现最好的参数.对于DGRAN,Foursquare的L2正则项系数τ设置为0.0005,Gowalla的L2正则项系数τ设置为0.0001;Foursquare的图卷积的层数设置为5,Gowalla的图卷积的层数设置为4;Foursquare的γ设置为0.01,Gowalla的γ设置为0.005;Foursquare的λ1设置为140,Gowalla的λ1设置为220,λ2设置为0.001,学习率设置为0.001,丢失率设置为0.4,自注意力模块设置为2层,多头机制设置为2头,空间距离和时间距离的上界sthrtthr都设置为256.

4.2 对比实验

表2表3展示了所有模型在Foursquare和Gowalla上的推荐性能,可以得出如下结果:

(1)DGRAN超越了所有类型的基线.本文将DGRAN的性能提升归因于两方面:1)去相关的自适应图能够学到更优质的图结构,进而为POI学到更丰富的表示,差异化POI表示的各个维度能让该向量表示更具表达能力,从而使得后续的自注意力网络能更好把握住POI之间的潜在关系以及用户的兴趣变化趋势;2)额外的残差机制能够给予图方法更大的梯度,在帮助POI表示学习的同时,产生更优质的图结构;

(2)传统方法FPMC由于马尔科夫链自身的弊病,无法构建更高阶的关系模式,从而无法准确建模用户的潜在偏好,导致其预测出效果不佳;

(3)基于RNN类的方法Flashback虽然在建模过程中额外建模了时空信息对当前时刻的周期性影响,但是由于RNN类方法更适合建立短期序列关系并具有一定的遗忘性且无法像自注意力机制一样直接建模点对点的关系,导致其无法充分把握当前时刻之前的所有时刻对当前的重要性,导致其最终预测效果不足;

(4)基于注意力的模型源自于其点对点的注意力计算方式,使得其最终结果优于传统方法和基于RNN的模型.虽然GeoSAN和TiSASRec建模时间的方式略有不同,但GeoSAN还从POI的位置信息中获益,从而达到了更好的预测效果.不过这些方法忽略了输入嵌入自身的质量,这导致仅靠自注意力机制也无法精确获取用户兴趣的潜在偏好和转移关系;

(5)使用图神经网络的模型通过建模POI关系图,为POI学习到富含表达能力的向量表示,去除了POI之间的噪声信息,这使得它们能胜过其他模型.其中AGRAN更是因为使用了自适应图方法,使其在建模POI图时更胜一筹,因此该模型的POI表示质量更高,不过由于它忽视了自适应图与自注意力网络的梯度关系,导致反向传播时不能为图网络提供足够的梯度,影响了图结构的更新,从而导致模型的性能不足.

4.3 消融实验

为了检验DGRAN中主要设计的影响,本文执行了消融实验,移除了不同模块的3个变种如下:

● w/o decor:这个变种移除了去相关机制,即使用简单图的传播方法.

● w/o extra res:这个变种移除了额外的残差连接.

● w/o decor & extra res:这个变种移除了局部注意力和额外的残差连接.

图2展示了两个数据集上的消融实验结果,对其分析可得:

(1)去相关方法通过减小表示不同维度间的相似度,有助于生成更有价值的自适应图结构,使得图方法能够学习到更具表达力的POI表示,进而影响模型的预测能力,这是一种需要更少先验知识的有效方法;

(2)额外的残差机制的有无影响了模型的表现,即从注意力模块流向自适应图的梯度显著影响着自适应图的学习能力,即使有着其他各种方法的加持,在没有足够梯度的情况下,POI的质量也难以得到保证.

4.4 超参数研究

为探究去DGRAN的图层数lnum对模型效果的影响,本文在区间{2,3,4,5}测试​模型的性能.从图3可以看出在Gowalla数据集上层数为4时效果达到最优,而在Foursquare数据集上层数为4和5时效果相似,这说明在更稀疏的Gowalla数据集上,过度采样更远邻居的信息不利于自身信息的表达.

5 结论

本文提出了为下个POI推荐而建的DGRAN模型,进行了对自适应图学习方法的探索,以及对自注意力机制在应用中的改进;同时,本文还在理论与实践上说明了额外残差连接对自适应图与自注意力机制相结合时的重要性.两个真实数据集上的结果证明了DGRAN性能的优越性.接下来的工作将继续探索自适应图方法的优化.

参考文献

[1]

YU ZLIAN JMAHMOODY Aet al. Adaptive user modeling with long and short-term preferences for personalized recommendation[C]//IJCAI. International Joint Conferences on Artificial Intelligence. Macao: Morgan Kaufmann, 2019: 4213-4219.

[2]

FENG SLI XZENG Yet al. Personalized ranking metric embedding for next new POI recommendation[C]IJCAI. International Joint Conferences on Artificial Intelligence. Buenos Aires:Morgan Kaufmann, 2015: 2069-2075.

[3]

HAN PLI ZLIU Yet al. Contextualized point-of-interest recommendation[C]//IJCAI. International Joint Conferences on Artificial Intelligence. Yokohama: Morgan Kaufmann, 2020: 2484-2490.

[4]

CHENG CYANG HLYU M Ret al. Where you like to go next: Successive point-of-interest recommendation[C]//IJCAI. International Joint Conference on Artificial Intelligence.Beijing:Morgan Kaufmann, 2013: 2605-2611.

[5]

QIAN TLIU BNGUYEN Q V Het al. Spatiotemporal representation learning for translation-based POI recommendation[J]. ACM Transactions on Information Systems(TOIS)201937(2): 1-24.

[6]

ZHAO SZHAO TYANG Het al. STELLAR: Spatial-temporal latent ranking for successive point-of-interest recommendation[C]//AAAI. Proceedings of the AAAI Conference on Artificial Intelligence.Phoenix: AAAI, 2016: 315-322.

[7]

KONG DWU F. HST-LSTM: A hierarchical spatial-temporal long-short term memory network for location prediction[C]//IJCAI. International Joint Conferences on Artificial Intelligence.Stockholm:Morgan Kaufmann, 2018: 2341-2347.

[8]

LIU QWU SWANG Let al. Predicting the next location: a recurrent model with spatial and temporal contexts[C]//AAAI. Proceedings of the AAAI conference on Artificial Intelligence. Phoenix: AAAI, 2016:194-200.

[9]

YANG DFANKHAUSER BROSSO Pet al. Location prediction over sparse user mobility traces using RNNs: Flashback in hidden states![C]//IJCAI. International Joint Conference on Artificial Intelligence. Yokohama: Morgan Kaufmann, 2020: 2184-2190.

[10]

LUO YLIU QLIU Z. Stan: Spatio-temporal attention network for next location recommendation[C]//IC 3C2. The Web Conference. Ljubljana: ACM, 2021: 2177-2185.

[11]

HUANG LMA YWANG Set al. An attention-based spatiotemporal LSTM network for next POI recommendation[J]. IEEE Transactions on Services Computing201914(6): 1585-1597.

[12]

LIAN DWU YGE Yet al. Geography-aware sequential location recommendation[C]//ACM. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego: ACM, 2020: 2009-2019.

[13]

LI YCHEN TLUO Yet al. Discovering collaborative signals for next POI recommendation with iterative Seq2Graph augmentation[C]//IJCAI. International Joint Conference on Artificial Intelligence. Montreal: Morgan Kaufmann, 2021: 1491-1497.

[14]

姚静怡,李艳红,黄银峰,.灵活的属性社区搜索方法[J].中南民族大学学报(自然科学版)202443(3):358-369.

[15]

WANG ZZHU YZHANG Qet al. Graph-enhanced spatial-temporal network for next POI recommendation[J]. ACM Transactions on Knowledge Discovery from Data202216(6): 1-21.

[16]

RAO XCHEN LLIU Yet al. Graph-flashback network for next location recommendation[C]//ACM. ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Washington D C: ACM, 2022: 1463-1471.

[17]

WANG ZZHU YWANG Cet al. Adaptive graph representation learning for next POI recommendation[C]//ACM. International ACM SIGIR Conference on Research and Development in Information Retrieval.Taipei: ACM, 2023: 393-402.

[18]

WU ZPAN SCHEN Fet al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems202032(1): 4-24.

[19]

LIU HHAN HJIN Wet al. Enhancing graph representations learning with decorrelated propagation[C]//ACM. ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Long Beach: ACM, 2023: 1466-1476.

[20]

QIN YFANG YLUO Het al. Next point-of-interest recommendation with auto-correlation enhanced multi-modal transformer network[C]//ACM. International ACM SIGIR Conference on Research and Development in Information Retrieval. Madrid: ACM, 2022: 2612-2616.

[21]

YANG SLIU JZHAO K. GETNext: Trajectory flow map enhanced transformer for next POI recommendation[C]//ACM. ACM SIGIR Conference on research and development in information retrieval. Madrid: ACM, 2022: 1144-1153.

[22]

YIN FLIU YSHEN Zet al. Next POI recommendation with dynamic graph and explicit dependency[C]//AAAI. Proceedings of the AAAI Conference on Artificial Intelligence. Washington D C: AAAI, 2023: 4827-4834.

[23]

WU FSOUZA AZHANG Tet al. Simplifying graph convolutional networks[C]//IMLS. International Conference on Machine Learning. Long Beach: PMLR, 2019: 6861-6871.

[24]

WANG ZZHU YLIU Het al. Learning graph-based disentangled representations for next POI recommendation[C]//ACM. International ACM SIGIR Conference on Research and Development in Information Retrieval. Madrid: ACM, 2022: 1154-1163.

[25]

WANG JYANG BLIU Het al. Global spatio-temporal aware graph neural network for next point-of-interest recommendation[J]. Applied Intelligence202353(13): 16762-16775.

[26]

TAO HZENG JWANG Zet al. Next POI recommendation based on spatial and temporal disentanglement representation[C]//IEEE. IEEE International Conference on Web Services. Chicago: IEEE, 2023: 84-90.

[27]

CHANG JGAO CZHENG Yet al. Sequential recommendation with graph neural networks[C]//ACM. International ACM SIGIR Conference on Research and Development in Information Retrieval. Montreal: ACM, 2021: 378-387.

[28]

LI JWANG YMCAULEY J. Time interval aware self-attention for sequential recommendation[C]//ACM. ACM International Conference on Web Search and Data Mining. Houston:ACM, 2020: 322-330.

[29]

FOUMANI N MTAN C WWEBB G Iet al. Improving position encoding of transformers for multivariate time series classification[J]. Data Mining and Knowledge Discovery202438(1): 22-48.

[30]

TAKASE SKIYONO SKOBAYASHI Set al. B2t connection: Serving stability and performance in deep transformers[C]//ACL. Annual Meeting of the Association for Computational Linguistics. Toronto: ACL, 2023: 3078-3095.

[31]

RENDLE SFREUDENTHALER CSCHMIDT-THIEME L. Factorizing personalized Markov chains for next-basket recommendation[C]//IW 3C2. International Conference on World Wide Web. Raleigh: ACM, 2010: 811-820.

基金资助

湖北省自然科学基金资助项目(2017CFB135)

中央高校基本科研业务费专项资金资助项目(CZY23019)

网络创新及应用型人才课程实践教学研究资助项目(2019年第一批)

AI Summary AI Mindmap
PDF (2272KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/