目标导向任务是一种以特定目标为导向的认知行为,通过驱动个体主动调整行为和优化策略,逐步提升任务完成效率
[1, 2]。然而,复杂的认知功能依赖于神经细胞之间的网络协作,而非单个脑区或单个细胞的独立活动
[3]。这种协作通常表现为神经细胞的同步活动,特别是在执行奖赏相关学习和记忆任务时尤为显著
[4, 5]。局部场电位是一种周期性、规律性的神经节律活动,能够反映群体神经细胞的同步性
[6]。
1971年有研究首次在海马CA1区中发现位置细胞,即当动物到达特定的空间位置时,该类细胞的发放频率显著增加,这对于大脑构建认知地图至关重要
[7]。与此同时,海马CA1区的Theta节律(6~12 Hz)在路径规划中扮演了至关重要的角色。当动物进行空间导航时,编码不同位置的位置细胞以特定的时间序列锚定在Theta节律的不同相位上,从而有助于动物对空间路径的回忆和未来的路径规划
[8-10]。此外,在认知过程中,不同节律具有不同意义,如海马CA1区的Beta节律(15~30 Hz)对于信息处理、注意力控制以及海马与其他脑区的协调起着关键作用
[11-13]。眶额叶皮质(OFC)位于前额叶腹侧,与杏仁核、纹状体等相互连接,共同构成大脑庞大而复杂的奖赏系统
[14, 15]。OFC参与感觉线索与奖赏的关联、决策和期望
[16, 17]。过去已有大量实验表明,OFC神经细胞响应不同的奖赏价值,包括主观价值和客观价值
[18-20]。近年来,有研究显示,在猴子OFC中观察到Gamma节律(75~150 Hz)与群体细胞放电模式相近,并且这种高频节律同样可以编码和预测奖赏价值
[21]。
海马CA1区和OFC共同参与目标学习与记忆的过程,小鼠在完成嗅觉-奖赏关联任务后,海马CA1区和OFC的c-fos蛋白表达水平显著增加,这种c-fos蛋白常被用作研究神经元活跃性的标志,这说明奖赏关联任务记忆的维持需要海马CA1区和OFC神经细胞的共同激活
[22]。在反转学习过程中,同时损坏海马CA1区和OFC,会增加反转初期小鼠在水迷宫中找到平台的距离,说明这两个脑区可能影响处理目标空间信息的能力
[23]。
目前已明确的,海马CA1区在空间导航中具有核心作用,OFC则是奖赏系统中的重要结构之一,两者共同参与目标任务的学习。然而,以往研究主要聚焦于整个学习过程中双脑区的同步效应,对于它们如何协调参与目标导航和奖赏获取的具体机制仍缺乏深入探讨。基于此,本研究通过同步记录大鼠海马CA1区和OFC的局部场电位,探究双脑区在空间目标导向任务中的作用机制,以进一步阐明它们在空间导航和奖赏获取过程中的功能角色。
1 材料和方法
1.1 实验动物
采用4只成年雄性Long-Evans大鼠(北京维通利华实验动物技术有限公司),8周龄,体质量380~450 g。饲养温度18~25 ℃,湿度40%~50%,光照周期为每12 h进行明暗交替。大鼠每天置于记录房间中适应1 h,持续1周。适应结束后对大鼠进行食物限制,使其体质量维持在原体质量的85%左右。以上均按照南方医科大学实验动物伦理福利制定与实施(伦理批号:L2021079)。
1.2 行为迷宫
在海马依赖的空间目标导向任务中,本研究使用陆地式水迷宫(Cheese-board迷宫)来模拟真实的空间奖赏探索过程
[24]。该迷宫由若干个等距离圆洞组成,迷宫直径为150 cm,厚度为0.5 cm,每个圆洞的直径为1 cm,相邻两个圆洞的距离为1 cm。食丸(40 mg/粒)作为奖赏随机埋藏在圆洞中。在迷宫边缘放置起始箱(Start box),规格长为30 cm,宽为20 cm,高为40 cm,通过气控系统控制门的开关。工业相机(Basler)放置于迷宫正上方。
1.3 空间目标导向任务
空间目标导向任务分为5个时期,依次为Pre-test时期、Pre-sleep时期、Learning时期、Post-sleep时期和Post-test时期。Pre-test时期用来评估大鼠对前1 d旧奖赏位置的记忆能力,Post-test时期用来评估大鼠对当天新奖赏位置的记忆能力。Learning时期为新奖赏位置的学习时期,用来评估对新奖赏位置的学习能力。在Learning时期,大鼠需要在Cheese-board迷宫上寻找2个特定的圆洞,圆洞中各藏有1颗食丸作为奖赏,进食完毕后需要回到Start box等待下一个试次的开始,每天的奖赏位置随机变更。在Pre-test时期和Post-test时期中,迷宫不埋藏食丸,但均匀撒上食丸粉末以隐藏气味线索,允许大鼠在迷宫上进行自由探索。
1.4 数据采集系统
64通道可驱动微型四阵列电极采用12.7 μm直径的钨丝线(California Fine Wire)制造
[25, 26]。每股四阵列电极由4根钨丝线缠绕形成独立记录位点,直径约为25 μm,每根钨丝线作为1个通道。海马CA1区埋植8股四阵列电极,OFC埋植8股四阵列电极,OFC电极尖端长于CA1电极尖端2.5 mm。单股四阵列电极插入到内径为0.101mm的毛细管中,定制高精度3D打印螺丝通过滑块驱动毛细管上下滑动,从而调节电极的深度。高精度螺丝每逆时针旋转一圈,电极则下调200 μm。每股四阵列电极通过镀金仪将电阻电镀到阻抗为0.3~0.5兆欧的范围内。电极通过Headstage连接到电信号采集系统(Intan)。电信号采集系统通过信号发生器与工业相机连接,使得行为学数据与电生理数据同步进行记录。
1.5 电极埋植手术
达到行为学标准的大鼠放入诱导箱内使用异氟烷进行预麻醉,等动物麻醉后立即转移至立体定位仪上。剃掉头皮,用碘酒擦洗,用利多卡因进行局部麻醉,然后钻孔。在本研究中,海马CA1区中心坐标为AP=-3.8 mm,ML=-2 mm;OFC中心坐标为AP=5.16 mm,ML=-1 mm。两根接地线连接在颅骨螺钉上。电极组件和颅骨螺钉用牙科丙烯酸树脂固定在颅骨上。以海马CA1区电极尖端到皮层为零点向下埋植-1.5 mm。术后7 d内恢复大鼠。术后第3天开始下调电极(100 μm/d),每调节一次电极,需记录当次螺丝旋转圈数。当电极降至目标脑区位置时,间隔24 h后开始进行数据采集。
1.6 数据采集
1.6.1 行为学记录方法
在Pre-test时期,向迷宫中均匀撒上食丸粉末以隐藏气味线索,大鼠在迷宫中自由探索20 min。经过30 min的Pre-sleep时期后,进入到Learning时期。在Learning 时期中,大鼠从Start box出发进入Cheese-board迷宫中寻找2个奖赏位置且进食完毕后返回到Start box。该时期记录40个试次,根据学习进程将其平均划分成8个阶段,便于观察大鼠对新奖赏位置学习能力的变化趋势。每隔4个试次擦拭1次迷宫,并均匀撒上食丸粉末以隐藏气味线索。经过30 min的Pre-sleep时期后,进入到Post-test时期。在Post-test时期,向迷宫中均匀撒上食丸粉末,大鼠在迷宫中自由探索20 min。
1.6.2 电生理数据采集
数据采集从Pre-test时期开始到Post-test时期结束,即为一天数据样本。行为学数据记录的帧率为50帧/s,记录到的数据以mp4格式保存到文件中。电生理数据记录的采样率为20 kHz,使用TTL信号以同步相机记录与电生理记录,采集到的电生理数据以二进制格式保存到文件中。此外,由于单个记录位点采集到的信号范围受限,为了采集到同一个脑区内更广泛的神经活动,每天数据采集结束后将电极下调25 μm,以探测新的数据样本,并记录每次螺丝旋转圈数。
1.7 数据预处理
1.7.1 行为学数据预处理
使用DeepLabCut工具包获得包含大鼠头部、颈部和身体中心的坐标。通过Matlab自行编写程序获取动物在每个试次中的运动轨迹和时间。以放置食丸的圆洞作为中心,计算大鼠头部坐标到圆洞中心的距离,如果距离小于5 cm则判定为动物进入奖赏区域。本文章主要探究海马CA1区和OFC在目标导航过程和奖赏获取过程中的作用机制,因此将单个试次动物的任务轨迹分割为从Start box到奖赏位置“1”的目标导航过程(S-P1)、奖赏位置“1”的奖赏获取过程(P1)、奖赏位置“1”到奖赏位置“2”的目标导航过程(P1-P2)以及奖赏位置“2”的奖赏获取过程(P2)。为了分析的准确性,仅截取大鼠在奖赏区域停留1 s以上的数据。
1.7.2 电生理数据预处理
数据处理与分析采用EEGLAB工具箱和Matlab自编脚本。首先对原始数据进行降采样至1000 Hz,接着通过零相位平滑型FIR带通滤波器处理获得频带范围在1~400 Hz的数据,最后选择皮层电极作为参考电极,对所有信号进行重参考。
1.8 组织学切片与成像
数据采集结束后,使用Intan刺激系统向大脑输入30 µA的电流,持续3 s,实施电击损伤。由于电流较低且持续时间较短,此方式不会造成大面积的脑区损伤,仅留下电极植入轨迹。动物电损24 h后进行灌注取脑。使用异氟烷深度麻醉大鼠后补充注射戊巴比妥钠(50 mg/mL),然后经心脏灌注PBS和4%多聚甲醛。灌注结束后,保留颅骨,将电极与大脑一起浸泡于4%多聚甲醛中进行4 ℃过夜。第2天将所有的电极上调,剔除颅骨,取出大脑,随后再次浸泡4%多聚甲醛中4 ℃过夜。第3天更换为30%的蔗糖溶液进行组织脱水。随后进行冰冻切片(Leica),厚度为40 μm。最后进行尼氏染色和明场成像(Nikon)。
1.9 数据分析
1.9.1 空间目标导向任务的评估
本研究通过计算并标准化在Learning时期大鼠从Start box出发进入迷宫且进食完毕后返回Start box之间的路程,以此观察大鼠对新奖赏位置的学习趋势。大鼠完成单个试次任务的路程越短,表明其行为表现越好。为了评估大鼠对奖赏位置的记忆能力,本研究分别统计了动物在Pre-test时期和Post-test时期进入到新、旧奖赏位置区域的次数。
1.9.2 功率谱密度
功率谱密度是描述神经活动信号在不同频率上功率分布的一个量度指标,即在单位频率范围内的功率强度。首先对预处理后的LFP根据任务态划分的S-P1、P1、P1-P2和P2过程进行分段,然后每段数据选取0~200 ms作为基线进行校正。接着使用pwelch函数计算每个分段数据的功率谱密度,采用的窗口为汉宁窗(Hanning),窗长为0.5 s,相邻段之间的重叠度为75 %,计算得到的功率谱密度转换为对数尺度(dB)。最后进行标准化处理。功率谱密度计算公式为:
其中,表示信号的自相关函数,F表示傅里叶变换。
功率谱密度单位转换成dB的公式为:
其中,是参考功率。
1.9.3 局部场电位相干性
相干性是用来衡量两个信号在频域中是否存在同步性或相似性的一个指标,反映了这两个信号在同一频段内的线性关系,以及它们之间的同步程度。首先分别对海马CA1区和OFC进行滤波,获得1-200 Hz 的信号。接着使用mscohere函数计算海马CA1区和OFC之间在各个分段中相干性,采用的窗函数为汉宁窗,窗长为0.5 s,相邻段之间的重叠度为75 %。最后计算得到的相干性值进行标准化处理。相干函数通过互功率谱和自功率谱的比值来计算:
其中,表示信号和信号的互功率谱,和分别表示信号和信号的自功率谱。
1.9.4 相位锁相值
相位锁相值是用来衡量两个信号之间的相位关系是否一致或相似,以及这种相位关系的稳定性。首先分别对海马CA1区和OFC在Theta节律或Beta节律频率范围进行滤波。接着将滤波后的数据通过Hilbert变换提取两个脑区的瞬时相位。最后计算它们之间的锁相值(PLV)。计算得到的PLV进行标准化处理。根据复数相位差的平均值计算PLV,公式为:
其中,N表示信号采样数据点个数,t表示信号的每个时间点,表示在时间点上,两个信号之间的相位差。
1.9.5 跨频耦合
跨频耦合是用来衡量两个不同频率范围信号之间的相互作用或相互调制的指标,尤其是低频信号的相位调节高频信号的幅值。首先对海马CA1区数据进行滤波获得Theta信号,通过Hilbert变换提取瞬时相位。接着对OFC数据进行滤波分别获得Beta和Gamma信号,通过Hilbert变换提取瞬时幅值。最后将海马CA1区相位划分成20个区间,分别计算每个区间中OFC各个节律的平均幅值。计算得到的跨频率耦合(PAC)进行标准化处理。
1.9.6 统计学分析
采用Matlab软件进行统计处理,折线图数据以均数±标准差表示,箱型图以中位数(四分位)表示。两独立样本差异性检验采用Wilcoxon非参秩和检验分析,配对样本差异性检验采用符号秩检验。P<0.05时认为差异具有统计学意义。
2 结果
4只大鼠(lw014、lw015、lw016、js001)各记录2~3 d,由于每天记录到的脑区位置深度不同,因此每天的数据被认为是一个新的样本。共选取10 d数据样本进行分析。
2.1 行为表现和电极埋植
将每天Learning时期的总试次数均分为8个阶段(
图1A),标准化后的结果显示,第8阶段所需的路程低于第1阶段(
P<0.005,
图1B)。大鼠在Pre-test阶段进入旧奖励位置的次数高于新奖赏位置(
P=0.0078),而在Post-test阶段进入新奖励位置的次数显着高于旧奖赏位置(
P=0.002,
图1C)。使用标准大鼠脑图谱(Paxinos and Watson,1998)证实正确的电极埋植位置(
图2)。
2.2 海马CA1区和OFC神经节律在不同任务态中的响应差异
将任务态划分为两种类型,分别为目标导航过程(S-P1和P1-P1)和奖赏获取过程(P1和P2,
图3A)。在目标导航过程中,海马CA1区和OFC在8~10 Hz和18~22 Hz频率范围内出现高峰;在奖赏获取过程以及进入旧奖赏位置时,海马CA1区和OFC在6~10 Hz频率范围内也出现高峰(
图3B)。
OFC脑区在各个节律中对于两个不同的奖赏获取之间以及两个不同的目标导航之间差异没有统计学意义(
P>0.05,
图3C)。相比之下,海马CA1区则表现出Beta节律在同一任务态之间存在差异(
P<0.005,
P=0.023),同时在目标导航过程中,High gamma节律也表现出差异(
P=0.02)。
OFC在无奖赏条件下的神经节律活动高于奖赏获取过程(
P=0.019),而海马CA1区则未表现出明显差异(
P>0.05,
图3D)。
2.3 目标导航过程表现双脑区高同步化
目标导航过程中,双脑区的高相干性分别在8~10 Hz和18~22 Hz频率范围中出现高峰,奖赏获取过程和进入到旧奖赏位置则在6~10 Hz频率范围内出现高峰(
图4A)。进一步的统计分析表明,目标导航过程和进入旧奖赏位置时,双脑区之间的相干性在各个节律中均高于奖赏获取过程(
P<0.005,
图4B)。
学习阶段中双脑区之间的相干性变化趋势结果显示,无论Theta还是Beta节律,在S-P1和P1-P2目标导航过程中,海马CA1区与OFC之间的同步相干性均随学习阶段的推进逐渐增强,第8阶段显著高于第1阶段(
P<0.01,
图4C、D)。
在学习进程中,Theta节律相位的锁定程度在S-P1过程中没有出现逐渐增强的趋势(
P=0.60),而Beta节律相位的锁定程度在S-P1和P1-P2过程中均表现出逐渐增强的趋势(
P<0.005,
图5B)。
2.4 海马CA1区和OFC以跨频耦合方式参与空间目标导向任务短时记忆的维持
在空间目标导向任务记忆维持的过程中,海马CA1区和OFC在Pre-test时期进入旧奖赏位置和Post-test时期进入新奖赏位置的神经节律活动无差异(
P>0.05,
图6A)。接着计算双脑区在新、旧奖赏位置中的相干性,发现旧奖赏位置的高相干性分布覆盖了整个频率范围(
图6B)。进一步对Pre-test和Post-test进行跨频耦合分析,并做配对检验。结果表明,在Post-test时期进入新奖赏位置时,双脑区之间出现特异性的海马CA1区Theta相位-OFC Low gamma幅值跨频耦合(
P=0.039)。
3 讨论
空间目标导向任务要求个体在特定空间环境中,通过学习、记忆、路径规划或认知策略,完成找到目标的任务
[24]。本研究统计大鼠每次试验所需的路程,以及在Pre-test和Post-test时期进入新、旧奖赏位置的情况。结果显示,大鼠在新奖赏位置阶段中表现出学习后期到达目标位置所需的路程显著缩短,以及在测试时期分别进入新、旧奖赏位置的次数具有显著差异。这表明大鼠能够灵活地整合奖赏和空间新信息,从而引导自身完成目标任务。这些行为表现为评估海马CA1区和OFC神经活动变化提供了充分依据。
在空间目标导航任务中,空间信息处理以及奖赏驱动的学习与记忆是实现任务目标的关键因素。过去研究在细胞水平上已证实,海马CA1区和OFC对空间信息的编码模式具有差异。海马CA1区神经细胞发放活动与空间位置密切相关,而OFC神经细胞则编码与奖赏任务相关的路径过程
[27-29]。然而,这些实验均在线性迷宫上完成,该类迷宫的空间信息相对简单,容易受方向信息影响,限制了动物对空间的全方位认知训练。本研究使用陆地式水迷宫来模拟真实旷场环境,通过对神经节律的一致性分析进一步证明,海马CA1区主要编码更精细的信息,表现为不同路径导航和不同奖赏获取位置之间的活动强度具有差异,支持了海马CA1区在空间认知和记忆形成过程中的重要作用,尤其是如何将不同的路径或奖赏位置信息进行区分。相反,OFC的神经节律活动对空间位置的变化不敏感,而更关注的是导航状态和奖赏获取状态的区别,表明OFC在行为调节等功能方面起到了关键作用,它并不关心具体的空间位置信息,而是更多地对行为状态和任务需求做出响应。
本研究探讨了海马CA1区与OFC是否能够对有无奖赏条件具有不同响应。过去有研究表明,OFC的Gamma活动能够编码和预测不同的奖赏价值
[21, 30],此外,该脑区的神经细胞发放模式对有无奖赏状态的响应具有差异
[31]。对于海马CA1区,实验表明该脑区的位置细胞发放模式会随奖赏位置的变化而产生变化
[32]。与之类似,本研究发现,OFC在Theta节律中的神经节律活动强度能够有效区分有奖赏和无奖赏状态,说明OFC在奖赏价值的编码和预测过程中扮演着核心角色。相反,海马CA1区在Theta节律中则未表现出明显的差异。因此,海马CA1区和OFC对有无奖赏信息不同的编码模式进一步强调了脑区功能的局部化和专门化。
尽管如此,高级认知功能的实现往往都需要脑区之间的协同作用。目前,海马CA1区与OFC在空间目标导向任务中的作用机制尚未清晰。过去的研究发现,海马CA1区与OFC共同参与奖赏驱动的学习与记忆任务。在反转学习过程中,当奖赏位置发生改变时,海马CA1区和OFC在Theta和Beta频段的相干性会随着学习的推进逐渐降低,但在学习稳定阶段又逐渐回升
[27]。另一项类似的研究也报告了,奖赏位置反转后,OFC神经细胞活动与海马CA1区Theta节律的锁相增强
[28]。然而,这些研究评估的是任务的整体过程,并未区分空间导航和奖赏行为的特异性差异。在本研究中,我们分析了目标导航过程和奖赏获取过程中海马CA1区与OFC神经节律同步活动情况。结果显示,相较于奖赏获取过程,目标导航过程中双脑区表现出更高的Theta和Beta节律在频率上的线性相干。此外,在学习稳定阶段,目标导航过程中的相干性更高。进一步的,本研究探讨海马CA1区和OFC之间的相位同步关系。与上述相似的,双脑区相位上的同步活动在目标导航过程中更高,Beta节律相位同步程度会随着学习推进逐渐增强。在空间目标导向任务中,目标导航需要较高的空间认知和记忆更新。因此,海马CA1区和OFC在目标导航过程中显示出较高的同步活动,反映出在有意义的空间规划中,大脑区域之间更紧密的协作,尤其是在学习过程中,它们更有效地整合奖赏和空间信息,以确保导航任务的完成。
尽管如此,海马CA1区与OFC的同步活动在目标导航学习过程中发挥着重要作用,但这种同步活动在长期记忆和短期记忆中的具体影响仍不明确。为进一步探究这一问题,本研究分析了Pre-test和Post-test时期,大鼠进入新、旧奖赏位置时的双脑区LFP动力学特征。结果表明,双脑区同一节律的相干性在Pre-test时期高于Post-test时期,但这些差异并不依赖于特定节律。就目前来讲,海马CA1区和前额叶皮层之间的跨频耦合在神经科学中是一个重要的研究领域。大量研究表明,海马的低频(如Theta节律)活动往往与前额叶皮层的高频(如Gamma节律)活动相协调,这种耦合被认为与复杂认知任务的学习与记忆相关,尤其是工作记忆
[33-35]。因此,本研究进行了跨频率耦合分析。结果显示,Post-test时期进入新奖赏位置时,海马CA1区的Theta节律相位与OFC的Low Gamma节律幅值之间表现出更高的耦合程度。这表明海马CA1区与OFC的跨频率耦合能够协同工作,帮助大脑更新和维持目标导向任务短期记忆中的内容。
本研究揭示了海马CA1区与OFC之间的神经节律同步活动在目标导航过程中起到了重要作用,这一作用与学习阶段密切相关。此外,双脑区以跨频耦合的方式共同参与奖赏位置检索过程中的短期记忆的维持。这项研究为理解大脑如何在任务学习中动态协调不同脑区、以及如何通过跨频耦合整合多种类型的信息提供了新的视角。尤其是在与空间记忆和目标导向的短期记忆等认知功能相关的任务中,海马CA1区和OFC的协同作用揭示了大脑在学习过程中如何调整自身的网络连接,以适应不断变化的任务要求。本研究仍有不足之处,在体电生理技术即使在时间上有很高的分辨率,仍然无法清晰解释脑区与脑区之间信息的传递方向。在后续研究中,结合光遗传技术或特定脑区损伤方法,将有助于探究海马CA1区编码的空间信息与OFC编码的奖赏信息如何协同作用,驱动动物执行空间目标导向任务的机制。