0 引 言
鸟类是世界上最为繁盛的脊椎动物类群之一,在不同生态系统中占据着不同的生态位,是许多科学问题的重要研究载体。食性作为鸟类的重要习性,长久以来一直是鸟类学研究的重点。在个体生理层面,食性研究可以揭示鸟类消化生理与基因功能
[1]。在生物与生物相互作用层面,食性研究能探究鸟类不同性别食性分化
[2]、物种间生态位分化
[3]等问题。在气候环境对生物的影响方面,食性研究能揭示鸟类繁殖时期对气候波动的适应
[4]以及影响鸟类迁徙路线的因素
[5]。在鸟类与人类的关系方面,食性研究可以发现人类活动对鸟类习性的影响
[6]和鸟类对农业生产的生态价值
[7]。对鸟类食性的研究不仅增进对其习性的了解,也对基础理论研究、环境保护及人类生产活动具有重要意义。
在鸟类食性研究环节中,食物鉴定是一项困难的工作,传统研究方法要求研究者有扎实的分类学基础且需耗费大量时间进行分类工作,在过去的研究中很少能提供精确的分类结果
[8]。DNA条形码技术利用生物基因组中一段特定序列作为物种身份识别编码,通过序列比对将不同类群生物相互区分,可以用一套标准流程完成对分类学跨度巨大的样本群体的物种鉴定,且不要求研究人员具有分类学科背景。随着DNA测序技术的发展和测序成本的降低,近年来出现的DNA宏条形码技术
[9]能够一次完成对多个多物种混合样本的测序和分类工作,大大提高了对如胃容物、粪便等复杂食物样本的鉴定效率。利用DNA宏条形码技术对食物物种组成进行分析成为一种被广泛使用的研究方法。
本文回顾了鸟类食性传统研究方法的不足,介绍了DNA宏条形码技术的基本原理与操作流程,重点列举了在鸟类食性研究中常用的DNA标记与在不同情况下相应引物的选取,并对未来食性分析技术方向提出建议。
1 鸟类食性的传统分析方式与不足
鸟类食性的传统分析方式为依托各种采样途径的形态学分析法,主要途径有幼鸟扎颈
[10]、胃冲洗
[11]、诱导反流
[12]、剖胃
[13]、粪便收集
[14]、相机记录
[15]等,各自具有不同的优势与弊端。在采样过程中,部分操作环节对鸟类干扰较大,使其生理状态和行为模式受到影响
[16],剖胃采样甚至需要杀死被采样个体,这类研究方法在研究珍稀物种时代价过于巨大
[17],且对生理和行为的干扰会使围绕该物种的其他研究受到影响。相机记录方法是一种较为理想的非侵入性食物数据获取方式,在海鸟的食性分析中有较好的效果
[15],然而需要影像中的食物保留有清晰的外形特征。对于胃容物与粪便样本,需要研究者有能力从已被消化或半消化的混合物中寻找动植物组织碎片来判断物种
[17]。通常每名分类学工作者只能做到对一小部分生物类群进行准确分类,在面对物种分类单位跨度较大的情况时会难以独立完成鉴定工作
[18]。有学者指出常规形态学物种鉴定的方法有四项局限性
[19]。首先,用于物种识别的性状表型的可塑性和遗传变异性都可能导致错误的鉴定结果。第二,该方法会忽略形态上隐蔽的分类群。第三,由于形态上的关键特征通常仅对物种特定的生活史阶段或性别有效,会使许多个体无法识别。第四,现代信息交互式物种识别方法缺乏足够的专业性和严谨性。因此,需要一种新的方法从准确性和简易性上改进食性分析方式。
2 DNA宏条形码技术的概念及原理
2.1 DNA条形码技术
DNA条形码技术指使用一段特定的较短DNA序列作为身份识别标记,该序列为某一类群的生物所共有,但在不同物种间的碱基序列有明显差别,便可利用该标记将不同物种区分开来。DNA条形码这个词第一次出现在1993年
[20],但当时并未引起关注,Hebert于2003年正式提出这个概念
[19]。DNA条形码技术提供了一套标准的操作流程,使没有分类学基础的研究者也可完成对各类物种的鉴定。一段DNA条形码需具备以下条件
[21]:
①结构性差异化:同一物种不同个体之间的基因序列应该是几乎相同的,但不同物种之间的基因序列应该是不同的。
②标准化:不同分类学单位的物种使用相同的DNA区域。
③系统发育信息丰富:目标DNA区域应包含足够的系统发育信息,以便将未知或尚未进行条形码建库的物种分配到它们的分类组(属、科等)。
④可靠性:DNA条形码应该具有高度保守的引物位点和高度可靠的DNA扩增和测序过程。
⑤轻便性:目标DNA区域应该足够短,以满足在降解的样本中也有完整模板保留。通常,超过150 bp的DNA区域很难从降解的DNA中扩增出来。
2.2 DNA宏条形码技术
DNA条形码技术的运用与测序技术紧密结合,依赖Sanger测序法的一代测序手段单次测序流程通量较低,在面对大批量多样本时功能工作效率低下,而且难以解决混合样本的测序问题。随着高通量测序技术的发展,应对这类问题的DNA宏条形码技术出现,实现对无法观测到形态学特征的混合样品的检测
[22]。有研究提出DNA宏条形码技术能够从含有降解DNA的环境样本或含有混合DNA的生物样本(土壤、水、粪便等)中自动鉴别多个物种
[9]。DNA宏条形码技术整合了DNA条形码技术和高通量测序技术,首先通过合适的特异性引物对样品的目标DNA区域进行扩增,随后依托二代测序平台(NGS),可以仅通过单次实验一次性得到数十亿条序列数据
[23]。结合计算机数据处理方法的发展,DNA宏条形码技术展现出对混合食物样品分析的巨大优势。利用DNA宏条形码技术对动物食性进行分析的基本流程如下:
①食物样本采集(粪便,胃容物等)。
②提取食物样本中残留的DNA。
③根据潜在的食物类群,选择适当的DNA标记,基于选用的DNA条形码选择合适的引物。
④通过PCR扩增,从食物样本中获得扩增子序列。
⑤通过高通量测序平台,对PCR得到大量的扩增子序列进行测序。
⑥将所测序列进行整理、筛选,与相关数据库进行比对,确定出食物样本所含的物种的组成及分类
[24]。
3 在鸟类食性分析中DNA标记与引物的选取
鸟类分布区覆盖全球,在不同类型的生态系统中占据多种生态位,不同种鸟类利用的食物类群差异巨大,无法通过某一种DNA标记实现对所有生物物种的鉴别,故在食物鉴别环节选用的DNA标记需适配潜在的食物类群。例如,鉴定草食性鸟类食物需要寻找能够有效区分不同植物种类的条形码;食虫鸟类食物的鉴定则需要能够对整个节肢动物类群覆盖较好的DNA标记。以雀形目(Passeriformes)为代表的许多鸟类类群包含大量广食性物种,为获取全面的食物物种组成,有时需同时使用多个针对不同生物类群的DNA标记
[25]。
为避免标记饱和,条形码区域的分类学分辨率也需要考虑。由于不同条形码区域的保守性及片段长度不同,适用的分类单元鉴定精度也不同,一些条形码区域仅能有效识别物种水平以上的分类单位
[24]。可以使用对物种分类覆盖率高但分辨率较低的DNA条形码,结合将某些较高分类单元解析为物种水平的其他DNA条形码来分析复杂的食物样本,这种策略可被称为逐层条形码技术
[26]。
由于利用DNA宏条形码技术所分析的食物样本通常为鸟粪或胃容物,不可避免地含有大量鸟体本身的DNA,这要求尽量选取能特异性结合食物中物种类群,而非鸟类自身DNA的DNA条形码,从而尽可能避免在DNA扩增过程中鸟类自身DNA被大量扩增,以免在后续测序环节产生大量无效数据。另外,由于这些样本中的DNA经过高度降解,难以实现对数百个碱基对的长片段扩增,需根据DNA标记降解后的片段情况重新设计引物。
3.1 动物DNA条形码
3.1.1 线粒体细胞色素C 氧化酶亚基Ⅰ基因(cytochrome oxidase subunit I gene, COI)
线粒体细胞色素C氧化酶亚基
Ⅰ基因(以下简称
COI)是在动物界使用最为广泛的物种鉴定条形码。由于该基因位于线粒体中,在细胞中具有多重拷贝的优势,在获取的原始DNA样本中大量存在。有研究使用正向引物LCO1490和反向引物HC02198扩增了长度约710 bp的
COI完整片段,证明该位点在无脊椎动物DNA鉴定中具有广泛的适用性
[27]。然而,对于粪便等样本,其中的食物残留DNA片段经过严重的降解,难以获取完整的
COI序列。随后,有学者开发了引物ZBJ‐ArtF1c/ZBJ‐ArtR2c(以下简称ZBJ),扩增
COI中约157 bp长度的片段
[28],用于降解样本中无脊椎动物的鉴定。近年来该引物在对食虫鸟类的食性研究中被广泛使用。有学者利用ZBJ引物对四种鸟类——柳山雀(
Poecile montanus)、西伯利亚山雀(
Poecile cinctus)、大山雀(
Parus major)和蓝山雀(
Cyanistes caeruleus)粪便中的
COI片段扩增并进行分析比对,鉴定出四种鸟类的食性
[29]。然而,近年来也有研究发现ZBJ引物在检测准确性上的不足,且对陆生节肢动物的覆盖度较低
[30],并提出新引物ANML具有更高的精确度
[31]。该DNA标记普遍运用于各种鸟类食物的鉴别,在食虫鸟类食性研究中应用普遍
[32~34]。
3.1.2 16S核糖体DNA(16S ribosomal DNA, 16S)
16S核糖体DNA(以下简称
16S)同样位于线粒体DNA上,在细胞中具有多重拷贝,也是广泛使用的DNA标记,相较于
COI,
16S具有更加保守的引物位点
[35]。同时
16S的引物在扩增过程中能覆盖更多的分类单元
[36]。该DNA条形码也被用于鸟类食性研究中,如使用四组不同的特异性引物
[37](16S1F⁃degenerate和16S2R⁃degenerate、EuphMLSUF 和EuphMLSUR,KaMLSUF和KaMLSUR、NotoMLSUF和NotoMLSUR)对长冠企鹅粪便样本DNA中
16S标记进行扩增,用以确定样本中特定猎物DNA是否存在,从而分析出长冠企鹅的食物种类,该研究表明该位点在鱼类、头足类、甲壳动物的鉴别中都有较好的效果
[38]。然而
16S作为DNA条形码,其用于比对的公共数据库数据量不够充足
[39]。
3.1.3 核糖体小亚基DNA(ribosomal small subunit DNA, 18S/SSU rDNA)
核糖体小亚基DNA(以下简称
18S)来自于真核生物的核基因组,在真核生物中较为保守,在公共数据库中,大多数真核生物门都有
18S的数据记录。但由于其过于保守,通常不能分辨到物种的水平
[40]。
18S在海鸟的食性研究中使用广泛
[41~43]。通过DNA宏条形码技术在前人基础上进一步分析了小蓝企鹅的食性,研究过程选择了后生动物中覆盖范围大的引物18S_SSU对核小亚单位核糖体DNA基因的V7区域进行扩增,该区域高度保守,提供的信息能够涵盖小蓝企鹅的食性广度,变量较少,但分辨率限制在类或科水平,通过分析发现了广食性小蓝企鹅未被记载的一种食物类群——以樽海鞘(Thaliacea)为主的浮游生物
[42]。
3.1.4 12S核糖体DNA(12S ribosomal DNA identification, 12S)
12S核糖体DNA基因也来自线粒体DNA。Riaz于2011年开发出的12S⁃V5引物
[44],在鉴别脊椎动物物种中得到广泛的运用
[45]。脊椎动物是大多数狼的猎物物种,对12个研究地点收集的860只狼的粪便进行分析,使用引物12S⁃V5定位狼粪便中所含脊椎动物的线粒体12S区基因组并将其扩增,通过分析量化了整个群岛狼食物的生物地理变异性
[46]。目前暂未将
12S用于鸟类食性研究中的报道,根据该条形码特征,可用于以脊椎动物为食的鸟类的食性分析中。
3.2 植物DNA条形码
与动物不同,由于植物种间杂交现象普遍,同种基因在不同植物类群中的进化速率差异大等因素,在植物界的分类鉴定中,未找到类似于
COI的通用条形码。2009年,在墨西哥召开了第三届国际DNA条形码会议,会上生命条形码联盟植物工作组将叶绿体基因片段
rbcL和
matK确定为植物DNA标准条形码的核心条形码;叶绿体
trnH⁃
psbA片段和核基因片段
ITS为补充条码。近年来,这四种片段被广泛应用于高等植物的DNA条形码
[47,48]以及植食性动物的粪便分析
[49~51]、环境保护
[52,53]等研究中。
在鸟类食性研究中,利用两种植物条形码
rbcL和
trnH⁃
psbA对黑顶林莺粪便中的完整种子和破碎的植物材料进行分析,从而描述欧亚黑顶林莺(
Sylvia atricapilla)的食性特征
[54]。有研究利用DNA宏条形码技术分析粪便样本,从而比较3种同域北美蜂鸟的食性异同
[55]。在研究过程中,针对3种同域北美蜂鸟的食性特征,选用了动物条形码COI对粪便中无脊椎动物部分进行分析,针对粪便中的植物部分选择植物条形码
rbcL进行分析。有学者
[56]采用植物条形码
ITS2对绿尾虹雉粪便样品 DNA 宏条形码测序,对其测序数据进行分析,探究绿尾虹雉植食性食物及食物组成季节性变化。
4 DNA宏条形码技术的不足
现阶段DNA宏条形码技术在鸟类的食性研究中还存在着一些不足之处:
①对于多物种混合的DNA样品,在进行目标片段扩增的过程中会出现偏差与错误,给食物分析带来不确定性
[57]。食性研究通常会在研究对象食物范围有大致了解的基础上,选择对主要食物类群针对性较好的引物或设计新引物
[58]。然而,一种引物对其所能覆盖的分类学单位中的不同物种DNA片段有不同的结合效率,会使输出的序列数量出现正偏倚或负偏倚
[59]。对于食物组成分类学跨度较大的物种,由于无法用单一引物覆盖所有食物类群,上述问题会更加棘手
[60]。针对这类问题,da Silva开发了一种利用多个鉴定范围重叠的标记来分析鸟类食物组成,并对不同引物的结果进行整合得到更全面的食物组成情况
[24]。有学者制定了“一个位点多个引物集”(one⁃locus⁃several⁃primer⁃sets, OLSP)的策略,即使用针对相同位点(如
COI基因的某部分)和同一分类群(如无脊椎动物)的几个引物集,该策略通过增加多个引物集来提高样本中物种总覆盖率
[61]。
②难以根据检测结果对摄入的食物量做出准确量化。由于大多数鸟类的食物都包含多个物种,不同种生物体内DNA标记含量、不同部位身体组织DNA标记含量不同
[62],导致测序得到的物种序列丰度比例并不能代表鸟类摄食时的物种比例。同时,不同种食物的消化难度差异也会影响粪便等样本中残留的DNA比例
[63],也将导致最终得到的数据无法还原食物数量上的原貌。现有研究中,评估使用DNA方法获得的定量数据准确性的一种方法是通过研究已知食性的圈养动物粪便中的食物DNA获得准确的定量数据
[64]。
③无法判断食物所处生活史阶段
[65]。判断食性组成除了鉴别物种外,另一个重要信息是食物所处的生活史阶段。物种在不同的生长发育时期,作为食物提供的营养价值不同,可能某种动物在成年期对于鸟类而言是低质量食物,而在幼年期是高质量食物。此外,许多无脊椎动物在不同生活史阶段形态和行为差异巨大,如具有完全变态发育过程的昆虫类群,许多物种的幼虫阶段、蛹与成虫阶段生活区域与运动方式截然不同,其对于捕食者的捕食过程而言等同于三种食物,而在使用DNA方法时只会显示为无区别的同一物种,会对后续的分析造成干扰。笔者认为,可以结合野外觅食行为观察和粪便显微分析对鸟类食物所处的生活史阶段进行判断。
5 未来展望
DNA宏条形码技术在鸟类食性分析中的优势在于降低了精确鉴定物种的难度,避免了形态学鉴定环节中由于研究者主观原因造成的鉴定错误,以及能够做到对混合样本中不成型的食物成分进行鉴定。主要面临的困难在于参考样本序列库的不完备、缺乏食物生活史状态的数据,以及食物量化困难。用于物种DNA条形码序列比对的国际数据库平台建设一直在进行(如NCBI GenBank,BOLD),BOLD数据库已有超过110万条DNA条形码样本序列(2022年9月检索),对常见物种的覆盖会越来越全面。部分食性研究会对鸟类生活环境中的潜在食物进行本底采样,建立针对本研究的小型条形码数据库,以提高食物鉴定时宏条形码比对查阅结果的精度。对于食物所处生活史状态的数据,建议联合形态学方法对食物进行分析以获得全面数据。在研究区域进行本底物种调查划定潜在食物范围
[50],结合采样时间的控制,可以对食物样本(如粪便)中的物种生活史状态进行推断。在食物定量判断方面,如果能获得足以区分不同生物个体的长序列,可以初步判断食物量。Bohmann于2020年提出利用基因组概览(genome skimming)进行物种鉴定的方法
[66],可以跳过DNA宏条形码的PCR扩增环节,一定条件下能够达到鉴别出单个个体的精度,未来具有定量分析食物的潜力。