雪茄烟是一种特殊的烟草制品,风味丰富复杂,能够给人带来浓郁且多层次的味觉和嗅觉体验,深受广大消费者喜爱
[1]。烟叶的优劣是构成雪茄质量好坏的核心,而品种则决定了雪茄烟叶质量,一个优异品种才能最终获得优质的雪茄
[2]。世界上拥有丰富雪茄烟叶种质资源的国家有美国、印度尼西亚、古巴、尼加拉瓜、多米尼加及巴西等,其生产技术高、原材料丰富,雪茄产业发达;而我国的茄衣和茄芯质量水平较低,无法满足工业和消费者的需求
[3]。从国外不同地方引入的雪茄烟叶种质资源可能会出现引入了相同品种,但在不同的引入机构中命名却不同的问题。因此,在利用雪茄烟叶种质资源上存在盲目性,阻碍了良种的选育及推广
[4]。为此,有必要利用分子标记技术准确研究国外优良雪茄烟叶种质资源的遗传背景及遗传多样性,避免盲目选种。
分子标记技术推动着作物育种的迅速发展,有许多作物都利用分子标记技术研究其遗传多样性。相比于限制性内切酶片段长度多态性(RFLP)、随机扩增多态性DNA标记(RAPD)、扩增片段长度多态性(AFLP)、简单重复序列标记(SSR)、简单重复序列间扩增(ISSR)等传统第一、第二代分子标记技术,单核苷酸多态性(SNP)标记具有分布广泛、容易检测、稳定性优良等诸多优点。SNP分子标记近年来广泛参与到种质资源遗传多样性分析和品种鉴别的研究中
[5],基因芯片是一种高通量SNP分析方法
[6]。伴随着测序技术的发展,测序技术与分子标记技术相结合的方法已经在植物中得到广泛应用。例如,利用SNP位点开发的液相芯片可以快速且高效地进行遗传多样性分析,极大地缩短了分析的时间,同时加快了育种进程
[7]。龙晓波等
[8]通过水稻50K液相基因芯片对红米材料遗传多样性进行解析,发现其遗传多样性水平较低。张剑锋等
[9]运用SNP芯片技术对烟草材料展开遗传多样性研究,发现主栽烟草品种之间的亲缘关系相对较近。
本研究采用华智生物技术有限公司1.5K mGPS液相芯片检测技术对国外引进的80份雪茄烟叶种质资源进行了亲缘关系以及遗传多样性分析,旨在为优良雪茄烟叶种质资源的高效利用提供理论依据。
1 材料和方法
1.1 试验材料
供试材料共80份,其中来自古巴的材料55份、美国9份、印度尼西亚5份、多米尼加3份、巴西2份、尼加拉瓜2份、西班牙2份、英国1份、法国1份,由中国烟草总公司海口雪茄研究所提供。同名异种的材料用字母区分,同一材料出现分离后代对单株进行遗传分析,并用数字进行区分,所用材料总共80份(
表1)。
1.2 试验方法
全部材料于2022年12月种植于海口雪茄研究所屯昌试验基地,每份材料种植100株,小区面积为50 m2,常规水肥管理,待中心花开放时取样。如果一份材料在田间表现出不同的农艺性状,则每种类型取1个单株的叶片。
1.3 基因型鉴定
在烟株生长到中心花开放时取样,利用CTAB法
[10]提取DNA并完成质量检测。然后通过1.5K mGPS液相芯片进行基因型检测,通过Illumina测序仪进行测序。首先获取符合要求的质控测序数据:MAF不得低于0.05,miss不得超过0.2,然后利用Burrows-wheeler aligner进行序列对比
[11],最后通过突变分析软件Genome analysis toolkit获取SNP位点基因型
[12],筛选Indel和SNP标记。
1.4 遗传多样性分析
通过计算多态性信息含量(PIC)、位点的杂合率(Het)以及最小等位基因频率(MAF)等多个多态性指标,对SNP位点的遗传多样性水平展开分析。
1.5 群体结构和亲缘关系分析
通过Admixture软件对SNP标记数据进行分析,获取80份雪茄烟叶种质资源的群体结构
[13],确定准确合适的亚群数(K值)。然后通过plink软件进行遗传距离计算
[14],最后利用邻接法(Neighbor-joining,NJ)对雪茄烟叶种质资源进行聚类分析,获取亲缘关系聚类图。
2 结果与分析
2.1 80份雪茄烟叶种质资源的SNP基因型
利用华智雪茄烟叶1.5K mGPS液相芯片对80份雪茄烟叶种质资源进行检测,一共得到1 662个SNPs。通过质控过滤保留高质量的SNP位点,最终得到1 212个高质量的SNP位点。获得的SNP位点在每条染色体上的分布个数为32~75个,其中SNP位点在5号染色体上分布最多。各染色体上标记间物理距离为2 459 579~5 052 476 bp,平均物理距离为3 381 020 bp(
表2)。这些SNP位点可以用于雪茄烟叶的遗传背景以及遗传多样性分析。
2.2 80份雪茄烟叶种质资源的遗传多样性
2.2.1 全基因组SNP位点多态性
通过计算多个多态性指标对1 212个高质量SNP位点的多态性水平进行分析,发现最小等位基因频率变化范围是0.05~0.50,平均值是0.19,其中包含880个(72.6%)最小等位基因频率大于0.10的SNP位点(
图1);对雪茄烟叶24条染色体多态性信息含量分布规律分析发现,多态性信息含量的变化范围是0.090 5~0.375 0,平均值是0.23,其中包含568个(46.9%)多态性信息含量>0.25的中高多态性位点(
图2)。通过对雪茄烟叶种质资源纯合度进行分析(
图3),发现其纯合度高,杂合率大于2%的有18份(1.4%),杂合率大于5%的有3份(0.2%)。上述结果说明,80份雪茄烟叶种质资源间的位点遗传多样性较低。
2.2.2 种质资源间遗传距离
根据1 212个SNP位点计算样本间的IBS遗传距离,其变化范围是0~0.708 6,平均值是0.285 7。遗传距离小于0.2的个数为1 158个,占总体个数的36.6%;0.2~0.6的个数有1 966个,占总体个数的62.2%;0.6以上的个数有36个,占总体个数的1.1%(
图4)。其中,古巴品种9-2-2(Habano 2000)与法国品种23-12-1(Paris wrapper)之间的遗传距离为0.708 6,遗传距离在80份雪茄烟叶种质资源中最远,说明古巴品种Habano 2000与法国品种Paris wrapper属于不同的烟草亚种。2022C10-2(Cuba8hao-2)和2022C11-1(Cuba9hao-1)、2022C16-4(HN-W)和2022C26-2(SD-7)、2009-2-2(Habano 2000)和15-2-1(Tobacco vuelta abajo)的遗传距离均为0,说明材料间的差异位点个数是0,将上述材料判定为疑同材料。上述结果显示,在80份雪茄烟叶种质资源里,大部分材料的遗传距离较近,遗传差异并不显著。
2.3 80份雪茄烟叶种质资源的遗传结构
2.3.1 群体结构
通过Admixture软件对80份雪茄烟叶种质资源的群体结构和遗传组分进行分析,发现当K值=7时,交叉验证错误率(CV值)最小。所以,80份雪茄烟叶种质资源划分为7个亚群最为适宜(
图5)。依据群体结构图可知(
图6),其中部分亚群样本的遗传组成单一,仅有少部分材料的遗传组分具有多个来源,这说明了类群之间的基因交流较少,而材料之间存在一定程度的基因交流。
7个亚群一共有46份种质资源遗传背景纯合度较高,其中,第1亚群(深蓝色)3个(HN-B2、SD-2-W、GBX1);第2亚群(浅紫色)8个(Corojo99 C、HN-W、HN-B1、Criollo A、SD-7、Habana2012、SD-2-S、SD-6);第3亚群(红色)4个(Connecticut broadleaf A、Negro black tobacco、Paris wrapper、Tobacco madole);第4亚群(绿色)4个(Corojo99 B-3、Habano 92-2、Habano 92-3、Connecticut broadleaf B-2);第5亚群(黄色)15个(Guyin3hao、Guyin4hao、Guyin5hao、Cuba4hao、Cuba5hao、Cuba7hao、Cuba8hao-1、Cuba8hao-2、Havana 2000-2、Cuba9hao-1、Cuba9hao-2、Dominica long leaf、Criollo98 A-2、Corojo99 A-1、Corojo99 A-2);第6亚群(橙色)6个(San vicente-1、Sumatra deli-1、Sumatra deli-2、Connecticut Shade B、San vicente-2、Lancaster leaf);第7亚群(紫色)6个(Havana 2000-1、HN-G、Corojo99 A-3、Criollo98 C-2、Corojo99 B-2、Criollo98 A-1),另外34份种质资源的遗传组分较为复杂。
2.3.2 亲缘关系
根据1 212个高质量SNP位点,通过plink软件计算IBS遗传距离。通过构建聚类树(
图7)发现,80份雪茄烟叶种质资源除了2022C10-2和2022C11-1、2022C16-4和2022C26-2、2009-2-2和2015-2-1可能是异名同种外,还有大量近似的材料,例如,2022C01-2(Guyin3hao)和2022C09-1(Cuba7hao)、2022C10-1(Cuba8hao-1)和2022C11-3(Cuba9hao-2)、2022C21-4(HN-B2)和2022C24-1(GBX1)、2022C21-4(HN-B2)和2022C28-1(SD-2-W)、2022C24-1(GBX1)和2022C28-1(SD-2-W)、2022C40-3(Connecticut Shade A)和2022C41-1(Havana Connecticut)、2022C04-5(Guyin5hao)和2022C97-6(Criollo98 A-2)遗传距离均为0.000 4,趋近于0,种质资源间相似度极高。SNP标记能够准确区分相同以及相似种质,而且可以将同一种质不同类型的单株划分到不同的群里,结果表明,这些同一种质的不同类型单株属于不同种质,说明其中的部分种质出现严重混杂,在利用种质资源时需要格外注意。
3 结论与讨论
我国烟草种质资源十分丰富,但国内雪茄烟叶优良品种严重匮乏,引进国外优良品种是迅速实现良种化的重要途径
[15]。在种质创新、杂交亲本选择以及遗传改良时,了解品种间的遗传多样性与亲缘关系显得格外重要。通过表型指标进行基因分型时,通常存在周期漫长、消耗多、操作繁琐以及准确度不高等问题,然而通过分子标记进行遗传多样性分析会更为准确和稳定
[16]。近年来,对于遗传多样性的研究大多使用的是SSR分子标记法,如王琰琰等
[4]利用SSR分子标记进行遗传多样性分析,发现我国雪茄烟叶种质资源具有较高的遗传多样性,并利用14对核心引物构建了指纹图谱。向小华等
[17]利用SSR分子标记进行雪茄烟原料种质资源遗传多样性分析,筛选出15对核心引物并构建了供试材料的指纹图谱。张华述等
[18]采用农艺性状与SSR分子标记相结合的方式对雪茄烟叶种质进行遗传多样性分析,通过聚类分析将供试种质划分为4个类群,为品种溯源研究提供线索,从而促进四川雪茄烟叶种质资源的开发和利用。近年来,SNP分子标记已经逐渐在植物亲缘关系和遗传多样性分析的研究中成为热点,其中基因芯片法是利用SNP进行基因分型的方法之一。程斌等
[19]利用120K液相芯片对310份小麦材料进行基因分型,揭示了我国部分育成小麦品种的遗传多样性差异,为种质的合理利用提供参考。本研究
通过液相芯片对雪茄烟叶种质资源进行遗传多样性分析,发现80份雪茄烟叶种质资源的遗传多样性较低,SNP标记能够准确区分遗传背景相同以及相近的种质资源,是首批成功借助mGPS液相芯片开展雪茄烟叶种质资源亲缘关系和遗传多样性分析。
目前,引进的雪茄烟叶品种大部分为古巴品种,与古巴亲缘关系较远的品种仅占少数
[20]。古巴雪茄烟叶品种抗病性好、易晾制等优点值得深入研究,可以通过深入挖掘相关基因对我国雪茄烟叶品种进行改良
[21]。另外,可以充分利用那些与古巴品种亲缘关系相对较远的品种,以此来有效地拓展亲本的遗传多样性,从而为进一步的品种改良和创新提供更多的可能性和丰富的遗传基础,丰富雪茄烟叶遗传背景。本研究发现,国外80份雪茄烟叶种质资源中,有3个被判定为疑同品种,还有大部分近似品种,品种相似度极高,可能是相同品种流入不同国家种植后,为了适应当地生长环境而发生了基因突变。去除重复种质后,共筛选到77份雪茄烟叶种质资源,可以将这些品种作为骨干亲本,有针对性地对我国现存的雪茄烟叶种质资源进行深度改良,致力于培育出具有自主知识产权的高品质优良雪茄烟叶品种,推动我国雪茄烟叶产业的发展,丰富我国雪茄烟叶种质资源库,生产出适合我国人民口味的雪茄烟,打造独属于我国自己的雪茄烟品牌。