栽培大麦和野生大麦叶绿体基因组密码子偏好性比较分析

谢刘义 ,  任璇 ,  应文博 ,  肖焱波 ,  杨青松

云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (03) : 268 -276.

PDF (1751KB)
云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (03) : 268 -276. DOI: 10.3969/j.issn.1672-8513.2025.03.003
农业与食品

栽培大麦和野生大麦叶绿体基因组密码子偏好性比较分析

作者信息 +

Comparative analysis of chloroplast genome codon usage bias in cultivated and wild of barley

Author information +
文章历史 +
PDF (1792K)

摘要

基于裸大麦、普通大麦和野生大麦叶绿体基因组编码序列,分析其密码子使用偏好及差异.结果显示,3者不同窗口大小的胞嘧啶和鸟嘌呤(GC)含量在密码子不同位点(GC1、GC2、GC3)呈梯度递减趋势(46.74%/46.80%/46.63%、39.47%/39.43%/39.43%、29.80%/29.75%/30.25%),且均存在31个高偏好密码子(RSCU>1),其中29个以A/U结尾,呈现显著NNA/NNU结尾偏好.叶绿体基因组有效密码子数(ENC)值(47.14、47.02、47.75)及ENC>45的基因占比(39、39、42个)表明整体密码子偏好性较弱.中性绘图、ENC-plot和PR2-plot分析证实自然选择是密码子偏好形成的主要驱动力.栽培大麦(裸大麦与普通大麦)在GC组成、ENC分布及最优密码子(含特有GCA/AGA)上高度趋同,提示人工驯化通过纯化选择强化了有益性状的遗传稳定性,为解析大麦驯化分子机制提供了新视角.

关键词

裸大麦 / 普通大麦 / 野生大麦 / 最优密码子 / 选择作用

Key words

H.vulgare var.Coleste / H.vulgare ssp.vulgare / H.vulgare ssp.spontaneum / optimal codons / selection

引用本文

引用格式 ▾
谢刘义,任璇,应文博,肖焱波,杨青松. 栽培大麦和野生大麦叶绿体基因组密码子偏好性比较分析[J]. 云南民族大学学报(自然科学版), 2025, 34(03): 268-276 DOI:10.3969/j.issn.1672-8513.2025.03.003

登录浏览全文

4963

注册一个新账户 忘记密码

叶绿体是植物和一些藻类执行光合作用功能的细胞器.由于其基因组结构相对保守、进化速率低,因而叶绿体基因组的研究在多领域具有广泛的应用,包括DNA条形码技术、系统发育分析1、基因工程育种2和生态进化3等.密码子是氨基酸的编码单元,也是基因表达的基本单位4,同义密码子在基因组中的使用呈现不同的频率,这被称为密码子偏好性(PR2).密码子偏好性是基因表达的重要影响因素之一,直接影响蛋白质合成的效率和准确性.通过密码子偏好性分析,能够更全面地了解分子进化、基因调控等生物学过程,这对于研究物种演化和提高外源基因的表达具有重要意义5.如赵春丽等6通过研究苋菜AtGAI基因密码子偏好性,从而筛选该基因的受体系统.随着组学技术发展的日新月异,叶绿体基因组密码子偏好性研究成果出现井喷式报道,根据中国知网初步统计仅2023年中文期刊报道的研究就多达140篇,涉及73科119属442种.密码子的偏好性受多种因素的影响,包括基因长度、基因表达水平、翻译的起始信号、蛋白质氨基酸组成和结构、突变压力以及自然选择等7-10.进行密码子偏好性研究,不仅有助于揭示物种间适应性进化中的差异,理解蛋白质的合成,为更好地利用植物提供科学依据;而且有助于拓展密码子偏好性在植物叶绿体基因组中的普遍规律,在基因工程、育种和生态学研究等领域具有重要意义.
禾本科大麦属(Hordeum Linn.)是地球上的主食谷物和粮食作物,常见的栽培品种主要有裸大麦和普通大麦两种,均由野生大麦驯化而成.作为重要的粮食作物,大麦属植物的基因组已完成测序、拼接和注释,但是目前未见关于其叶绿体基因组的密码子偏好性研究.普通大麦(H. vulgare ssp. vulgare)广泛种植于世界各地,作为野生大麦(H. vulgare ssp. spontaneum)的驯化品种,通常比野生大麦高大,穗子更紧密,颗粒较大,是世界上最重要的粮食作物之一11.裸大麦(H. vulgare var. coeleste)作为青藏高原地区常栽培的粮食经济作物,一年生,当前的研究聚焦于种质资源、病害防治12、食品发酵加工13、保健品开发14等方面.本文对裸大麦、普通大麦和野生大麦叶绿体基因组密码子偏好性进行分析,将为研究3种大麦优化异源基因,预测基因功能、基因表达等方面提供参考.

1 材料与方法

1.1 蛋白编码序列获取

完整的裸大麦(KT962228)、普通大麦(EF115541)与野生大麦(KC912689)的叶绿体基因组序列从NCBI上下载获得,去除序列长度 < 300 bp、非ATG起始、非TAG,TAA,TGA终止的序列,以及蛋白编码序列(coding sequence,CDS)内部存在终止密码子的序列.最终分别获得50条裸大麦CDS序列、50条普通大麦CDS序列和53条野生大麦CDS序列用于后续分析.

1.2 密码子组成分析

参照李江飞等15的分析方法,通过在线软件CUSP (https://www.bioinformatics.nl/cgi - bin/emboss/cusp)计算每个基因的密码子数量、GC占比(分别为GC1、GC2、GC3)及3位碱基的GC平均占比(GCall)、有效密码子数(effective number of codon,ENC)、同义密码子相对使用度(relative synonymous codon usage,RSCU),并使用R包进行相关性分析.

1.3 密码子偏好性分析

通过中性绘图、ENC - plot和PR2 - plot开展叶绿体基因组密码子偏好性分析.中性绘图以GC1和GC2的平均值(GC12)为纵坐标,以GC3为横坐标,每个基因用一个散点表示16.在ENC - plot散点图中纵坐标为ENC值,横坐标为GC3值,标准曲线的公式为ENC = 2 + GC3 + 29/(GC3 2 + (1 - GC3217.分析研究得到密码子在第3位上的A、T、C、G占比,并通过PR2 - plot绘图,图中纵坐标为A3 /(A3 + T3),横坐标为G3/(G3 + C3).

1.4 最优密码子的确定

参考袁晓龙等18实验方法,使用ENC值为参考,从两端各选择10%的基因构建高、低偏好性密码子库.ΔRSCU ≥ 0.08确定为高表达密码子,RSCU值 > 1确定为高频率密码子.最终,同时满足以上二者条件的密码子将被确定为最优密码子.

2 结果与分析

2.1 密码子组成特征分析

表1可知,3种大麦GC占比均为GC1 > GC2 > GC3,且 < 0.5,GC1平均占比分别为46.74%、46.80%和46.63%,GC2平均占比为39.47%、39.43%和39.43%,GC3平均占比为29.80%、29.75%和30.25%.ENC均值分别为47.14、47.02和47.75.裸大麦与普通大麦叶绿体基因组CDS区ENC值均为38.03(psbA) ~ 60.25(infA),野生大麦ENC值分别38.03(psbA) ~ 60.81(ycf15),psbA基因展现出较强的密码子偏好性,而infA基因其密码子偏好性不强.

对GC1、GC2、GC3、GCall及ENC值进行相关性分析(表2)发现,3种大麦中,ENC值与GC1、GCall相关性不显著,与GC3极显著相关,GCall与GC1、GC2、GC3极显著相关,GC1和GC2显著相关.在裸大麦与普通大麦中,ENC值与GC2显著相关,GC1与GC2、GC3相关性显著;在野生大麦中,ENC值与GC2相关性不显著,GC1仅与GC2呈显著相关性.ENC值与3种大麦GC3值均存在极显著相关性,且相关系数均大于0.5,表明密码子的选择受到其第3位碱基的组成的影响.

使用TBtools对叶绿体基因组密码子的RSCU值进行可视化分析发现,3种大麦有31个密码子的RSCU值 > 1(包括1个终止密码子 - UAA),13个密码子以A结尾,16个密码子以U结尾,其余2个分别以C/G结尾(图1).其中编码亮氨酸(Leu)的密码子UUA其相对使用频率最大,在裸大麦和普通大麦中分别为2.091 0、2.093 4,在野生大麦中为2.063 4.且3种大麦均偏好使用UAA为终止密码子,RSCU值分别为1.620 0,1.620 0,1.471 8.同时,在3物种中,编码色氨酸(Trp)的密码子UGG并未出现偏倚,RSCU值均为1.

2.2 中性绘图分析

图2所示,3种大麦的GC3值位于0.220 4 ~ 0.443 6之间,GC12值位于0.350 7 ~ 0.534 8之间,裸大麦与普通大麦的CDS基因分布在图中基本重合,可知二者的GC占比非常接近,且二者的全部CDS基因均位于图中对角线上方;而野生大麦的CDS基因有一个位于图中对角线下方.中性分析回归系数分别为0.172、0.152和0.154,表明3种大麦的叶绿体基因组密码子偏好性主要受到自然选择的影响.

2.3 ENC - plot分析

ENC - plot的分析(图3)结果表明,3种大麦分别有39、39和42个CDS基因ENC值 > 45,且大部分CDS基因位于标准曲线的附近的下方.ENC比值频数分布(表3)显示,3种大麦中,分布在0.05 ~ 0.15之内的CDS基因均为31个,占比分别为62%、62%和58.5%,即大部分CDS基因距ENC期望值较远,表明绝大多数基因密码子的偏好性受到选择的影响更大,而受突变压力的影响较小.

2.4 PR2 - plot分析

PR2 - plot绘图分析结果如图4所示,3种大麦各基因并未均匀分布在图中的4个区域内,且各CDS基因密码子第3位碱基的使用频率T > A,G < C.同样表明对造成3种大麦叶绿体基因组的密码子偏性,选择的影响较突变的影响更大.

2.5 最优密码子的筛选

裸大麦与普通大麦叶绿体基因组的CDS基因最优密码子筛选结果相同(表4),ΔRSCU ≥ 0.08的密码子个数均为21个,RSCU > 1的密码子均为30个,最优密码子有16个,分别为GCA、GCU、AGA、CGU、GAU、UGU、GGU、AUU、UUA、AAA、CCA、CCU、AGU、UCU、ACU和GUU,全部密码子以A/U结尾.野生大麦叶绿体基因组,ΔRSCU ≥ 0.08的密码子个数为22个,RSCU > 1的为30个,最优密码子19个,分别为GCU、CGU、GAU、UGU、GGU、AUU、UUA、AAA、UUU、CCA、CCU、AGU、UCA、UCU、ACA、ACU、UAU、GUA和GUU,均以A/U结尾.最优密码子中,GCA和AGA为裸大麦与普通大麦特有,UUU、ACA、UAU、GUA和UCA为野生大麦特有.

3 讨论与结语

在物种长期的适应性进化过程中,编码蛋白基因的密码子往往会对特定的氨基酸产生选择性,被称为密码子的偏好性.本研究对裸大麦、普通大麦和野生大麦叶绿体基因组的密码子偏好性展开分析,3种大麦的CDS平均GC占比为GC1(46.63% ~ 46.80%)、GC2(39.43% ~ 39.46%)和GC3(29.75% ~ 30.25%),较低的GC3也说明密码子更偏好以A/U结尾,最优密码子的结果印证了这一点.该结果与水稻19,小麦及棉花20等叶绿体基因组密码子使用偏好性相似,这一定程度上表明叶绿体基因组在禾本科中比较保守,而且与高山松(Pinus densata21、云南油杉(Keteleeria evelyniana22等高等植物的叶绿体基因组碱基组成研究结果也一致,进一步支持Campbell和Gowri提出的“高等植物密码子倾向于使用A/T结尾的假设23.

3种大麦ENC均值分别为47.14、47.02和47.75,均大于45,说明各物种密码子偏好性较弱.筛选出的最优密码子均以A/U结尾,无C/G结尾.与Qi等24提出的从低等植物到高等植物(藻类、苔藓植物、蕨类植物、裸子植物和种子植物)偏向NNA/NNU的密码子模式类似.此特点与黄芩(Scutellari baicalensis25、滇重楼(Paris polyphylla var. yunnanensis26、金花茶(Camellia nitidissima27等植物中叶绿体密码子偏好NNA/NNU结果一致,说明高等植物不同物种之间密码子使用特性存在着一定的相似性.中性绘图分析与ENC - plot分析均表明,3种大麦叶绿体基因组密码子的偏好性受到自然选择的影响作用更大.突变和正向选择通常导致最优密码子的多样性增加,而突变和纯化选择则会减少最优密码子的多样性28.野生大麦的叶绿体基因组最优密码子数量和类型均比栽培大麦多,表明野生大麦受到了更多的正向选择,这同样意味着在长期的驯化栽培过程中,栽培大麦在为了保持人类所需要的有益或稳定的性状,受到了更多的纯化选择.本文初步探究了禾本科3种大麦的密码子偏好性情况,为后续提高目的基因的表达效率,外源基因的优化以及相关的育种工程和遗传资源的开发提供参考.

参考文献

[1]

刘蕊,王贝,郭朋,木犀科叶绿体基因组比较及DNA条形码分析[J/OL].分子植物育种2023[2023-05-05].

[2]

于一凡,欧阳臻,郭娟,植物质体基因工程调控元件研究进展[J].遗传202345(6):501 - 513.

[3]

王晓娟,董文攀,周世良.基于叶绿体基因组分析我国苜蓿属植物演化路径[J].生态学报202242(15):6125 - 6136.

[4]

梁皓辉.富油新绿藻叶绿体基因组测序及几种产油微绿藻叶绿体基因比较研究[D].广州:广东海洋大学食品科技学院, 2021:6 - 9.

[5]

ZHOU Z DANG Y ZHOU M, et al. Codon usage is an important determinant of gene expression levels largely through its effects on transcription[J]. Proceedings of the National Academy of Sciences2016113(41):6117 - 6125.

[6]

赵春丽,彭丽云,王晓,苋菜AtGAI基因密码子偏好性与进化分析[J].中国农业大学学报201924(12):10 - 22.

[7]

BAEZA M ALCAÍNO J BARAHONA S, et al. Codon usage and codon context bias in Xanthophyllomyces dendrorhous [J]. BMC Genomics201516(1):293.

[8]

ROMERO H. Codon usage in Chlamydia trachomatis is the result of strand - specific mutational biases and a complex pattern of selective forces[J]. Nucleic Acids Research200028(10):2084 - 2090.

[9]

PARK I SONG J H YANG S, et al. Comparative analysis of Actaea chloroplast genomes and molecular marker development for the identification of authentic cimicifugae rhizoma[J]. Plants20209(2):157.

[10]

ZHENG G WEI L MA L, et al. Comparative analyses of chloroplast genomes from 13 Lagerstroemia (Lythraceae) species: identification of highly divergent regions and inference of phylogenetic relationships[J]. Plant Molecular Biology2020102(6):659 - 676.

[11]

闫松显.不同来源一年生野生大麦与栽培大麦的遗传多样性以及染色体组差异分析[D].武汉:华中农业大学植物科学技术学院,2015:1 - 18.

[12]

向思琪,羊海珍,旺姆.青稞种质资源对大麦黄矮病毒的抗性鉴定和生理分析[J].植物遗传资源学报202324(4): 1007 - 1015.

[13]

丁双鲲,杜恺,袁增慧,赖氨酸对青稞面包品质及风味特征的影响[J].食品与发酵工业202349(7):256 - 263.

[14]

夏虎,晏熙玥,卢利聃,青稞的营养功能及其高值化利用研究进展[J].食品工业科技202243(20):403 - 413.

[15]

李江飞,李熙颜,王瑜,滇楸叶绿体基因组密码子偏好性分析[J].基因组学与应用生物学202241(4):843 - 853.

[16]

SUEOKA N. Translation - coupled violation of Parity Rule 2 in human genes is not the cause of heterogeneity of the DNA G + C content of third codon position[J]. Gene1999238(1):53 - 58.

[17]

WRIGHT F. The 'effective number of codons' used in a gene[J]. Gene199087(1):23 - 29.

[18]

原晓龙,李云琴,张劲峰,降香黄檀叶绿体基因组密码子偏好性分析[J].广西植物202141(4):622 - 630.

[19]

CHAKRABORTY S YENGKHOM S UDDIN A. Analysis of codon usage bias of chloroplast genes in Oryza species[J]. Planta2020252(4):67.

[20]

TIAN G LI G LIU Y, et al. Polyploidization is accompanied by synonymous codon usage bias in the chloroplast genomes of both cotton and wheat[J]. PLOS One202015(11):e0242624.

[21]

李江飞,李亚麒,唐军荣,高山松叶绿体基因组密码子偏好性模式[J].生物学杂志202340(1):52 - 59.

[22]

李江飞,王瑜,颜廷雨,云南油杉叶绿体基因组密码子偏好性分析[J].中南林业科技大学学报202242(4):30 - 39.

[23]

CAMPBELL W H GOWRI G. Codon usage in higher plants, green algae, and cyanobacteria[J]. Plant Physiology199092(1):1 - 11.

[24]

QI Y XU W XING T, et al. Synonymous codon usage bias in the plastid genome is unrelated to gene structure and shows evolutionary heterogeneity[J]. Evolutionary Bioinformatics201511:65 - 77.

[25]

王文斌,于欢,邱相坡.黄芩叶绿体基因组重复序列及密码子偏好性分析[J].分子植物育种201816(8):2445 - 2452.

[26]

王宇飞,江媛,杨成金,滇重楼叶绿体基因组特征及密码子偏好性分析[J].分子植物育种202119(22):7448 - 7458.

[27]

耿晓姗,贾魏,陈佳宁,金花茶叶绿体基因组密码子偏好性分析[J].分子植物育种202220(7):2196 - 2203.

[28]

HERSHBERG R PETROV D A. Selection on codon bias[J]. Annual Review of Genetics200842(1):287 - 299.

基金资助

云南省高层次人才培养支持计划项目(YNWR-QNBJ-2020-287)

国家中医药管理局全国中药资源普查项目(GZY-KJS-2018-004)

AI Summary AI Mindmap
PDF (1751KB)

245

访问

0

被引

详细

导航
相关文章

AI思维导图

/