微生物群是一个庞大的群落集合体,其中包含单细胞细菌、病毒、真菌、古细菌和真核生物。而微生物组则代表着这些生物体在生物体内所携带的遗传信息及它们之间的相互作用。作为一个动态变化的实体,人类微生物群在人的一生中会经历许多变化,以适应各种环境和个人因素,如吸烟习惯、药物治疗、饮食习惯和医疗保健状况等
[1-3]。微生物群落与人类生活紧密相连,它们不仅参与人类的正常生理活动,还在死后尸体的腐败分解过程中以及死亡时间的推断中发挥着重要作用
[4]。近年来,对于水中尸体死亡时间推断开展了多个方面的研究,主要包括尸体腐败评分系统
[5-6],生化检测等
[7]。然而,这些方法大多数不够精确或客观。近些年,随着新一代测序技术的快速发展,特别是16s rDNA序列技术的发展,使得获得样本的微生物组整体特征信息成为可能,进而实现对微生物群落构成及其动态变化的深度分析,此项技术的发展为全面且系统地探究微生物群落赋予了前所未有的深度与广度
[8]。
有研究表明,微生物群落在尸体腐败过程中发挥了重要作用,并且微生物群落及其组成可能发生规律性演替
[9]。目前研究发现,尸体微生物的变化在尸体不同部位、不同死因、不同环境下有所不同,其中包括溺死和非溺死尸体间的微生物差异。海南四面环海,溺死案件相对多发,且由于气温高,尸体发现时多腐败,但目前海水尸体内部器官组织的微生物变化的研究报道缺乏。盲肠内微生物较为丰富,且其相对封闭,并便于取材。故本研究拟模拟海南岛年平均气温和湿度的环境
[10-11],构建海水溺死及死后入水动物模型,并运用16s rDNA测序技术对水中尸体盲肠的微生物群落在不同死亡时间的状况进行检验。结合生物信息学方法,探讨溺水与对照组间微生物群落的差异及其死后演替规律。此外,应用随机森林机器学习算法来推断死后淹没时间(postmortem submersion interval,PMSI),为判断海水中腐败尸体死因及推断死亡时间中相关问题进行实验性探索。
1 材料与方法
1.1 试验动物和分组
健康成年SD(sprague dawley)大鼠70只(体质量220~250 g),随机分为海水溺死组(seawater drowning group,以下简称D组)和死后入水组(postmortem submersion group,以下简称PS组)。根据前期预实验结果,D组和PS组大鼠,按照死后经历时间(0、12、24、36、48、72、96 h)分别分为7个实验亚组,每亚组各5只实验动物。
实验前,在清洁环境下饲养实验动物,保证12 h昼夜节律,自由进食、饮水,适应性饲养1周后开展实验。实验中各项操作均符合中华人民共和国国务院颁布的《中国实验动物工作管理》的规定,并通过了海南医科大学实验动物福利与伦理审查(伦理审批号:HYLL-2021-346号)。
1.2 动物模型的制备
实验中海水取自海南岛某海岸附近海水,实验地点为实验室恒温气候箱,整个实验期间的温度控制模拟海南岛年平均气温条件23.1~27.0 ℃,故本研究实验设计将恒温气候箱温度控制在25 ℃,湿度控制在80%
[10-11]。动物实验开始前提取现场水样标本,-80 °C保存备检。
溺死动物模型:实验当天,随机挑选35只大鼠,将它们放入无菌的袋子中,使其完全浸没在水中,并按照将大鼠置于水中1 min,然后在水上呼吸30 s,重复此循环直至大鼠死亡。然后将大鼠放入已提前放置于上述实验条件的气候箱内已盛有前步所取海水的透明塑料箱中。
死后入水动物模型:随机选取35只大鼠置于无菌密封空塑料箱中(箱子的顶部有孔道并通过橡胶管连接于CO2瓶),打开CO2瓶的通气阀向泡沫箱中通入CO2约5 min,直至确定实验动物无活动、无呼吸、瞳孔放大且心跳停止后,再观察2 min,确认死亡。然后将大鼠放入已提前放置于上述实验条件的气候箱内、已盛有海水的透明塑料箱中。
1.3 检材的提取
分别于死后0、12、24、36、48、72、96 h共7个固定时间点分别从2种死因组中随机各取5只大鼠尸体,于无菌环境下进行解剖。提取大鼠尸体盲肠内容物至无菌冻存管中,并浸入液氮速冻,随后取出置于-80 °C环境中保存备检。实验过程中严格按照无菌操作要求,若发现大鼠出现胸腹部皮肤腐败破溃与胸腹腔相通,则停止对该大鼠尸体的采样工作。
依据以上原则,在实验中,海水溺死组和死后入水组的0、12、24、36、48、72 h这6 个时间点样本均能正常采集,海水溺死组的96 h成功采集3具大鼠尸体,死后入水组96 h时间点成功采集2具大鼠尸体,其余大鼠因腐败严重剔除出实验组。以上共计采集65具大鼠尸体的组织样本。
1.4 DNA提取,聚合酶链反应扩增
采用CTAB法提取样品的总基因组DNA。检测DNA浓度和纯度。根据浓度,用无菌水将DNA稀释至1 ng/µL。以上述得到的已稀释的DNA作为模板,使用特异性引物(341F:CCTACGGGNGGCWGCAG;806R:GGACTACHVGGGTATCTAAT)扩增细菌16S rDNA V3-V4区。所有PCR混合液加入15 µL Phusion® High-FidelityPCRMasterMix(NewEnglandBiolabs)、0.2 µmol/L引物和10 ng基因组DNA模板,在98 ℃下进行1 min的第一次变性,然后在98 ℃(10 s)、50 ℃(30 s)和72 ℃(30 s)下进行30次循环,最后在72 ℃下保持5 min。
PCR产物使用2%浓度的琼脂糖凝胶进行电泳检测。在确认PCR产物合格后,酶标仪测定PCR产物的浓度,根据PCR产物的浓度进行等量混样处理。混匀后再次使用2%的琼脂糖凝胶电泳检测,确认PCR产物的条带。最后,采用通用型DNA纯化回收试剂盒(TianGen)对目的条带进行回收。
1.5 高通量测序
采用NEB Next® Ultra™ Ⅱ FS DNA PCR-free Library Prep Kit构建文库,文库构建完成后经过Qubit和Q-PCR定量。合格的文库使用NovaSeq 6000进行PE 250上机测序。
1.6 测序数据的处理
根据Barcode序列和PCR扩增引物序列从下机数据中将各样本的数据进行拆分,截去Barcode和引物序列后使用FLASH(Version 1.2. 11)对每个样本的reads进行拼接
[12],得到的拼接序列为原始Tags数据(Raw Tags);使用fastp软件(Version 0.23.1)对拼接得到的Raw Tags经过严格的过滤处理得到高质量的Tags数据(Clean Tags)
[13];将Clean Tags数据进行去除嵌合体序列的处理,Tags序列通过与物种注释数据库(Silva database)进行比对检测嵌合体序列,并最终去除其中的嵌合体序列,得到最终的有效数据(Effective Tags)
[14]。
对以上得到的Effective Tags,使用QIIME2(Version QIIME2-202006)软件中的DADA2模块进行降噪,从而获得最终的ASVs(Amplicon Sequence Variants,扩增子序列变异)以及特征表
[15];使用QIIME2软件运用Silva 138.1数据库进行物种注释;使用QIIME2软件进行多序列比对,得到所有ASV序列的系统发生关系;最后对各样本的数据进行均一化处理,以样本中数据量最少的为标准进行均一化处理。后续的Alpha多样性分析和Beta多样性分析都是基于均一化处理后的数据。
1.7 生物信息学分析
1.7.1 Alpha多样性分析
将物种丰度、样本不同分组数据输入至Paleontological Statistics软件中进行α多样性分析,分别计算海水溺死组和死后入水组各时间点各样本的物种多样性:香农-维纳多样性指数(Shannon index)和物种丰富度(Chao-1指数)。
1.7.2 Beta多样性分析
为了衡量不同样本间物种多样性的差异,根据海水溺死组和死后入水组各样本的物种分类信息和物种丰度信息,基于weighted Unifrac距离的计算方法,使用主坐标分析(principal co-ordinates analysis,PCoA)来展示各样本微生物群落的相似性和不同死因(海水溺死和死后入水)引起的微生物群落差异。
1.7.3 生物标志物筛选、PMSI推断模型的建立
使用机器学习中的RF算法基于上述样本数据建立PMSI推断模型,为了筛选生物标志物数据集,使用“randomForest”程序包中内置函数rfcv()探索物种数量与误差之间的关系。并选用相应的生物标志物的OTU作为数据集,运用RF算法对PMSI进行预测,使用Mean Decrease Accuracy和MAE等指标来衡量物种在PMSI推断模型中的重要性。检验水准α=0.05
2 结 果
2.1 海水溺死组和死后入水组大鼠盲肠微生物群落演替
2.1.1 测序结果
海水溺死组和死后入水组共收集到65例盲肠内容物样本,其中,海水溺死组33例,死后入水组32例。通过特异性扩增16S rDNA V3-V4区域,并对产物进行高通量测序,得到原始下机数据后进行数据拼接、过滤及均一化等处理。海水溺死组(
图1A)和死后入水组(
图1B)的稀释曲线均显示,随着测序深度的增加新的ASV鉴定率逐渐降低,这意味着具有良好的序列覆盖率。
2.1.2 微生物群落构成及分布丰度分析
在门、纲、目、科、属、种6个分类水平对海水溺死组和死后入水组大鼠盲肠微生物分别选择相对丰度最高的前10个物种做柱状图进行分析。
在门分类水平上(图
2A、
2G),厚壁菌门(Firmicutes)0 h时的相对丰度在海水溺死组和死后入水组中均最高,并随后整体呈下降趋势;拟杆菌门(Bacteroidetes)在0 h时的相对丰度仅次于厚壁菌门,并随PMSI增加,整体呈现上升趋势。尽管厚壁菌门的相对丰度整体呈下降趋势,在死后入水组中,厚壁菌门在0、12、24、36、48、72、96 h时的相对丰度均最高;但在海水溺死组中,随着死亡时间的增加,拟杆菌门(Bacteroidetes)的相对丰度上升至第一位。
在纲分类水平上(图
2B、
2H),Bacteroidia、Clostridia和Bacilli的相对丰度在海水溺死组和死后入水组中均较高,Bacteroidia的相对丰度在海水溺死组和死后入水组中,随PMSI增加,整体呈现上升趋势。Bacilli的相对丰度在死后入水组的相对丰度远高于海水溺死组,且随着PMSI增加,在海水溺死组中其相对丰度整体呈下降趋势,而在死后入水组中呈升高趋势。随着PMSI增加,Clostridia的相对丰度在海水溺死组中整体呈现先下降后升高的趋势,且在36 h的相对丰度最低;而在死后入水组中,其相对丰度趋于稳定。
在目分类水平上(图
2C、
2I),海水溺死组和死后入水组大鼠各时间点中,Bacteroidales的相对丰度均保持较高水平,且在12 h组的溺死组大鼠的相对丰度最高,超过了总物种丰度的50%;0 h的溺死组大鼠中,乳杆菌目(Lactobacillales)的相对丰度远远低于其他溺死组以及死后入水组。
在科分类水平上(图
2D、
2J),Muribaculaceae在海水溺死组中的相对丰度保持较高水平,而其他科的相对丰度则相对较低。在死后入水组中,除了Muribaculaceae以外,毛螺菌科(Lachnospiraceae)和乳杆菌科(Lactobacillaceae)的相对丰度也保持较高水平,且在0 h时,乳杆菌科的相对丰度最高。并且在12 h前后的相对丰度达到高峰,随PMSI延长其相对丰度有下降趋势。在48 h后,海水溺死组和死后入水组的Muribaculaceae、毛螺菌科(Lachnospiraceae)的相对丰度均出现不同程度的下降趋势;乳杆菌科(Lactobacillaceae)在死后入水组中也显示出上述丰度下降的规律,但是在海水溺死组中,乳杆菌科的相对丰度在48 h到72 h间明显增加。
在属分类水平上(图
2E、
2K),海水溺死组与死后入水组在TOP10物种相对丰度上共有6个相同属,分别为:
Ligilactobacillus、
Bacteroides、
Lachnospiraceae_NK4A136_group、
Lactobacillus、
Dubosiella 、
Romboutsia。海水溺死组中,0 h组时,杜波西氏菌属(
Dubosiella)和罗姆布茨菌属(
Romboutsia)的相对丰度保持较高水平,随着PMSI的增加,相对丰度呈减少趋势,
Ligilactobacillus随PMSI的增加,相对丰度逐渐升高,在36 h组相对丰度达到较高水平,随后其相对丰度有下降趋势;0 h组中,阿克曼氏菌(
Akkermansia)的相对丰度很低,但是随着PMSI的增加,其后各分组中均存在明显的相对丰度。死后入水组中,0 h时,
Lactobacillus的相对丰度最高,并随着PMSI的增加逐渐下降;
Lachnospiraceae_NK4A136_group在12 h组的相对丰度达到峰值,随后相对丰度有下降趋势。0 h组的正常未腐败盲肠内容物的微生物群落,海水溺死组,乳酸杆菌(
Lactobacillus)是非优势种,随着浸没时间的延长,其相对丰度明显增加,而死后入水组中,0 h组时,乳酸杆菌(
Lactobacillus)是明显的优势属,随着浸没时间的延长,其相对丰度明显减少。
在种的分类水平上(图
2F、
2L),海水溺死组与死后入水组在TOP10物种相对丰度上有4个相同物种。在0 h时,海水溺死组中,
Corynebacterium_stationis和
Roseburia_intestinalis的相对丰度较高,随后其丰度呈明显下降趋势,
Bacteroides_sartorii和
Trichinella_pseudospiralis的相对丰度随死亡时间的增加,整体呈上升趋势,且72 h时,
Trichinella_pseudospiralis的相对丰度达到最高,96 h时
Bacteroides_sartorii的相对丰度达到最高;死后入水组中,0 h时,
Lactobacillus_intestinalis的相对丰度最高,并随后呈下降趋势;随着死亡时间的增加,
Methanosphaera_cuniculi的相对丰度呈逐渐升高趋势并趋于稳定。
2.1.3 盲肠内容物微生物群落Alpha多样性分析结果
基于海水溺死组和死后入水组样本进一步分析盲肠中微生物群落的Alpha多样性,基于OTU水平对每个样本进行Alpha多样性分析,来反映盲肠微生物群落的物种丰度和物种多样性。运用Kruskal-Wallis秩和检验进行组间比较,并绘制Aphla多样性指数箱线图(
图3)。
反映群落分布丰富度的指数为Chao-1指数。在海水溺死组中(
图3A),死亡后12 h时的物种丰富度最低,且组间有明显差异(
P<0.01)。说明在0 h后,随着时间的推移,肠道菌群的分解导致微生物菌群的下降。在死后入水组中(图
3C),48 h时的物种丰富度最低,且组间有明显差异(
P<0.01)。
物种多样性指数反映的是物种丰富度和均匀度的综合情况,主要指数有Shannon指数。图中显示,海水溺死组的Shannon 指数(
图3B)变化不明显,表示0~12 h间,物种多样性存在明显差异(
P<0.01),其组间多样性没有明显差异;死后入水组的物种多样性(
图3D),随着死亡时间的增加,在36 h时达到高峰,随后明显下降(
P<0.01)。
2.1.4 盲肠内容物微生物群落PCoA分析结果
根据海水溺死组和死后入水组各样本的物种分类信息和物种丰度信息,基于weighted Unifrac距离的计算方法,使用主坐标分析(PCoA)来展示各样本微生物群落的相似性和不同死因(海水溺死和死后入水)引起的微生物群落差异(
图4)。在海水溺死组中,在海水溺死组中,导致大鼠腐败尸体微生物群落结构变化的主要因素是第一主成分,贡献值为79.9%;第二主成分则贡献值为9.9%(参见
图4A)。总体而言,除个别样本存在差异外,各个时间点分组的样本,在PCoA1的方向上,组间的差异相对较小;在PCoA2的方向上,0 h组和24 h组与其他时间分组存在差异。在死后入水组中,对于腐败尸体的微生物群落结构,第一主成分贡献值为41.1%,第二主成分贡献值为17.2%(
图4B)。在PCoA1的方向上,0 h组样本与其他组样本的微生物群落存在一定差异,而其他组间差异较小;在PCoA2的方向上,除个别样本外,各组间的差异较小。
2.2 随机森林分析以及PMSI推断模型的建立
2.2.1 随机森林参数调优
使用R包randomForest对数据进行随机森林模型拟合参数调优图(
图5),由图可见无论是单个组别或是所有组别分类误差率随着randomForest函数中决策树数量(treeNum参数)的增大而趋于稳定。拟合模型中决策树数量选择5 000。
2.2.2 交叉验证与模型误差率分析
本研究进一步通过R包randomForest中rfcv函数做10折交叉验证并重复1次获得变量选取与模型分类平均误差率的关系,见
图6。交叉验证的结果显示,随着模型中变量数量升高,模型的误差迅速下降,综合考虑样本量和误差率,以16个细菌属来(红圈处对应的
x轴数值)建立的模型误差最合适。
2.2.3 潜在生物标志物的筛选
结合交叉验证结果,选择合适个数的差异特征进行下一步建模。数量选择上可根据上述
图6,选择红圈处对应的x轴数值作为相应的特征个数。依据平均精确度减少(Mean Decrease Accuracy)的值从大到小筛选16个细菌为潜在生物标志物,并作
图7。16个PMSI推断的潜在标志物见
表1。
2.2.4 大鼠RF回归模型的建立
使用python建立RF回归分别对海水溺死组大鼠和死后入水组大鼠进行回归分析,选择上述16个种属的大鼠盲肠微生物数据集中70%的数据作为训练数据集,30%的数据作为验证数据集,并判别正确的大鼠腐败盲肠微生物数据作为测试数据集,最终选择14个属的大鼠盲肠微生物对海水溺死组大鼠的PMSI进行RF回归模型预测;选择16个属的大鼠盲肠微生物对死后入水组大鼠的PMSI进行RF回归模型预测。
结果显示,海水溺死组中:RF回归模型训练集相关系数R2=0.891,平均绝对误差(mean absolute error,MAE)=6.496;验证集相关系数R2=0.798,MSE为218.102,MAE=13.272。
死后入水组中:RF回归模型训练集相关系数R2=0.933,MAE为5.43;验证集相关系数R2=0.793,MAE=9.956。两组RF预测模型的相应数据如下:
①特征重要性。
图8展示了海水溺死组和死后入水组RF预测模型中,各生物标志物的重要性比例。在海水溺死组的预测模型中,Anaerovorax的重要性最高,为24.7%;在死后入水组的预测模型中,Monoglobus的重要性高达38.3%。
②模型评估结果。
表2、
表3分别展示了海水溺死组和死后入水组的模型评估结果,包含训练集和测试集的预测评价指标,通过量化指标来衡量随机森林的预测效果。结果显示:
海水溺死组中:RF回归模型训练集相关系数R2=0.891,MSE为81.612,MAE为6.496;验证集相关系数R2=0.798,MSE为218.102,MAE为13.272。
死后入水组中:RF回归模型训练集相关系数
R2=0.933,MSE为51.415,MAE为5.43;验证集相关系数
R2=0.793,MSE为144.892,MAE为9.956。两组RF预测模型的相应数据见下
表2、
表3。
③测试集预测结果。
表4、
表5分别展示了海水溺死组(D组)和死后入水组(PS组)的随机森林模型对测试数据的预测情况。并根据此测试集的数据,做出以下实际PMSI(真实值)和预测的PMSI(预测值)的折线图(
图9),蓝色折线为实际PMSI,橙色折线为预测的PMSI,图中展示了随机森林模型对测试数据的预测情况。从图中可看出,死后入水组的预测模型的预测值与真实值更相近。
3 讨 论
3.1 大鼠盲肠内容物微生物群落分析
法医微生物学是法医调查中评估水中尸体PMSI的一种新兴工具
[16-17]。之前有研究检验了小鼠、猪和人类遗体的皮肤、骨骼、尸体相关土壤和腹部等的微生物群落,这些研究中的微生物群落会随着周围的生物和环境条件(例如天气、昆虫可及性和尸体位置)而波动
[18-21]。盲肠靠近肠道的下段,相对封闭不易受外界环境影响,微生物丰富,且靠近肛门,便于取材,目前关于死后微生物群落在海水尸体中的盲肠微生物群落演替和死亡时间推断仍然缺乏。考虑到上述环境因素等的影响,以及物种的组成与相对丰度变化会导致微生物群落演替。本研究以盲肠样本为例,对海水溺死大鼠和死后入水大鼠进行细菌群落演替分析。
研究发现,在门水平上,海水溺死组与死后入水组中厚壁菌门(Firmicutes)、拟杆菌门(Bacteroidetes)和放线菌门(Actinobacteria)占主导地位,这与以往研究的几篇报道相吻合
[22]。2013年,Hyde ER等
[16]在腐败的口腔中发现,细菌群落主要以厚壁菌门和变形菌门为主;放线菌通过分解作用和腐殖质的形成,在难降解生物成分的再循环中起着至关重要的作用,2015年,Cobaugh KL等
[23]和Damann FE等
[24]的研究证明,一组丝状放线菌是重要的多糖、蛋白质和脂质的分解者,通过产生胞外酶,并在坟墓土壤和尸体腐烂晚期的骨头中发现。
在科水平上,Muribaculaceae在海水溺死组和死后入水组中的相对丰度均保持较高水平,Muribaculaceae含量显著性升高,该菌属为新确立的菌属名,曾被称为S24-7家族,在鼠肠道中含量较高,属于拟杆菌门,Muribaculaceae的变化主要与各种饮食治疗、宿主条件或啮齿动物定殖过程有关
[25]。此外,毛螺菌科(Lachnospiraceae)和乳杆菌科(Lactobacillaceae)的相对丰度也保持较高水平。在厚壁菌门中,毛螺菌科、乳杆菌科水解淀粉和其他糖以产生丁酸盐和其他短链脂肪酸。毛螺菌科是一种潜在的有益菌,参与多种碳水化合物的代谢,比如水果中果胶的代谢,发酵导致乙酸和丁酸的产生,为宿主提供能量的主要来源
[26]。食用富含纤维的植物性饮食与毛螺菌科(Lachnospiraceae)、Roseburia和Prevotella的丰度增加可能与短链脂肪酸产量增加相关。本研究显示出的48h后,两组别的Muribaculaceae、毛螺菌科(Lachnospiraceae)的相对丰度均出现不同程度的下降趋势,这种现象也出现于淡水和陆地环境中人体和小鼠尸体腐败过程
[27-29]。有研究表明,梭菌科和梭菌属是陆地和水生环境中尸体分解的关键物种
[16-17,30],在本研究中同样可观察到其较高的相对丰度。同时,也可观察到海水溺死组乳杆菌科(lactobacillus)相对丰度在48~72 h间略升高,与上述陆地尸体情况相反。
在属的分类水平上,海水溺死组和死后入水组的物种相对丰度存在显著差异,并且阿克曼氏菌(
Akkermansia)和
Alloprevotella在海水溺死组中的相对丰度明显高于死后入水组,这2种菌主要常见于肠道内,其中阿克曼氏菌又称为嗜粘蛋白-阿克曼氏菌,这种菌是在2004年从人类粪便中发现的,是一种革兰氏阴性菌
[31]。随着PMSI的延长,物种组成和相对物种丰度的变化使得微生物群落发生演替。在本研究中,海水溺死组和死后入水组的乳杆菌属(
Lactobacillus)在0 h时差异明显,表明水源性细菌进入胃肠道,对盲肠微生物群落产生影响。
在Alpha多样性分析中,12~36 h间,死后入水组微生物的多样性差异显著(P<0.05)。结合上述微生物群落物种丰度分析,且0 h时海水溺死组的物种丰富度明显高于死后入水组,同样表明海水溺死组的盲肠微生物群落受到了水源性细菌的影响。
3.2 随机森林预测PMSI的相关分析
RF是一种机器学习技术,该模型通过随机特征选择和未修剪分类树集合进行分类或回归
[32]。它基于独立决策树,通过多数投票得出结果,旨在最大化样本间的区分度
[33-34]。作为有监督学习算法,RF通过构建分类标签分布模型,利用预测器特征对测试实例分类,其中预测器特征已知但类标签未知。RF具有快速训练、易调整、抗噪声和防止过拟合的特点
[35]。
以往学者曾利用类或门级分类数据集用机器学习方法预测PMI或PMSI。2013年,Metcalf JL等
[36]利用皮肤微生物数据集建立RF模型,在34 d内估计PMI误差为2.52~3.30 d;2016年,Johnson HR等
[37]结合微生物样本,用k近邻回归器预测PMI平均误差约3 d;Wallace JR等
[38]研究猪尸体表面细菌群落演替,建立PMSI推断模型解释77.2%变异;2022年,Zhang FY等
[39]基于肠道微生物群落建立的模型能够解释93.42%的变异,进一步证明了利用水中尸体的菌群微生物群落结合机器学习建立死亡时间推断模型的可行性。
在本研究中,首先运用随机森林分析,筛选出了16种可能用于PMSI推断的细菌作为生物标志物,并基于这些生物标志物来建立海水中的大鼠尸体PMSI推断模型,并分为海水溺死组和死后入水组。首先,基于以下原则对数据进行筛选,本研究剔除了分解过程中相对丰度低、相对丰度方差较小的OTU,这些OTU在本研究中被认为是噪声和低贡献特征。因此,经过筛选和剔除,14种细菌用于海水溺死组PMSI模型的建立,16种细菌用于死后入水组PMSI模型的建立。在所得到的结果中,海水溺死组预测模型所得到的MAE=13.272 h,R2=0.798;死后入水组预测模型所得到的MAE=9.956 h,R2=0.793。本研究拓展了水中尸体肠道微生物推断死亡时间的场景,为更全面了解水中尸体的腐败过程提供了实验基础。当前的研究仍存在一定的局限性,目前所得数据仅使用了相应生物标志物进行RF机器学习算法对PMSI推断的预测,后续仍需要对模型进行优化,以及采用更大或更优的微生物群落进行分析。
目前,在开发用于预测PMI或PMSI的可推广微生物模型方面,最大的障碍是尸体相关数据集的规模限制和采样频率低。因此,在未来的工作中,需要完善和建立更长的时间体系来研究微生物群落的变化对微生物演替的影响
[40-41]。此外,本研究中的盲肠内容物微生物群落仅反映了死后内部的微生物演替。外界环境(水体环境、空气、不同温度)的影响以及与宿主之间复杂的相互作用是今后研究的重点。目前的实验研究工作为今后对水中尸体的微生物相关调查奠定了初步的实验基础。然而,如何将本研究结果运用到实际的水中尸体法医调查中,还需要进一步的研究。
3.3 16s rDNA扩增子测序现存局限性
目前,大多数使用微生物组推断死亡时间的研究常采用16s rDNA扩增子测序分析。此外,基于宏基因组测序的新NGS技术也可应用于微生物物种鉴定。然而,此方法成本更高,需要更复杂的仪器和复杂操作才能获得可信的结果。但是,采用传统的扩增子测序方法,也存在以下不足:鉴定微生物物种时需要将序列信息与数据库中的参考基因组进行对比,然而现有数据库的差异可能会影响已识别微生物的数量和类型,且未知微生物可能无法识别;其分类能力只能精确到属水平,虽然本研究尝试对已分析出的物种进行种水平的Top10的相对丰度分析(
图3F和
图3I),但是对种水平的分类能力有限;单样本研究通常可以解决和识别个体之间的差异以及法医学问题,但无法探索多元数据间的变量。尽管收集的微生物组样本数量正在增加,但用于采样的方法和报告数据的方式的多样性和差异性也妨碍分析信息的完整性和作为一个同质实体的客观性
[42]。
4 小 结
本研究基于海南岛的高温高湿环境,研究在腐败过程中,大鼠盲肠微生物群落演替对不同死因的影响,为水中尸体腐败的死因诊断研究提供相应实验基础。本研究分析了海水中不同死因的大鼠盲肠微生物群落演替,发现与以往的淡水中尸体和陆上尸体的研究有相互印证的部分,同时也存在差异,海水溺死组和死后入水组的乳杆菌属(Lactobacillus)的差异明显,具有作为PMSI推断的生物标志物的潜能。此外,本研究对微生物菌群数据进行随机森林分析,并筛选出甲烷球形菌属(Methanosphaera)、异杆菌属(Allobaculum)、巴氏杆菌(Barnesiella)等16类菌株,这些菌株具有作为生物标志物的潜能,有助于PMSI预测模型的建立。基于上述实验基础和相应潜在生物标志物,本研究利用RF机器学习算法成功建立了海水溺死组和死后入水组的PMSI推断模型,来评估2种不同死因的数据集推断PMSI的效果。本研究表明了海水溺死和死后入水2种死因的盲肠微生物群落存在规律性差异,同时为进一步研究利用基于微生物群落数据的机器学习模型来估计PMSI提供了方向和实验基础。