近年来,生命科学与信息科学、纳米技术等领域的交叉融合正加速推动诸如合成生物技术和类脑人工智能技术等具有深远产业变革潜力的颠覆性技术的涌现。受生物技术的启发,结合信息技术,从生物分子结构中探索信息处理的革新方案,已成为科技界的共识
[1]。其中,基于生物技术的智能分子信息处理研究不仅推动了生命科学、人工智能和纳米科学等领域的跨界合作,也为新兴技术的发展开辟了新路径
[2]。同时,随着半导体器件尺寸逐渐接近物理极限,硅基微电子技术正逐步面临摩尔定律无法延续的挑战
[3]。在这一背景下,寻求新的信息存储与处理材料,尤其是在纳米尺度上实现先进信息处理成为生命科学与计算机科学等领域研究的紧迫任务。
在众多生物材料中,DNA分子作为一种携带遗传信息的材料,因其天然的可编程性、超强的并行性和卓越的信息存储能力,被公认为是实现信息处理革新的理想材料之一
[4-6],引起了学者的广泛研究兴趣,在新一代智能分子信息处理系统开发方面具有广阔的应用前景。1994年,美国南加州大学的Adleman
[7]首次利用DNA分子成功解决了一个具有7个顶点的有向哈密顿路径问题,这一成果开创了DNA计算这一全新的计算模式,证明了基于DNA分子实现信息存储与处理的可行性。相比传统方式,DNA计算
[8-10]能在纳米尺度上实现高度并行计算,兼具海量信息存储和复杂问题求解能力。经过近30年的发展,利用DNA分子实现信息处理已在DNA电路
[11-13]、纳米机器
[14-16]和疾病诊断
[17-18]等领域取得了长足进展。
在基于DNA的分子信息处理中,对环境变化的灵敏感知是不可或缺的重要能力。在自然界中,调节与控制这种感知与信号处理能力的一个关键因素就是变构,其赋予了生物分子系统应对环境变化的自适应响应能力。从信息处理的角度来看,作为生物体内信号调控与通信的基本机制
[19],分子变构不仅可以影响后续分子结合,赋予其灵活的动态功能配置,同时其传递性还可用于长程信号传递,这些对于实现智能分子信息处理至关重要。因此,从DNA分子结构中寻找驱动分子信息处理的新方法,对分子信息处理研究、推动生物技术与信息技术的融合、促进基于生物学的计算与存储的基础理论研究具有重要意义。
本文从DNA分子变构的角度,对近年来智能分子信息处理涉及的DNA电路、DNA链置换技术、蛋白质酶应用、DNA神经网络、基于模拟生化反应系统的自主学习、分子信息处理及其平台构建等研究进行了综述,着重介绍了DNA分子变构调控在分子信息处理中的应用,讨论了当前智能分子信息处理所面临的挑战,并对基于DNA变构的智能分子信息处理研究和应用前景进行了展望。
1 DNA电路
1.1 基于DNA链置换的DNA电路
作为实现分子信息处理的重要手段,DNA电路已在分子编程
[20-22]、生物检测
[23-24]、药物递送
[25-26]和信息处理
[27-28]等领域得到广泛研究和应用。其中,DNA链置换作为一种高度可编程的分子操控技术,通过碱基互补配对驱动DNA分子的构型变化实现信号传递与处理,在模拟信号
[29]、DNA电路
[30]、数值计算
[31]、纳米结构
[32]、DNA神经网络
[10]等方面展示出其重要性和实用性,已成为构造DNA分子电路的通用技术,广泛应用于分子信息处理的生化反应实现中。
2000年,Yurke等
[33]首次将DNA链置换技术应用于分子信息处理,构建出一个DNA镊子,可以通过DNA链置换反应实现二态转换。2011年,Qian等
[34]通过DNA链置换技术构建出多个数字逻辑计算电路,实现了四位二进制数的开平方根计算,
图1 [34]为基于跷跷板构建的平方根数字逻辑电路,该计算涉及的DNA链数量达到130个,展示了DNA链置换技术在复杂分子信息处理中应用的优越性。
DNA链置换反应涉及DNA链的热力学稳定过程,不完全配对的DNA复合物将被完全配对的DNA链取代,通过这种方式可以利用DNA分子实现信号处理。在DNA链置换中,作为反应的启动子,通过对立足点(toehold)等功能性DNA域的动态组装与变构,控制DNA链置换反应路径,可以对DNA链置换赋予灵活的信息处理能力。2011年,Genot等
[35]引入了远程立足点调控策略,其在立足点和分支迁移域之间插入一段碱基片段形成间隔区域,通过控制间隔区域的长度和杂交状态,使反应速率实现3个数量级以上的调控。
2013年,Genot等
[36]提出了一种远程立足点调控链置换策略,
图2 [36]为组合链置换策略示意图,其核心在于将立足点和分支迁移区域分布在两条不同的DNA链上,然后通过连接域将其杂交起来,实现立足点和分支迁移域的动态组合,从而控制链置换反应的启动。这种策略为精确控制DNA分子间的相互作用提供了新的方法,同时也可以极大地减少矩阵乘法所需的DNA链数量,能够有效地提高计算过程的准确性,有助于在分子层面实现更精细、更复杂的计算。同年,Zhu等
[37]设计了一种4向节结构,将立足点和分支迁移区域分别设计在两个DNA单链上,通过控制立足点与分支迁移区域的组装,形成完整的DNA置换链,进而实现对DNA链置换反应路径的控制。
值得注意的是,DNA分子的构象在DNA信号传输和处理中起着至关重要的作用,利用DNA分子的变构调控实现分子信息处理已得到广泛应用。不同于立足点的调控,2018年,Lai等
[38]利用DNA分子内构象变化来编程化学反应网络,通过引入分子内构象变化,实现了对DNA链置换反应的非线性调控。该方法提高了反应网络的灵活性和可编程性,展示了其在复杂系统控制中的应用潜力,为纳米技术和生物计算领域提供了新的工具和方法。2019年,郑学东等
[39]利用DNA分子构象变化开发了一种变构DNA链置换技术,实现了输入与输出DNA分子在碱基序列编码上的解耦合,为提高DNA链置换的信息处理能力、解决DNA序列设计困难问题提供了一种新途径。2021年,Liu等
[40]开发了一种新型DNA链置换反应调控元件,提出了clip-toehold介导的DNA链置换变构机制,其入侵链和目标双链DNA通过clip-toehold结构实现位置接近,提供了一种新的方法来精确控制DNA分子的相互作用。这项工作的创新之处在于clip链的多功能性,它不仅能够作为调控元件来精确控制DNA链置换反应,还能够为构建复杂的DNA纳米器件提供基础。2022年,Zhang等
[27]基于此进一步提出了一种可编程变构DNA调控策略,通过对DNA变构信号进行编程,实现了多种DNA逻辑门和多层级联DNA电路,并基于DNA折纸技术,利用DNA分子变构实现了远程信号传递。同年,Xie等
[41]开发了一种紧凑而高效的架构,如
图3所示,使用协同DNA链置换反应来构建DNA全加器。在分子信息处理方面,DNA链置换仍面临诸多挑战。例如,DNA电路中的DNA链设计复杂度高,限制了信息处理规模;DNA链立足点的碱基序列编码长度有限,导致信号交叉串扰;难以通过生化反应实现自主学习。
分子变构为DNA链置换提供了一种新的调控途径,丰富了分子操控工具箱,拓展了DNA电路构建的生化反应实现手段。鉴于变构是生物体内信号调控与通讯的基本机制,利用DNA分子构象变化与碱基排列实现分子信息处理的双重驱动,为目前分子信息处理所面临的挑战提供一种新的有效解决途径。
1.2 蛋白质酶介导的DNA电路
蛋白质酶为DNA电路的构建提供了多种多样的分子操纵工具,如DNA聚合酶、DNA连接酶、限制性内切酶等,如
表1所示。这些蛋白质酶可以对DNA分子执行多种操作,从而协助实现DNA电路的构建。这种有效调控手段在纳米结构及生物传感器的实现等领域也有着广泛的应用。
2013年,Fujii等
[42]设计了一种创新的酶辅助DNA电路,该电路融入了竞争机制。捕食者和猎物在聚合酶、切刻内切酶和核酸外切酶的催化作用下实现了动态生成与水解的过程,通过合理调控反应物的浓度,能够构建出具有不同振荡和衰减周期的DNA电路。2019年,Song等
[43]提出了一种基于DNA聚合酶的新型链置换方法,基于该方法构造的逻辑门结构极大简化,减少了反应过程中的泄漏,同时由于聚合酶的高效性,其仅用37条单链DNA,在25 min内便完成了平方根计算,极大地提高了计算效率。
2019年,Zhang等
[44]构建了由切刻酶辅助的熵驱动DNA电路如
图4所示,通过催化剂I与门复合物F1:F2:S之间的链置换反应,实现了链F1的置换,并形成了亚稳态结构I:F2:S。在这个亚稳态结构中,暴露出的4nt立足点域使得燃料链F可同时置换出链I和链F2,而催化剂I则能够参加下一轮循环并伴有产物F:S产生,这种产物会随着时间推移而逐渐积累。当催化剂I或门结构F1:F2:S中的任何一种完全消耗时,该DNA电路的反应将停止。然而,当切刻酶Nt.BbvCI存在时,它能够将复合物F:S裂解为复合物F1:F2:S,从而实现反应物的高可回收性。这一创新设计不仅提高了DNA电路的效率和可持续性,还为构建更复杂的分子生态系统提供了新的思路和方法。Su等
[45]利用DNA聚合酶诱导DNA链置换,组装了全加器和多路复用器,提高了大规模集成计算系统的运行效率,但聚合酶存在信号泄漏问题,可能影响计算结果的准确性。2020年,Zhao等
[46]提出了使用限制性内切酶FokI酶辅助裂解调节系统策略,构建了一系列的逻辑门及多路复用电路。2022年,Bucci等
[47]提出了一种创新的策略,利用正交酶驱动计时器来控制DNA链置换反应的动力学,以实现对DNA链置换反应速率的精确控制。这种方法为DNA分子信息处理系统提供了更为灵活的动态调控手段,但若引入过多种酶作为催化剂则会增加系统的复杂度,系统的稳定性和可靠性难以保证。2023年,Farag等
[48]通过酶驱动的去杂交和替换过程,实现了DNA的动态和可逆功能化,如
图5所示
[48],在生物成像、信息传递等领域具有潜在的应用前景,但其在更复杂生物系统中的应用效果还需进一步验证。
由于具有可编程、易操作的特点,DNA电路在模拟和调控DNA信号传递方面已被证明具有优越性,成为分子信息处理的重要实现途径。但是,目前DNA电路缺乏自主学习能力,导致设计后的电路功能固化、灵活性不足,开发具备环境适应性的智能分子信息处理系统仍然极具挑战性。
2 分子信息处理
2.1 智能分子信息处理
利用DNA分子构建神经网络已成为一种极具发展前景的智能分子信息处理方法。DNA神经网络类似大脑的工作模式,在细胞内智能诊治方面具有显著优势。2011年,Qian等
[10]首次展示了如何在试管中利用DNA链置换反应来实现神经网络的功能,通过DNA生化反应完成“猜心术”游戏,展示了DNA计算在逻辑和计算上的潜力,尤其是在生物相容性和并行处理方面,为智能分子信息处理开辟了新的研究方向。2018年,Cherry等
[49]利用DNA“跷跷板”门提出并搭建了一种基于DNA分子的“赢者通吃”DNA神经网络。该DNA神经网络能够识别手写数字,展示了DNA神经网络在模式识别中的巨大潜力,扩展了DNA神经网络的应用范围,并提高了识别的准确性和效率,但系统的复杂度和规模仍受限于DNA序列的设计难度,未能实现完全的生物分子自主学习。2022年,Lapteva等
[50]提出了基于DNA链置换的时序逻辑电路,实现了时间记忆与逻辑计算相结合的设计,使得构建具备时间依赖学习规则的DNA电路成为可能,为智能分子信息处理提供了新途径。通过DNA分子的生化反应实现人工神经网络的方式,展现了智能分子信息处理的广阔前景,但由于需要在计算机上预先进行训练学习,以获得合适的权重值,这种实现方法对开发动态环境中的智能分子信息处理系统,仍缺乏必需的自适应性,系统的实时响应速度和计算效率仍需进一步优化。
在利用DNA分子实现自主学习方面,目前主要是构建DNA链置换反应网络,通过系统仿真的方式来设计具备自主学习能力、能够适应动态环境的模拟生化反应系统。2016年,Lakin等
[51]首次利用缓冲DNA链置换,开发了一种自适应DNA链置换反应网络。通过构造反馈回路,系统可以自主调节运行参数,从而实现监督学习算法。
2022年,Zou等
[52]提出了一种基于DNA链置换反应的非线性神经网络框架,其构建的DNA神经网络系统具备自适应学习能力,展示了DNA分子在非线性神经网络中的潜力,为开发更复杂的智能分子信息处理系统提供了技术支撑。但是,其设计和实现复杂度较高,增加了系统构建的难度,具体的系统稳定性和可靠性需要在实际应用中进一步验证。Xiong等
[53]提出了一种基于DNA链置换反应实现卷积神经网络的DNA分子计算方法,该方法在复杂信息分类方面具有巨大的应用前景。同年,Fil等
[54]基于DNA链置换反应,用DNA分子系统模拟了脉冲神经元,展示了合成生物智能的可行性,如
图6所示
[54],为开发具备自主学习能力的分子信息处理系统提供了新思路。2024年,Sun等
[55]使用DNA链置换技术与神经网络相结合的方式,通过DNA神经元网络中的学习和遗忘机制构建了基于DNA神经元的巴甫洛夫联想记忆系统。
图7 [55]为巴甫洛夫联想记忆系统“遮蔽效应”的神经网络图,该成果展示了DNA在计算和信息处理方面的巨大潜力。
通过DNA分子的生化反应,在试管中自主完成训练与学习过程仍然是当前智能分子信息处理亟待解决的问题,系统的学习效率和泛化能力也有待进一步的验证和提高。
2.2 分子信息处理平台
随着DNA纳米技术的发展,DNA折纸
[56]为分子信息处理提供了一个理想的物理构建平台。通过将DNA分子固定在DNA折纸上,可以实现DNA电路功能模块的有序排布,进而构造类似电子芯片的分子信息处理平台。2014年,Wang等
[57]首次在DNA折纸上设计了包含计算模块和输出模块的DNA逻辑门,展示了YES和AND逻辑门在DNA折纸上的实现,如
图8所示
[57],并用DNA链置换驱动信号的传递与处理进行MicroRNA的分析。DNA折纸为分子信息处理提供了高精度的纳米结构处理平台,确保了逻辑计算的准确性和可靠性,但如何实现更复杂的逻辑电路及与分子信息处理系统的集成仍需进一步研究。
2017年,Chatterjee等
[58]提出了一种新颖的DNA计算架构,构建了一个表面DNA逻辑电路,可以对信号传输路径进行编程,实现定向逻辑运算,避免了DNA分子在计算过程中的扩散。由于可以在DNA折纸上部署数百个附着点,该方法可用于在DNA折纸平台上构建模块化的DNA电路,其结果在不同长度和方向的传输线上展示了信号的传播能力,同时逻辑门被模块化地组合成了常见的电路模式。通过精确控制DNA反应发生的位置和区域,减少了反应时间并增加了计算的并行性,从而优化了计算效率和模块化设计,克服了分子电路工程实现中速度和模块化的局限性。2019年,Chao等
[59]开发了一种DNA分子导航器,可以在DNA折纸上的单通路迷宫中执行并行深度优先搜索。该研究将DNA折纸和杂交链反应(hybridization chain reaction,HCR)结合,开发了一种新颖的分子导航系统,通过定义在折纸平台上的树状图,DNA导航器能够自主探索迷宫的所有可能路径,从而解决迷宫问题,为DNA纳米技术在信息处理领域的应用提供了新的思路和方法。
2022年,Chen等
[60]基于聚合酶诱导的DNA链置换反应,设计了一种DNA折纸切割方法。其中,DNA分子的结构通过聚合酶触发的链置换反应来控制和驱动,利用聚合酶在DNA分子上的运动来实现特定的结构转换和运动模式,展示了DNA折纸构型的动态转换,丰富了DNA折纸上进行分子信息处理的工具箱。由于聚合酶触发的链置换机制是动态响应的,这种技术可能具有实现复杂动态结构和功能的潜力,如响应性传感器或分子机器人的设计,但在实验条件下,如何确保聚合酶在DNA上的精确运动也是一个重点研究目标。2024年,Ji等
[61]利用DNA折纸的拓扑结构,设计了一种信号传播单元,如
图9所示
[61],通过对DNA折纸上特定结合位点的精确编程,使得信号分子能够沿着预定的路径进行传播,从而实现信号在纳米尺度的精确调控,也可以灵活地对不同的信号传播模式进行编码,实现在折纸上进行多样化的分子信息处理。
以DNA折纸为基板构建的分子信息处理系统,具备在纳米尺度上寻址的能力,使得信息可以在1维或2维空间上进行定向传递。由于可在折纸表面上进行DNA电路的有序排布,可以极大减少DNA分子游离带来的信号干扰,提高DNA电路的稳定性,有利于实现分子信息处理系统的模块化组装。同时,DNA序列的可编程性使得基于DNA折纸的分子信息处理系统具有高度的灵活性,可以根据需要设计不同的DNA序列,从而构建出具有特定功能的分子信息处理系统,在分子水平上实现快速、准确的信息传递和处理。此外,DNA折纸技术还可以与其他纳米技术和生物技术相结合,实现多功能的集成,构建出更大、更复杂的DNA折纸结构,从而进一步扩展分子信息处理系统的功能。
3 智能分子信息处理面临的问题
DNA分子的可编程性、纳米级可预测性等特点,使得利用DNA分子实现信息处理具有天然的优势,其中DNA链置换为分子信息处理提供了动态响应能力、为蛋白质酶提供了必要的催化支持和调控功能、为分子变构赋予系统灵敏响应环境变化的能力。尽管基于DNA纳米技术的分子信息处理取得了快速发展,但仍有一些关键问题亟待解决。
首先,分子信息处理需要的DNA分子种类多、结构复杂,实际可用的DNA编码数量受到诸多约束,限制了DNA序列的可编码规模,目前主要通过编码优化及目标物纯化解决DNA序列设计困难的问题。事前的优化设计有利于生化反应的顺利执行,但预先编程的方式限制了系统的灵活性;人为干预则导致计算过程繁琐,且目标物在纯化过程中的损耗也会对后续生化反应造成不良影响。为解决序列设计困难的问题,利用DNA分子构象实现信息存储与处理已成为一种新的可行方式。
其次,分子信息处理中的DNA信号传递过程复杂。在DNA链置换中,输入与输出的DNA单链不可避免地存在碱基片段的重叠,从模块化设计的角度来看,两者存在紧耦合的关系,限制了DNA信号传递的灵活性,导致DNA电路设计困难、反应过程难以控制。因此,利用DNA分子变构,针对功能模块的输入与输出,开发在碱基序列上解耦合的新型DNA分子操纵技术及信息处理方法就尤为重要。
最后,分子信息处理系统仍缺乏自主学习能力。目前,DNA神经网络主要依靠计算机进行训练,通过生化反应完成自主训练与学习仍然是亟待解决的问题,且DNA信号传递与处理中尚无有效的检错与纠错方法。此外,分子信息处理的生化系统通用性较低,往往通过增加生化反应的方式来实现系统功能的拓展,这既增加了反应过程的复杂性,也加剧了DNA信号间的交叉干扰,使信息处理过程越来越复杂,难以控制。
4 结论
近年来,基于生物技术的分子信息处理研究已成为生命科学、人工智能、纳米科学等多个研究方向的新兴交叉热点,亟需继续深化与这些领域的融合,探索在基因调控、生物传感、纳米机器人及DNA计算等领域的创新应用。尽管目前分子信息处理技术尚无法与计算机相媲美,但随着生物技术与信息技术的融合发展,尤其是利用DNA分子的构象信息与DNA分子的序列信息实现分子信息处理的双重驱动,可以预见在不久的将来必将在底层分子信息处理方法上实现突破,为生物计算、基因编辑、纳米机器人及人工生命等领域带来更多的新思路、新方法,并在人工智能、大数据分析等领域发挥独特作用。此外,由于分子信息处理的生物相容性,DNA 分子变构的研究成果可以应用于疾病的早期诊断和个性化治疗。例如,通过检测特定 DNA 分子变构来发现疾病的相关生物标志物,或者开发基于分子信息处理的药物递送系统等。针对目前研究中涉及的DNA分子稳定性、DNA链置换技术效率及系统自主学习局限性等问题,应加强对系统稳定性的优化,确保在各种条件下系统都能稳定运行的同时,建立有效的错误检测和恢复机制。此外,还需开发高精度、高效率的生物传感技术和纳米技术,以及具备自主学习和自适应能力的算法与模型,使系统能够在新任务或新环境中进行有效学习,并利用分子特性进行动态调整。随着智能分子信息处理技术的不断发展,还应积极拓展应用领域,关注多领域需求以开发针对性的分子信息处理解决方案。当然,探索其潜在应用可能的同时,也要关注技术伦理与安全问题,确保技术的健康发展并切实履行社会责任。