工科人可以有多浪漫?这位教授把校训“止于至善”——“Rest in the highest excellence!”刻在 DNA 分子里。

打开网易新闻 查看精彩图片

图 | 把校训刻在 DNA 分子上(来源:资料图)

他就是东南大学生物科学与医学工程学院教授刘宏。在最近一项研究中,他和团队实现了 DNA 合成和 DNA 测序的集成,并实现了仪器微型化。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

期间,刘宏等人改良了传统化学合成方法,并将校训“翻译”成一段 DNA 序列,使用电化学方法存储在电极上并成功读出。

打开网易新闻 查看精彩图片

图 | 刘宏(左一)和团队(来源:资料图)

相关论文由他担任通讯作者,于 11 月 12 日,以《单个电极上的电化学 DNA 合成和测序可应用于规模化集成数据存储》(Electrochemical DNA synthesis and sequencing on a single electrode with scalability for integrated data storage)为题发表在 Science Advanced 上。

打开网易新闻 查看精彩图片

图 | 相关论文(来源:Science Advanced)

DNA 存储是应对“数据危机”的新思路

刘宏表示,人类当前亟需更优秀的存储介质。而广大生物用于存储自身信息的 DNA,有望成为新介质。假如能用 DNA 分子来存储数据,或将成为应对“数据危机”的新思路。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

所谓“数据危机”,指的是在数据爆炸的大数据时代,全球数据量的增速呈指数级。对于硬盘和光盘等传统存储介质来说,当前的存储能力正面临极大挑战。

日常我们能看到的动物比如猫和狗,它们的 DNA 序列中保存着所有自身信息。详细来说,我们生活的地球上的各种生物正是由 DNA 中的各种碱基衍生而来,比如A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鸟嘌呤)等。

作为新型存储介质,DNA 有望实现比传统半导体和磁性介质更高的存储效率、编码密度和稳定性。

正因此,DNA 存储研究并不是新鲜事。但是,多数 DNA 存储系统都基于“编码-合成-储存-测序-解码”的流程,它存在两大痛点:其一需要使用大型仪器,其二必须让专业技术人员参与。

具体来说,此前的 DNA 存储方法通常涉及复杂的液体操作。在合成步骤中添加一个磷酰胺核苷酸单体,一般要至少引入四种液体溶液,更不必说繁杂的测序步骤。以上不足限制了 DNA 存储的发展,误差概率也始终居高不下。

如何实现更小、更自动、更集成化的 DNA 存储系统?基于电化学原理,该团队发展出一种单电极 DNA 合成和测序方法。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

在该研究中,DNA的合成基于磷酰胺化学和电化学脱保护进行。测序的基本原理来源于聚合酶催化的引物延伸的电荷再分布,从而获得可测量的电流。通过测序后的电极再生,还可实现重复测序,结果准确性也可得到提高。

此外,他们还开发出一种 SlipChip 设备,用于简化 DNA 合成和测序中的液体引入过程。

总体准确率为 89.17%

借助电化学脱保护技术,他们改良了传统的亚磷酰胺化学合成方法,并基于电荷振荡现象,就电极表面的 DNA 分子进行测序。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

如何制备储存数据的材料?据悉,基于 SlipChip 的微流控设备,可用于保存 DNA 化学物质和各种试剂。通过标准光刻技术和物理气相沉积技术,他们在载玻片上制备了一个 2×2Au 电极阵列,此外还制备了一个带有流体通道和储液腔的聚二甲基硅氧烷(PDMS)模块,然后与载玻片一起组装,并在储液腔中预装了电极上的 DNA 合成和测序试剂。

一个 SlipChip 一般有两层,下面的板上钻有孔洞、来容纳化学液体或微滴。上板还可作为下板井的盖子,通过移动或滑动顶板,一个孔或多个孔可通过底板中的管道排列,而井中的液体可通过管道发生反应,这意味着不需要泵或阀门来移动化学物质。

SlipChip 的正负电荷,会根据 DNA 序列存在与否做出改变。其中,DNA 合成是基于磷酰胺化学和电化学脱保护,测序则依赖聚合酶催化引物延伸的电荷再分配,这可让电流峰值达到可测量的量级。可以说,SlipChip 装置大大简化了与 DNA 合成、以及测序有关的水相介质。

为了启动 DNA 合成,该团队将电极暴露在试剂库中的磷酰胺核苷酸单体中。然后,分别将电极与相应的试剂储层和流体通道对齐,依次进行清洗、氧化和电化学脱保护步骤。

研究中,二进制的数据被编码到四种 DNA 碱基(A、T、C 和 G)序列中,然后合成 DNA,这一步便是数据输入。测序过程则相当于读取数据,即把这些固定的碱基序列读取成一串二进制的数据。

在同一电极上的测序,是通过将电极孵育在流体通道中的聚合酶溶液中,然后依次将电极暴露在、四个含有不同脱氧核糖核苷三磷酸的储层中来完成。

为降低测量误差,他们使用统计学方法,并进行了多次测量。最后,该校校训“止于至善”终于在电极表面实现了 DNA 分子形式存储,并能被读取出来。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

在此过程中,刘宏等人测量了来自电极的电流,以便对 DNA 进行测序,总体准确率为 89.17%。此外,在四电极阵列上写入和读取 20 字节的数据大约需要 14 个小时。

另据悉,对于当前体系、朝向高通量自动化系统的发展潜力,他们也做了探索:借助微流控 SlipChip 技术,刘宏等人设计出单片四电极系统,让电极可以高效地输送反应试剂。

所有合成和测序中使用的液体操作,都是根据 SlipChip 的原理完成的,这些过程可被完全集成到数据库扩展中。在单个电极上写入和读取数据,并不需要一个地址序列,这样数据量就只会受到电极数量的限制。这一策略还采用了多重投票原则的多重测序和碱基识别,借此可以消除一些随机误差。

与传统的系统相比,SlipChip 设备的不可用容量更小,这样可以节省昂贵的试剂,让写入和读取大量数据更具成本效益。

刘宏和团队还对拟议的 DNA 数据存储系统的未来发展进行了设想,通过扩大微芯片上的电极和反应储层的数量,本次提出的方法还有望开发出高效、集成和自动化的真正大型数据库。因此,他们认为该系统是一个颇具前途的基于 DNA 的数据存储平台。

打开网易新闻 查看精彩图片

(来源:Science Advanced)

“是 DNA 存储的一个进步”

概括来说,借助电极表面合成 DNA 分子、以及原位测序,刘宏等人在单电极上实现了一体化的数据写入和数据读取,这给未来的高通量自动化 DNA 存储系统打下基础。

此次新成果的诞生,也意味着人们自此告别了使用复杂化学实验室设备合成和操纵DNA 的历史,这是 DNA 存储的一个进步,可有效缩小设备并极大提升便利性。

而之所以把校训存进 DNA 分子,是因为该研究还处于初期阶段,暂时不能存进过多信息,因此刘宏团队的博士生许成韬提出了把校训存进去的建议。

正因此刘宏也坦言,目前可存储的信息量并不算多。尽管完成了从 0 到 1 的研究,但后续从 1-100 的过程会更艰难。想让 DNA 分子真的可以替代硬盘和光盘,还有诸多问题要克服。

一个种子库超过 200 万年后仍然可读

据悉,DNA 的理论数据密度高达~455EB/g,只要保存条件适当,DNA 可被稳定保存,因此编码在 DNA 中的信息在很长一段时间。

此前有报道称,有一个种子库超过 200 万年后仍然可读。也有团队将 200 兆字节的数字文件成功编码到 DNA 序列中,这相当于大约 20 年前最流行的硬盘驱动器的存储容量,因此 DNA 存储的帷幕才刚刚拉开。

刘宏也坦言,本次论文只涉及到单个实验,因此只有一个电极在工作,后续刘宏打算扩大试验,制备出成千上万电极,从而把更多信息写进去、读出来。等到存储体系变得成熟且稳定以后,它还打算和芯片做结合。

据介绍,刘宏本硕均毕业于南京大学,后在美国德克萨斯大学奥斯汀分校获得博士学位。2013 年,在完成博后研究后,他回国加入东南大学,主要研究方向为电化学、微流控芯片、传感器、现场快速检测(POCT)。对于目前的研究,他概括称:“我们目前在做的都是生物电子方面的工作,在生物和信息之间做一些交叉的研究,既从左到右,又从右到左,是一个双向的研究方向。”

-End-

打开网易新闻 查看精彩图片

支持:

周静昕、vantee、熊岳城