起源于几千年前的中华“阴阳”思想,被应用于今天的生物学技术领域,并可能逐步改变未来的大数据产业发展。这或许是中国科学家才能碰撞出的“科技+文化”火花。
4月25日,《自然-计算科学》(Nature Computational Science)发表华大研究成果,研究团队基于华大智造DNBSEQ-T7测序平台开创了一套独具优势的“阴阳”编解码系统,用以解决当前DNA信息存储领域的技术难题。
Nature Computational Science官网截图
所有信息在计算机中只由二进制的方式存储,即0和1两个数码;
生物的遗传信息则储存在DNA中,以A、T、G、C四种碱基表现。
如果屏幕前的你是一位家长,在孩子学会这两个知识点之后,或许可以引导他们思考:
倘若把信息语言的0和1,转换为生物语言的ATGC,我们是不是就能把各类信息长久地保存在DNA中,让DNA成为“完美”的存储器了?
擅于把脑洞变为现实的科学家,已经用实际研究成果对这个问题给出了乐观的回答。
DNA凭什么碾压现有信息存储器?
科学家成功完成100万年前猛犸象DNA测序
研究10年,科学家们还有什么烦恼?
DNA存储流程图,与传统信息存储的“信息写入-保存-读取”步骤类似
以中华“阴阳”思想,解DNA存储难题
“阴阳”编解码规则示意图
机智的朋友可能会问,人工合成的DNA要保存在哪?目前,常用的保存方法分为体内和体外两种模式,两者孰优孰劣尚未形成明确定论。为了全方位验证“阴阳”系统的信息恢复稳定性,华大研究院团队通过体外DNA干粉和细胞体内大片段两种存储环境进行测试,皆实现了原始存储数据的完整恢复。
体外模式,研究团队采用不同浓度的原始DNA文库溶液进行了共200多组测试。结果证明,“阴阳”编码采用的线性数据恢复模式在每种DNA分子的平均拷贝数仅有100时,仍然能恢复最高88%的原始数据。而DNA喷泉码使用的编码方式使得每个数据包间存在一定的拓扑关联,在同样条件下,平均恢复率仅有1.3%。
华大研究团队曾将《开国大典》影片存储于DNA中从起步至今短短十年时间,DNA信息存储领域已取得不少令人瞩目的研究成果,包括检索、修改等高级功能也已完成原理验证性的测试,以微软、谷歌等产业巨头形成的DNA存储联盟更是在为其商业化广泛合作蓄势。
该研究由深圳华大生命科学研究院主导,深圳国家基因库、首都师范大学、美国哈佛大学等多个研究团队共同参与。华大研究院平质博士为论文第一作者,华大研究院沈玥研究员、徐讯研究员与哈佛大学George M. Church教授为论文的共同通讯作者。
该研究受到国家重点研发计划(2021YFF1200100、2020YFA0712100)、国家青年科学基金(32101182)、广东省高通量基因组测序与合成编辑应用重点实验室(2017B030301011)、深圳合成生物学创新研究院等项目支持。本研究已通过伦理审查,严格遵循相应法规和伦理准则。