起源于几千年前的中华“阴阳”思想,被应用于今天的生物学技术领域,并可能逐步改变未来的大数据产业发展。这或许是中国科学家才能碰撞出的“科技+文化”火花。4月25日,华大研究院、深圳国家基因库等多家机构的研究团队联合在《自然》(Nature)子刊《自然·计算科学》发表研究论文。研究团队结合DNA双链模型,从中华文化中“阴阳”对立统一的思想获得灵感,开创了一套名为“阴阳”的比特-碱基编解码系统,验证了该系统在信息密度、技术兼容性、数据恢复稳定性等多方面的优势。阴阳哲理博大精深,其特点可简单概括为统一、对立和互化。研究院团队将其巧妙应用到DNA编解码系统当中,以两套不同的规则,分别对两条二进制信息进行“一对一”编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列。那么人工合成的DNA要保存在哪?目前,常用的保存方法分为体内和体外两种模式,两者孰优孰劣尚未形成明确定论。为了全方位验证“阴阳”系统的信息恢复稳定性,华大研究院团队通过体外DNA干粉和细胞体内大片段两种存储环境进行测试,皆实现了原始存储数据的完整恢复。
体外模式,研究团队采用不同浓度的原始DNA文库溶液进行了共200多组测试。结果证明,“阴阳”编码采用的线性数据恢复模式在每种DNA分子的平均拷贝数仅有100时,仍然能恢复最高88%的原始数据。而DNA喷泉码使用的编码方式使得每个数据包间存在一定的拓扑关联,在同样条件下,平均恢复率仅有1.3%。另一方面,研究将信息存在了酵母活细胞的体内,酵母菌株经过1000代以上传代之后,信息仍可以被完美恢复。这在一定程度上意味着,利用活体细胞作为DNA存储的载体,上千年后原始信息或仍能被解读。这样的存储方式可以得到接近于天然DNA分子存储理论极限的物理信息密度,每克DNA能存储的信息量约为432.2 EB。(吴超敏 温婷婷 科技日报记者 刘传书)