“我是谁?我从哪里来?要到哪里去?”面对这个终极哲学难题,人们或许能从科学家的发现中找到遗传规律与基因信息层面的解答。
4月1日,美国科学家领衔的国际合作团队在《科学》杂志发表6篇论文,宣告有史以来最完整的一个人类单倍体基因组图谱绘制完成。
“假如把人类基因组比作一辆结构复杂的汽车,那么,20多年前完成的人类基因组草图就已经具备了汽车的基本配件和功能,新发现的序列只是让这辆汽车的配备更完善,功能更强大。没有它,汽车也能跑;有了它,汽车的性能更好,也更完美了。”中国科学院北京基因组研究所研究员于军接受科普时报记者专访时表示,人类第一次完成每个核苷酸水平堪称完整的人类基因组测序,为了解人类基因组的全部基因和组织元件提供了完整的参照,为科学、全面、彻底认知人类的个体和群体演变的遗传学本质和规律铺平了道路。
“人类基因组计划”:解码生命奥秘
作为“人类基因组计划”的亲历者和参与者,于军表示,人类基因组图谱的完整呈现,离不开该计划的支持。“在过去的20多年里,科学家们一直在努力追求完美,几乎每年都在更新‘人类基因组参照序列’。”
“人类基因组计划”是继“曼哈顿计划”和“阿波罗登月计划”之后,又一项规模宏大、跨越国界及学科的科学探索工程。其宗旨在于测定组成人类单倍染色体DNA中所包含的30亿个由A、T、C、G碱基组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。
1990年,“人类基因组计划”正式启动;1999年,我国科学家参与到“人类基因组计划”,并承担了1%的测序任务。促成我国科学家参与到该计划的人正是于军。
“天书”为何遗漏8%
为了完成“人类基因组计划”的任务,科学家首先需要将人类23对完整DNA切割成数百万甚至数千万个核苷酸序列碎片,并对碎片进行单独测序,之后再根据碎片之间的重叠部分重新拼接,形成逐渐完整的“重叠群”。但大量重复序列的存在令拼接和解读变得困难重重,导致少部分间隙区域被遗漏;核酸序列重复度高的地方也很难确定唯一的路径,有可能造成误拼,从而留下了8%的“不完整部分”。
2001年,科学家首次发表人类基因组草图,宣布破译人类的“生命天书”。不过,由于彼时所测的序列中仍有8%的“不完整部分”,因此这部“天书”尚有遗漏之处。这些遗漏的部分主要存在于染色体结构中间部分的中心粒和末端部分的着丝粒。由于这些地方含有高度重复的DNA序列,成了科学家当时难以完成的“瓷器活”。
“长读长”技术:DNA测序领域的“金刚钻”
随着测序技术的发展,第三代DNA测序“长读长”技术的出现,成为科学家修补和完成人类基因组序列这个“瓷器活”的好帮手,让这8%的遗憾,得以成功弥补。
于军介绍,第三代测序技术的出现,将一代和二代测序技术测量的核苷酸长度(读长)从百位和千位数一下提升到了万位数,甚至达到了十万、百万个核苷酸序列数的级别,大大突破了重复序列所带来的技术瓶颈。
此次完成首个最完整人类单倍体基因组图谱的机构——端粒到端粒联盟(以下简称T2T联盟)就是采用了二代和三代测序技术的“协同作战”。三代测序技术属于单分子技术,其中测定序列长度最高的是牛津纳米孔的DNA测序方法,它的最长读长可以达到100万个核苷酸。
另一家是太平洋生物科学公司,使用的是二代测序技术,其测序仪的测序长度也达到了数万水平。这两种测序方法的优势在于不仅可以提供连续性测序,而且还能提供更完美的数据精准度。二者的结合,让完整的人类基因组序列第一次实现了完美地呈现。
“这种技术的进步是划时代的,就像从蒸汽机发展到内燃机再到信息化、智能化地大踏步前进。”于军说,这是获得人类基因组完整序列的技术“后盾”。
中国人基因组测序宜早不宜迟
近年来“长读长”测序技术的发展,极大地加速了解码生命的进程,不仅测序时间大为缩短,测序成本也呈数量级降低。
于军介绍,我国近20年来基本上依赖国外的基因测序设备,但从2015年开始拥有了第一款真正的国产基因测序仪,目前我国自主研发的二代和三代测序仪也在不断地进入市场。在应用方面,我国也已经做到了与全球领先企业并驾齐驱。
于军认为,完成某一个人类个体的基因组并不是“人类基因组计划”的最终目标和结果。目前,T2T联盟已与人类泛基因组参考联盟合作,计划对几百个个体进行T2T的全基因组测序,以建立来自世界各地,代表不同人群的数百乃至上千个完整的群体参照基因组,建立尽可能完整的代表人类群体多样性的系列参照基因组。
于军表示,遗传保证了生命的延续,而突变产生了不同的物种以及人与人之间的差异。不同族群有着各自独特的遗传背景,对不同疾病的易感性也可能不一样。只有真正了解基因与疾病的关系,才能根据每个个体的基因进行疾病预测和检测,及早做出预防方案或进行针对性治疗。
“中国人的基因组与现有的完整白人基因组序列仍然存在较大差异,希望我国尽快运用和发展三代、四代测序技术,早日测出完整的‘中华民族代表基因组序列’。”于军说,“国人的基因组系列完成后,科学家们可以通过比对分析个体DNA的碱基序列差异,开展更深入的基因组学和遗传学研究,为预防疾病、研制新药以及精准医疗提供个性化、智能化的数据。”