回眸细菌基因组测序二十年

1995年,美国基因组研究所(TIGR)Craig Venter等科学家合作完成并公布了嗜血流感杆菌(Haemophilus influenzae)的全基因组序列,这是世界上第一个测序完成的细菌如今,20年过去了,测序技术已经发生了翻天覆地的变化,细菌基因组测序也从最初只能在大的测序中心由团队合作耗时数年花费数十万美元完成,发展到如今一个普通的大学实验室派出一名实习生用几天时间花费几十美元就可能轻松完成。近日,Nature Reviews Microbiology杂志发表了英国学者NicholasJ. Loman和Mark J. Pallen撰写的综述文章《Twenty years of bacterial genome sequencing》(doi:10.1038/nrmicro3565),总结回顾这二十年来细菌基因组测序领域的发展历程。

细菌基因组测序,二十年来经历了三次大的革命。引领第一次革命的核心技术是全基因组鸟枪法测序。微生物基因组测序,基本上和人类基因组计划同时起步,最初的目的是想确定一些模式菌株(如大肠杆菌、枯草芽孢杆菌等)的全基因组,作为一种非病源菌,嗜血流感杆菌第一个被测序完成有一定的偶然性;但是这项工作的完成,却像打开了一道大门,在随后的几年中数个病源菌、模式菌、极端微生物相继测序完成,如结核分枝杆菌、鼠疫耶氏菌等。这一阶段完成的基因组,基本上都是没有缺失碱基的真正全基因组完成图。对于细菌基因组常见的基因变异、基因组结构变化、水平基因转移等的研究,催生出了比较基因组学。出于设计芯片探针、研究基因表达的需要,又催生出了功能基因组学、结构基因组学和蛋白质组学等。同时,宏基因组研究也登上了历史舞台。出于对基因组拼接及注释的需要,这一阶段涌现出了如Phred, Phrap, Glimmer, Artemis等著名生物信息学工具。

进入21世纪第一个十年的下半段,以454、Illumina为代表的高通量测序技术的诞生,带动了细菌基因组测序的第二次革命。这项技术大大降低了测序成本,使得普通大学和医院实验室也可以广泛使用;而且可以有效地克服某些对宿主有害基因不能克隆所以不能用鸟枪法建库测序的弊端,辅之以基于SNP的系统进化分析方法,因此迅速被应用于临床转化医学研究及药物开发等领域。高通量测序技术也使得宏基因组研究空前发展起来,对于解析肠道微生物等一些不能纯培养的微生物生态群落发挥了重要作用。测序通量的大幅增加,在一定程度上牺牲了测序的读长,因此一些长的重复序列不能被跨越,得到的细菌基因组很多情况下只能算是草图。这一阶段涌现出了Newbler, SOAPdenovo, Velvet等一些序列拼接和生物信息学工具。

为了解决短读长带来的一些问题,以单分子实时(SMRT)技术、纳米孔技术为代表的长读长测序技术掀起了第三次革命的新浪潮。这些技术使得细菌基因组完整图再度成为可能,因此一经推出,就迅速被广泛采纳,也必将发挥出更大的作用。在不远的将来,细菌基因组测序的成本可能降到只要1美元,测序可能会在一系列我们现在都想象不到的应用中成为人们的首选技术。对于微生物研究工作者(包括临床和环境研究)来说,未来是十分光明的。



细菌基因组测序发展史上重要里程碑事件

 


本文由派森诺生物石忆湘博士整理