由于耐药细菌的迅速出现,如何寻找新的抗生素是当前科学家一直面临的难题。2020年2月20日,Cell 以封面文章的形式发表了题为:A Deep Learning Approach to Antibiotic Discovery 的研究论文,论文报道了麻省理工学院Jim Collins领导的研究团队利用深度学习模型发现了超强抗生素halicin。halicin与常规抗生素在结构上有所不同,展示了前所未有的广谱抗菌能力,可以消灭一些世界上最危险的细菌。
自青霉素出现以来,抗生素已经成为现代医学的基石。然而,随着时间的推移,细菌会逐渐产生对抗生素的耐药性,这就需要药物研发工作者不断开发新的抗生素。但现实情况是,由于缺乏经济激励,私营药企在新抗生素的发现上收效甚微,使得抗生素的问题越发严重。曾有研究预测,如果不立即采取措施开发新的抗生素,到 2050 年,因耐药感染而死亡的人数将达到每年 1000 万人。
从历史上看,抗生素主要是通过从土壤微生物中筛选可以阻止病原菌生长的次级代谢产物而发现的。大多数临床上使用的抗生素,包括β-内酰胺,氨基糖苷,多粘菌素和糖肽等都是通过这种方法得到的。通过增加效力,降低毒性和避开耐药性等方式,半合成这些化合物的衍生物,可以扩充临床抗生素库。另外还发现嘧啶,喹诺酮,恶唑烷酮和磺胺类的全合成抗生素可以提升临床效用,并且对相同的性质可以继续优化。
然而,在过去的几十年里,研发人员使用传统的方法寻找新的抗生素时,总是重复地找到相同的分子,因此新抗生素的发现步履维艰。在此背景下,研究人员转而从包含大规模化学分子的文库中挖掘新的抗生素,由于之前计算方法和计算资源的限制,人们并没能发现新的临床可用抗生素。随着人工智能等新技术的发展,解决这个问题的时机已经成熟。
近日,由麻省理工学院合成生物专家 Jim Collins 领导的研究团队研发一种开创性的机器学习方法,该方法首次在没有使用人类任何先前假设的情况下,短短几天内从1.07亿个分子的文库中筛选出强大的新型抗生素。其中一种抗生素可杀死多种世界上最麻烦的致病细菌,包括结核病和被认为无法治愈的菌株。该研究已封面论文形式发表在国际顶尖学术期刊 Cell 杂志。
具体来看,这种模型能够自动学习不同药物分子里的结构,不但可以掌握这些分子的不同位置是否存在特定的化学基团,还能够预测这些分子的特性。随后,研究人员们给这种模型提供了2335个用于模型学习的不同分子,这些分子中有美国FDA已经批准的药物,也有不少具有广泛生物活性的天然分子。研究人员们希望在训练之后,这种模型能够学会识别能有效杀死大肠杆菌的药物。
训练完毕后,是检验这套机器学习模型学习能力的时候了。研究人员们使用Broad研究所的一个化合物库,让这套模型从其中6111个分子里,寻找具有潜在抗菌潜力的分子。从中,这种模型认为一个分子具有很强的抗菌活性。有意思的是,这种分子原先是作为一种糖尿病药物而开发出来的,在结构上和已有的任何一种抗生素都明显不同。后续的一些研究,也表明该分子对人类细胞的毒性较低。
参考电影《2001:太空漫游》中虚拟人工智能系统HAL的名字,研究人员将这个分子命名为halicin。随后,他们在培养皿里测试了halicin对多种耐药菌的杀菌效果,而结果令人欣喜!除了铜绿假单胞菌(Pseudomonas aeruginosa,一种难治的肺部病原体)之外,halicin对所有测试的耐药菌都有杀伤作用。
在小鼠试验中,该分子也对多种病原体显示出抑制生长的特性,包括艰难梭菌菌株、鲍曼不动杆菌和结核分枝杆菌,它们都具有“泛耐药性”,并且迫切需要新的抗生素。值得注意的是,世界卫生组织已将鲍曼不动杆菌定为最需要优先处理新抗生素的病原体之一。
基于以上这些结果,研究人员们指出,halicin具有广谱的抗菌活性。而从机理上看,这是因为它能干扰细菌,不让它们形成跨膜的电化学梯度。一般情况下,这种电化学梯度能协助细菌产生能量。如果没有这种梯度,细菌就会死亡。研究人员们也提到,重塑电化学梯度的过程非常复杂,不是简单的几个突变就能完成的,因此这也最大程度上杜绝了耐药性的产生。
利用这套系统,研究人员们进一步在另一个数据库里筛选了数亿个分子,并从中找到了23个与现有抗生素结构迥异,且对人类细胞无毒性的潜在抗菌分子。这一筛选过程,只用了短短的3天时间。后续的研究也表明,其中8个分子的确有抗细菌的活性,2个分子的活性尤其强。科学家们也计划继续对这些分子进行研究和评估。
这项研究既提高了化合物鉴定的准确性和效率,突出了人工智能技术在早期抗生素发现工作中可能发挥的重要作用。以色列理工学院的生物学和计算机科学教授Roy Kishony表示:“这项开创性的研究,标志着抗生素发现乃至更普遍的药物发现发生了范式转变。”
论文链接:
https://doi.org/10.1016/j.cell.2020.01.021