以碼抗病:計算機如何輔助抗病毒藥物研發

原創:學CADD的蛋(彩一在讀博士)

首發:“科學大院”公衆號 

 

  我原以爲,這依然會是一個尋常的寒假。

  直到疫情的形勢愈發嚴峻。

  對病毒各類蛋白的調研任務分配到遠在五湖四海的每個實驗室成員頭上。沒有瓶瓶罐罐,沒有五花八門的試劑,沒有昂貴精致的儀器。一台能遠程連上服務器的電腦,這便是我所擁有的全部。

  图1. 药物研发有时只需要一台能连上服务器的笔记本(图片来源:veer图库)

 

  很多人以为,药物的研发只有在穿着白大褂的实验室里可以做。然而,随着近十余年,各类理论方法、计算机硬件、及工业和学术专业软件的发展与成熟,计算机辅助药物设计(Computer-Aided Drug Design, CADD)的方法已日趋成熟,其应用极大地加快了新藥研发的速度与效率,已成为现代药物研发的常规方法之一[1]。

  依賴于這樣的技術,即便我足不出戶,在家遠程工作,也能爲尋找治療此次病毒感染的潛在藥物貢獻自己的力量。

 

 尋找關鍵蛋白質

  蛋白質是生命的物質基礎,是組成細菌、病毒及動植物的一切細胞、組織的重要成分。各類功能性蛋白質在機體中各司其職,維系著整個機體的正常運轉。

  以病毒爲例,病毒是由核酸(DNA或RNA)與蛋白質構成的非細胞形態,介于生命體與非生命體之間,無法自我複制與繁殖,需要寄生在活的宿主細胞內,依賴于宿主細胞的原料、能量供給與場所,完成自我的複制與釋放[2]。這一過程就好比一個A國的賣假鈔的罪犯(病毒),本身沒有印制A國貨幣的能力;但當他侵入B國的印鈔廠(宿主細胞)後,他就能調用B國工廠的所有資源,來印制A國的貨幣(病毒的核酸與蛋白)。

  病毒的生命周期需要经历吸附、侵入、脱壳、生物合成、组装和释放等六大步骤[2],病毒的各类功能性蛋白在这些步骤中分工明确、高度协作,从而才能完成从感染宿主细胞到复制病毒的整个周期。目前,研究人员已从新型冠状病毒(2019-nCov)中分离出orf1ab, S, E, M, N等10条基因组序列,各自编码相应的病毒蛋白。

  通过与同为冠状病毒的SARS病毒类比,我们可以合理地推测出新型冠状病毒基因编码的各类蛋白质的功能。举例来讲,如,orf1ab基因编码orf1ab多聚蛋白,参与病毒RNA的转录与复制,并具有蛋白酶、甲基转移酶等多个功能;S基因编码冠状病毒的表面糖蛋白,也称为棘突蛋白(Spike Protein),通过与人体内的ACE2蛋白质结合,直接介导病毒对宿主细胞的感染及融合,这类蛋白如同日冕般分布在病毒的包膜上,“冠状病毒”由此得名。這些功能性蛋白質對病毒的感染與複制發揮著重要的作用,單獨或同時幹擾其中的一個或多個蛋白質的功能,抑制其活性,便能阻斷病毒感染宿主細胞或在宿主細胞內自我複制的進程,從而起到治療的效果。

  因此,一旦獲取了病毒蛋白質的晶體結構,基于前期對其功能的了解,我們便能利用計算機輔助藥物設計的技術,針對性地尋找潛在的有效藥物。那麽,這一過程是如何進行的呢?

 

 魚與刀,鎖與鑰匙

  若是“以貌取物”的話,在以“光滑彈嫩”爲美的今天,蛋白質表面坑坑窪窪,“長得”可實在不算漂亮。可恰是這些坑坑窪窪的空腔,才是真正暗藏玄機的地方。

  以SARS病毒orf1ab多聚蛋白中的一段,3C-like蛋白酶,也稱Mpro蛋白爲例。這一蛋白主要負責將多聚蛋白水解爲功能性的多肽,以發揮其各自的功能;就好比做魚的時候,用一把鋒利的刀把整條魚除鱗去髒,並分爲魚頭、魚身、魚尾,分別預備炖湯、紅燒、清蒸一樣。這一蛋白酶的活性位點,就好比是這把菜刀的刀刃,就藏身于蛋白質表面的空腔(口袋)中(圖2)。

  图2. 坑坑洼洼的SARS Mpro蛋白表面(白色)及其蛋白酶活性位点口袋(红色圆圈),PDB编号2GX4[3](图片来源:PyMol作图)

  篩選或合成得到的具有生物活性的小分子可以很好地結合在這一活性位點的口袋中(圖3),從而抑制蛋白酶的活性,阻止其將多聚蛋白切割爲功能性多肽,從而阻止這些多肽在後續病毒的複制和感染中發揮功能。就好比沒收了這把切魚的刀,或者在刀刃上套了一層使其鈍化的保護套,使其無法處理這條魚,從而無法進行後續的烹饪。

  图3. SARS Mpro蛋白表面(白色)及文献报导的抑制剂(绿色棍装),PDB编号2GX4[3](图片来源:PyMol作图)

  對每一個蛋白質,尋找具有令人滿意的生物活性的分子的過程,就好比是面對一把精美絕倫的鎖,需要找到一把同樣精美絕倫的鑰匙,來與之緊密契合。而計算機輔助藥物設計所需要做的,就是以高效和低成本的方式,去找到這樣一把合理的鑰匙;即,基于對蛋白質功能的前期了解,及對蛋白質結構的系統分析,通過計算的方式,評估各類分子在蛋白質口袋中的結合強度和作用模式,從而篩選或設計出最有可能成爲蛋白功能抑制劑(或激動劑)的分子。

 

  計算機輔助藥物發現

  不幸的是,尽管近年来相关技术飞速发展,但找到这样一把精美绝伦的钥匙绝非易事。一个新藥从研发到上市往往需要消耗数十年的时间和数以十亿计的美金[4]。但好消息是,总有这样几把锁长得有点像,其钥匙可以通用,就像艾滋病蛋白酶的抑制剂可能可以作用于冠状病毒的蛋白酶(如奈菲那韦和洛匹那韦),负责埃博拉或流感病毒RNA复制的RNA聚合酶(RNA-dependent RNA polymerase,RdRp)抑制剂可能可以作用于冠状病毒的RdRp一样(如法匹拉韦和瑞德西韦)[5]。

  面對急性爆發的疫情,從已上市或已在臨床上的“老藥物”中尋找合適的分子顯然是相比從頭研發新的分子更具時間優勢的策略。运用计算机辅助药物设计,基于一种叫做分子对接(molecular docking)的技术进行虚拟筛选(virtual screening),我們可以模擬出每個“老藥”分子在病毒蛋白質口袋中的結合構象,通過打分函數、自由能計算等方式評估其理論上的結合強度,從而分析該分子成爲潛在抑制劑的可能性。就好比當我們已知“鎖”的構造時,運用這樣的技術,可以不必親自把每把鑰匙都在鎖孔裏插一遍來尋找能開鎖的那把;通過計算機模擬分析的方式,篩選出最可能打開鎖的幾把鑰匙,而後只對這幾把鑰匙進行測試就可以了。

  甚至于,利用同源模建(homology modeling)的技术,我们甚至可以不用知道当前病毒蛋白这把“锁”的构造,在仅有蛋白质氨基酸序列的情况下,构建出病毒蛋白质结构可能的模型,从而提交虚拟筛选作业。尽管据早期的新闻报导,2019-nCov病毒和SARS病毒在基因組水平的相似度只有70%,但事實上,通過對病毒蛋白的序列比對可以發現,此次新型冠狀病毒的某些關鍵蛋白和SRAS病毒的氨基酸同源性能达到95%以上(例,图4)。因此,依赖于蛋白质晶体结构数据库(Protein Data Bank)中,早年研究SRAS病毒时获得的SARS病毒蛋白的晶体结构,我们便可以构建出合理的2019-nCov的相应蛋白质的结构。

  图4. SARS与2019-nCov的Mpro蛋白氨基酸序列比对(图片来源:BoxShade作图)

  因此,對急性爆發的疫情,當結構生物學等基礎研究來不及跟上;當病毒毒性太大,實驗室條件受限、滿足生物安全要求的實驗室較少;或者當待測試分子過多,人員不足,成本過高時,計算機輔助的方式都不失爲一種高效的策略,爲活性分子的發現與機制探索提供寶貴的建議,從而爲特效藥物的研發贏得寶貴的時間。

 

  寫在最後的話

  我自寒假的第三天開始在家參與此次新型冠狀病毒的相關工作,至今已過去約兩周的時間。無疑,在博士求學生涯即將結束的階段,這是我度過的最充實、也是最緊張的一個假期。

  但正如前文所述,药物研发,绝非易事。就像早先一些学者所说的“不管疾病有多严重,不管我们期待新藥和新疫苗的愿望是多么迫切,新藥和新疫苗开发的规律无法被逾越。”[6]药物研发有其固有的规律,绝非人的意志可以转移。尽管如前所述,现今已有多个药物在进行临床或临床前研究[5],但保护好自己不受感染依然是每个人的当务之急。

  所幸相比17年前,我們現在有了天河,有了神威,用于蛋白體系模擬的算力早與當年不可同日而語,一個又一個課題組及科研工作者,毫不猶豫地犧牲了自己的休息時間參與此次攻關。

  也許就像高中政治課本裏所說的那樣吧:“道路是曲折的,前途是光明的!

  2020年2月寫于等服務器計算結果的間隙

 

  參考資料:

  1.Jorgensen, W. L., The many roles of computation in drug discovery. Science 2004, 303, 1813.

  2.中科院微生物所, 科学大院, 入侵&反击!病原体和人体的攻防战.

  3.Yang, S.; Chen, S. J.; Hsu, M. F.; et, al., Synthesis, crystal structure, structure-activity relationships, and antiviral activity of a potent SARS coronavirus 3CL protease inhibitor. J. Med. Chem. 2006, 49, 4971.

  4. 管丽,科学大院,新藥是如何从实验室走向市场的?

  5.医药魔方, 医药魔方Info, 重磅!Remdesivir新型肺炎临床试验2月3日启动!海正法匹拉韦紧急申报上市.

  6.王立铭, 赛先生, 新藥新疫苗,我们什么时候能等到?

  版權說明:未經授權嚴禁任何形式的媒體轉載和摘編!