不同于深耕大語(yǔ)言模型的OpenAI,谷歌DeepMind在結(jié)構(gòu)生物學(xué)領(lǐng)域越走越深,從嘗試預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)出發(fā),如今已實(shí)現(xiàn)對(duì)大部分生命分子的預(yù)測(cè)。
2018年,DeepMind推出第一代AlphaFold模型,開始公開其在蛋白質(zhì)預(yù)測(cè)領(lǐng)域的工作,首代即達(dá)行業(yè)“天花板”高度,推進(jìn)了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的前沿;2020年,DeepMind發(fā)布AlphaFold 2,被認(rèn)為是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的里程碑式突破。今年5月,DeepMind再次對(duì)該模型實(shí)現(xiàn)更新,推出AlphaFold 3,直接登上Nature頭條,引起業(yè)內(nèi)廣泛關(guān)注。
IQVIA高級(jí)分析和人工智能解決方案負(fù)責(zé)人金暉向21世紀(jì)經(jīng)濟(jì)報(bào)道記者介紹,AlphaFold主要是AI for Science領(lǐng)域的應(yīng)用,相比于Alphafold 2,Alphafold 3不僅提高了預(yù)測(cè)準(zhǔn)確度,還進(jìn)一步擴(kuò)大了預(yù)測(cè)范圍。Alphafold 2是預(yù)測(cè)蛋白質(zhì)單體結(jié)構(gòu),而更新之后還可以預(yù)測(cè)蛋白復(fù)合物間相互作用、蛋白與小分子相互作用等。
據(jù)官方披露的信息,AlphaFold 3引入了Pairformer,使模型更關(guān)注結(jié)構(gòu)部分,同時(shí),使用Diffusion代替原來的結(jié)構(gòu)模塊。升級(jí)之后的AlphaFold 3可以直接預(yù)測(cè)原子3D坐標(biāo),成功將AI的能力擴(kuò)展到DNA、RNA等領(lǐng)域。對(duì)于蛋白質(zhì)與其他分子類型的相互作用,AlphaFold 3在基準(zhǔn)測(cè)試中的準(zhǔn)確率比現(xiàn)有最好的傳統(tǒng)方法高出50%,也因此成為首個(gè)在生物分子結(jié)構(gòu)預(yù)測(cè)方面超越基于物理工具方法的AI系統(tǒng)。
沙利文大中華區(qū)執(zhí)行總監(jiān)周明子對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道表示,以AlphaFold3為代表的同類AI工具,為醫(yī)療行業(yè)發(fā)展帶來了深遠(yuǎn)的影響。它們通過精準(zhǔn)預(yù)測(cè)生物分子結(jié)構(gòu),加速了藥物研發(fā)進(jìn)程,推動(dòng)了精準(zhǔn)醫(yī)療的發(fā)展,并促進(jìn)了科研合作與交流。
“這些技術(shù)工具不僅提高了藥物研發(fā)的效率和成功率,還為疾病機(jī)制的深入理解提供了新視角。未來,隨著技術(shù)的不斷成熟和應(yīng)用領(lǐng)域的拓展,AI工具在醫(yī)療領(lǐng)域的應(yīng)用前景將更加廣闊,有望為醫(yī)療行業(yè)帶來更多創(chuàng)新和變革。但也需要關(guān)注技術(shù)成熟度、數(shù)據(jù)安全與隱私保護(hù)以及法規(guī)政策等方面的挑戰(zhàn)。”周明子說。
人類對(duì)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)已持續(xù)半個(gè)世紀(jì)之久,AI入局之前,科學(xué)家主要用計(jì)算機(jī)分析蛋白質(zhì),但預(yù)測(cè)準(zhǔn)確率較低,結(jié)構(gòu)細(xì)節(jié)往往不被采信,多被當(dāng)作晶體結(jié)構(gòu)解析的模板使用,想要真正確認(rèn)蛋白質(zhì)的結(jié)構(gòu)還是要通過實(shí)驗(yàn)。
AlphaFold的出現(xiàn)開始加速改變這一現(xiàn)狀,初代AlphaFold已展示出了強(qiáng)大的預(yù)測(cè)實(shí)力,在CASP13(第十三屆國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽)中獲得第一名。在CASP14中,AlphaFold 2對(duì)大部分蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)與真實(shí)結(jié)構(gòu)只差一個(gè)原子的寬度。彼時(shí),DeepMind表示,他們已經(jīng)解決了關(guān)鍵的“蛋白質(zhì)折疊問題”,并且將解決問題的運(yùn)算時(shí)間從數(shù)月縮短至了數(shù)小時(shí)。截至目前,全球已有數(shù)百萬(wàn)的研究人員使用AlphaFold 2在瘧疾疫苗、癌癥治療和酶設(shè)計(jì)等領(lǐng)域取得了進(jìn)展。
對(duì)于最近更新的AlphaFold 3,只要給定分子輸入列表,通過預(yù)測(cè)不僅能生成它們的聯(lián)合三維結(jié)構(gòu),還能揭示分子之間的相互作用,這意味著AlphaFold 3將人類帶到了蛋白質(zhì)之外的更廣泛的生物分子領(lǐng)域。
毫無(wú)疑問,創(chuàng)新AI工具的應(yīng)用能夠加速藥物研發(fā)。金暉表示,藥物研發(fā)領(lǐng)域有一個(gè)“雙十定律”,即研發(fā)一款新藥需要10年時(shí)間、10億美金的投入。以AlphaFold 3為代表的AI for Science的工具,可以為藥物研發(fā)指明方向,加速研發(fā)過程,提高研發(fā)效率。
有券商分析師對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道指出,通過預(yù)測(cè)藥物分子與疾病相關(guān)蛋白的相互作用,AlphaFold 3顯著加速了藥物篩選過程,極大地提升整個(gè)新藥研發(fā)階段最耗時(shí)的篩選效率;通過底層邏輯來洞察新藥的機(jī)制,能夠提高疾病治療的精確性,AlphaFold 3可以幫助科學(xué)家更深入地了解疾病通路和蛋白質(zhì)功能,從而設(shè)計(jì)出更精準(zhǔn)的治療方案,包括個(gè)性化醫(yī)療和靶向治療。
不僅如此,AlphaFold 3整體上可以降低研發(fā)成本。傳統(tǒng)的蛋白質(zhì)結(jié)構(gòu)解析成本高昂,耗時(shí)且需要復(fù)雜的實(shí)驗(yàn)設(shè)備,AlphaFold 3通過AI技術(shù)降低了這些成本,使得更多的科研機(jī)構(gòu)能夠參與到相關(guān)研究中。
關(guān)于大模型的開源和閉源,行業(yè)內(nèi)的爭(zhēng)論從未停止,此次AlphaFold 3也卷入了其中。
2021年,DeepMind宣布對(duì)AlphaFold 2進(jìn)行開源,并發(fā)布了其模型和代碼。而此次AlphaFold 3發(fā)布時(shí),DeepMind并未打算發(fā)布其開源代碼,科學(xué)家對(duì)其服務(wù)器的訪問也受到各種限制:科學(xué)家可以通過AlphaFold Server訪問AlphaFold 3,不過每天只能使用10次,且不能用于商業(yè)研究。同時(shí),科學(xué)家也不可能獲得可能與藥物結(jié)合的蛋白質(zhì)結(jié)構(gòu)。
此舉遭到科學(xué)界的反對(duì),認(rèn)為這種做法不符合科學(xué)進(jìn)步的原則,多位科學(xué)家聯(lián)名撰寫了一封致Nature的公開信,并得到數(shù)百位科學(xué)家的支持。隨后,DeepMind宣布將在六個(gè)月內(nèi),開放AlphaFold 3的代碼和模型權(quán)重。與此同時(shí),AlphaFold 3服務(wù)的每日使用次數(shù)上調(diào)為20次。
盡管如此,此后的一段時(shí)間仍有科學(xué)家在支持AlphaFold 3走向開源。根據(jù)最新數(shù)據(jù),已有超千位來自世界各國(guó)的科學(xué)家在公開信上署名。
面對(duì)AlphaFold 3的沖擊,我國(guó)又該如何不陷入“卡脖子”的困境?金暉表示,國(guó)內(nèi)企業(yè)要持樂觀態(tài)度,技術(shù)的發(fā)展從來都不是靠一家企業(yè)就可以實(shí)現(xiàn)的。當(dāng)前AlphaFold 3更多還是在實(shí)驗(yàn)室或?qū)W術(shù)界被廣泛討論,沒有真正實(shí)現(xiàn)大規(guī)模商業(yè)化,國(guó)內(nèi)企業(yè)還是有時(shí)間去追趕或提高的。
通過梳理不難發(fā)現(xiàn),我國(guó)部分企業(yè)在相關(guān)方面已經(jīng)有所突破。比如,華為的MEGA-Protein、深勢(shì)科技的Uni-Fold、華深智藥的OmegaFold、百圖生科和清華大學(xué)共同開發(fā)的xTrimoPGLM,以及復(fù)旦大學(xué)和上海人工智能實(shí)驗(yàn)室合作推出的OPUS系列算法等多種工具,已經(jīng)開始賦能生物蛋白質(zhì)領(lǐng)域的基礎(chǔ)研究與應(yīng)用工作。
未來,我國(guó)AI企業(yè)及相關(guān)藥企應(yīng)積極布局以應(yīng)對(duì)挑戰(zhàn)并抓住機(jī)遇。
周明子建議,一方面,AI企業(yè)可以加大在深度學(xué)習(xí)、Transformer和Diffusion模型等前沿技術(shù)的研發(fā)投入,提升模型預(yù)測(cè)準(zhǔn)確性和泛化能力,同時(shí)探索與生物醫(yī)藥領(lǐng)域的深度融合,開發(fā)出更多具有實(shí)際應(yīng)用價(jià)值的AI工具。
另一方面,藥企應(yīng)加強(qiáng)與AI企業(yè)的合作,利用AI技術(shù)加速新藥研發(fā)流程,提高研發(fā)效率和成功率,同時(shí)關(guān)注AI在藥物優(yōu)化、疾病診斷等方面的應(yīng)用,以科技創(chuàng)新推動(dòng)產(chǎn)業(yè)升級(jí)。
“雙方還應(yīng)共同關(guān)注數(shù)據(jù)安全和隱私保護(hù),確保在推動(dòng)技術(shù)進(jìn)步的同時(shí),也符合法律法規(guī)和倫理要求。”周明子強(qiáng)調(diào)。
面對(duì)成百上千億美元的市場(chǎng),如何實(shí)現(xiàn)商業(yè)化成為企業(yè)需要思考的問題。事實(shí)上,為更好實(shí)現(xiàn)AlphaFold項(xiàng)目的商業(yè)化,2021年11月,谷歌成立了Isomorphic Labs,布局藥物研發(fā)。今年1月,Isomorphic Labs宣布與全球制藥巨頭禮來和諾華建立戰(zhàn)略合作。當(dāng)前,Isomorphic Labs已經(jīng)使用AlphaFold 3為其內(nèi)部項(xiàng)目以及合作伙伴進(jìn)行藥物設(shè)計(jì)。
“在AI制藥領(lǐng)域,科技巨頭和傳統(tǒng)的頭部制藥企業(yè)的合作更能夠?yàn)樾袠I(yè)帶來更多的顛覆。”上述券商分析師表示,不過,要想真正實(shí)現(xiàn)大規(guī)模商業(yè)化還有諸多壁壘。
在金暉看來,目前,AlphaFold 3只是在生物分子層面做預(yù)測(cè),要真正實(shí)現(xiàn)AI for Science還有很長(zhǎng)的路要走。一方面,AlphaFold 3這一模型的訓(xùn)練成本非常高,需要耗費(fèi)大量的資源;另一方面,在真正做實(shí)際應(yīng)用時(shí),還需要硬件層面的一些準(zhǔn)備。此外,企業(yè)也還在尋找PMF(產(chǎn)品市場(chǎng)匹配),所以未來大規(guī)模的商業(yè)推廣、商業(yè)模型以及實(shí)際落地后為終端用戶帶來的商業(yè)價(jià)值還需要不斷摸索。
周明子認(rèn)為,AI在結(jié)構(gòu)生物學(xué)及整個(gè)醫(yī)療領(lǐng)域?qū)崿F(xiàn)大規(guī)模商業(yè)化落地,需通過技術(shù)不斷成熟與應(yīng)用拓展。如AlphaFold 3在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中的成功應(yīng)用,推動(dòng)了藥物研發(fā)與疾病機(jī)制研究的進(jìn)程。然而,要達(dá)成這一目標(biāo),還需克服多重壁壘,包括技術(shù)成熟度與可靠性的進(jìn)一步提升、高質(zhì)量醫(yī)療數(shù)據(jù)的積累與整合、數(shù)據(jù)隱私與安全保護(hù)機(jī)制的完善,以及適應(yīng)行業(yè)特點(diǎn)的法規(guī)政策與標(biāo)準(zhǔn)的制定。此外,跨界合作與產(chǎn)業(yè)融合也是推動(dòng)AI在醫(yī)療領(lǐng)域商業(yè)化落地的重要路徑。
據(jù)行業(yè)媒體預(yù)測(cè),預(yù)計(jì)到2025年,30%的新藥將會(huì)使用AI研發(fā)。截至目前,F(xiàn)DA已經(jīng)批準(zhǔn)了100多種使用AI或機(jī)器學(xué)習(xí)進(jìn)行開發(fā)的藥物候選物的臨床試驗(yàn),不過想要最終上市可能還需要數(shù)年時(shí)間。
“藥物研發(fā)過程很漫長(zhǎng),AI參與的結(jié)構(gòu)預(yù)測(cè)只是其中最初的步驟。這些研究成果還需進(jìn)行臨床研究驗(yàn)證才能進(jìn)行應(yīng)用。”上述券商分析師說,無(wú)論如何,人工智能和醫(yī)療行業(yè)相結(jié)合,是未來發(fā)展的一個(gè)大方向。星星之火的階段是人工智能嵌入到醫(yī)療行業(yè)不同場(chǎng)景,從而解決具體的問題,未來,人工智能將在醫(yī)療領(lǐng)域?qū)崿F(xiàn)更深層次的應(yīng)用,從而帶來整個(gè)行業(yè)的巨大改變。