今年的諾貝爾獎(jiǎng)將人工智能(AI)推到了科學(xué)舞臺(tái)的中央。這不僅是對(duì)幾位杰出科學(xué)家的認(rèn)可,也是對(duì)AI在科學(xué)進(jìn)步中作用的肯定。這些獎(jiǎng)項(xiàng)的頒發(fā),標(biāo)志著AI在科學(xué)研究中的重要地位得到了認(rèn)可,預(yù)示著AI正在重塑我們的世界,尤其是在科學(xué)探索和創(chuàng)新的范式上掀起了新的浪潮。
工智能勢(shì)不可擋,正在改變我們的世界和科學(xué)研究的方式:AI for science,Science all in AI(科學(xué)智能與人工智能中的科學(xué))。展望未來(lái),AI將繼續(xù)引領(lǐng)科學(xué)的發(fā)展,為人類社會(huì)創(chuàng)造更大的福祉。我們正處于一個(gè)新的時(shí)代的開(kāi)端:擁抱AI,將開(kāi)啟無(wú)限的可能。
AI與物理學(xué)的交匯
從霍普菲爾德網(wǎng)絡(luò)到深度學(xué)習(xí)
先簡(jiǎn)單回顧一下今年兩位新晉諾貝爾物理學(xué)獎(jiǎng)得主的貢獻(xiàn)。
1982年,約翰·霍普菲爾德提出了著名的霍普菲爾德網(wǎng)絡(luò),這是一種具有自組織能力的遞歸神經(jīng)網(wǎng)絡(luò)。霍普菲爾德網(wǎng)絡(luò)模擬了生物神經(jīng)網(wǎng)絡(luò)的聯(lián)想記憶功能,能夠通過(guò)能量最小化的原理,實(shí)現(xiàn)對(duì)部分缺失信息的補(bǔ)全和模式識(shí)別。
霍普菲爾德網(wǎng)絡(luò)的理論基礎(chǔ)深扎根于物理學(xué),類似于統(tǒng)計(jì)物理學(xué)中的伊辛模型(Ising Model)用于描述磁性材料中自旋相互作用的系統(tǒng),通過(guò)能量函數(shù)的最小化來(lái)確定系統(tǒng)的穩(wěn)定狀態(tài)。霍普菲爾德巧妙地將這一概念應(yīng)用于神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)狀態(tài)的演化可以被視為能量函數(shù)的下降過(guò)程,最終達(dá)到穩(wěn)定的記憶存儲(chǔ)狀態(tài)。霍普菲爾德網(wǎng)絡(luò)的出現(xiàn),為神經(jīng)網(wǎng)絡(luò)的理論研究提供了堅(jiān)實(shí)的物理學(xué)基礎(chǔ),也為后來(lái)的機(jī)器學(xué)習(xí)和人工智能發(fā)展奠定了重要的基石。
杰弗里·欣頓被譽(yù)為“深度學(xué)習(xí)之父”,他在1985年與特里·謝澤諾斯基在霍普菲爾德網(wǎng)絡(luò)的基礎(chǔ)上共同提出了玻爾茲曼(Boltzmann)機(jī)。這是一種基于隨機(jī)性和能量函數(shù)的神經(jīng)網(wǎng)絡(luò)模型,可以通過(guò)模擬退火算法學(xué)習(xí)復(fù)雜的概率分布。玻爾茲曼機(jī)的名稱來(lái)源于物理學(xué)中的玻爾茲曼分布(Boltzmann distribution),這是統(tǒng)計(jì)物理中描述粒子能量分布的基本概念。玻爾茲曼機(jī)利用這種分布來(lái)定義網(wǎng)絡(luò)中神經(jīng)元狀態(tài)的概率,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的生成和特征學(xué)習(xí),也為后續(xù)生成模型的發(fā)展提供了思路。
欣頓在1986年與大衛(wèi)·羅密爾頓和羅納德·威廉姆斯共同推廣了反向傳播算法,解決了神經(jīng)網(wǎng)絡(luò)做不深的問(wèn)題,使得深層網(wǎng)絡(luò)的訓(xùn)練成為可能。借助受限玻爾茲曼機(jī)(Restricted Boltzmann Machine)引入無(wú)監(jiān)督的逐層預(yù)訓(xùn)練方法,他在2006年提出深度信念網(wǎng)絡(luò)(Deep Belief Network),解決訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)時(shí)梯度消失的問(wèn)題。這一突破為深度學(xué)習(xí)的迅猛發(fā)展奠定了極為重要的基礎(chǔ)。
諾貝爾獎(jiǎng)委員會(huì)將他倆的成果評(píng)價(jià)為“為機(jī)器學(xué)習(xí)革命奠基性的工作”。我們由此可以看到,統(tǒng)計(jì)物理為機(jī)器學(xué)習(xí)的早期發(fā)展提供了思路,如今的深度學(xué)習(xí)也在可控核聚變、天文觀測(cè)等研究方向惠及了物理學(xué)的研究。
生命科學(xué)重新認(rèn)識(shí)AI潛力
從Rosetta軟件到AI驅(qū)動(dòng)的創(chuàng)新
人體內(nèi)擁有數(shù)萬(wàn)種蛋白質(zhì),已知的蛋白質(zhì)數(shù)量也超過(guò)數(shù)億。然而,在浩瀚的蛋白質(zhì)序列宇宙中,這不過(guò)是冰山一角。科學(xué)家們既希望優(yōu)化現(xiàn)有的工具蛋白,也渴望探索蛋白質(zhì)宇宙中的“暗物質(zhì)”,即那些尚未發(fā)現(xiàn)的功能蛋白。這正是蛋白質(zhì)設(shè)計(jì)的核心使命——通過(guò)這一技術(shù),科學(xué)家們可以創(chuàng)造出全新、自然界中從未存在的蛋白質(zhì)。這些蛋白質(zhì)不再受限于傳統(tǒng)進(jìn)化規(guī)則,而是完全由人類設(shè)計(jì),具備定制化功能特征。
在蛋白質(zhì)設(shè)計(jì)領(lǐng)域,華盛頓大學(xué)大衛(wèi)·貝克教授的團(tuán)隊(duì)無(wú)疑站在了最前沿。過(guò)去20年中,該團(tuán)隊(duì)致力于開(kāi)發(fā)計(jì)算驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)方法,從蛋白質(zhì)結(jié)構(gòu)入手,從頭開(kāi)始設(shè)計(jì)出形態(tài)和功能各異的蛋白質(zhì)。隨著時(shí)間的推移,這一領(lǐng)域經(jīng)歷了巨大的進(jìn)步:從最初基于物理和統(tǒng)計(jì)方法的Rosetta軟件,到如今依靠深度學(xué)習(xí)的AI方法,如ProteinMPNN和RFdiffusion,蛋白質(zhì)設(shè)計(jì)技術(shù)不斷革新,但從頭設(shè)計(jì)蛋白的目標(biāo)始終不變。
如今,貝克團(tuán)隊(duì)設(shè)計(jì)的蛋白質(zhì)已具備多種功能,包括從頭設(shè)計(jì)的聯(lián)合疫苗的RSV/hMPV、能夠識(shí)別非天然底物的熒光素酶、以及用于藥物研發(fā)的細(xì)胞因子類似物和抗體。蛋白質(zhì)設(shè)計(jì)已經(jīng)完成了概念驗(yàn)證階段,正逐步拓展在各類生物醫(yī)學(xué)領(lǐng)域的實(shí)際應(yīng)用。
在生命科學(xué)領(lǐng)域,乃至整個(gè)自然科學(xué)中,AI最具影響力的應(yīng)用莫過(guò)于AlphaFold。其誕生故事看似簡(jiǎn)單:一位橫跨數(shù)學(xué)、物理、化學(xué)、生物、計(jì)算機(jī)的年輕博士約翰·江珀,與谷歌DeepMind CEO德米斯·哈薩比斯共同領(lǐng)導(dǎo)的頂尖跨學(xué)科團(tuán)隊(duì),經(jīng)過(guò)三年努力,打造出一個(gè)專門用于解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)任務(wù)的模型。
盡管AlphaFold2當(dāng)時(shí)在蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)以及藥物分子、核酸、修飾蛋白等方面還存在局限,但三年后的AlphaFold3解決了這些問(wèn)題。
這一突破性的成功使整個(gè)生物學(xué)界重新認(rèn)識(shí)了AI的潛力,并推動(dòng)了新的算法開(kāi)發(fā),如前文提到的蛋白質(zhì)設(shè)計(jì)方法,也催生了生物技術(shù)公司的蓬勃發(fā)展和全新的科研模式。AlphaFold2毫無(wú)疑問(wèn)改變了生物學(xué)家研究蛋白質(zhì)的方式。
自AlphaFold問(wèn)世以來(lái),它已被廣泛應(yīng)用在各式各樣的生物學(xué)研究中。在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中,通過(guò)實(shí)驗(yàn)方法解析的蛋白質(zhì)結(jié)構(gòu)數(shù)量已達(dá)到20萬(wàn),這也成為了AlphaFold訓(xùn)練數(shù)據(jù)的重要來(lái)源。然而,借助AlphaFold等結(jié)構(gòu)預(yù)測(cè)工具,科學(xué)家已經(jīng)預(yù)測(cè)了近10億個(gè)蛋白質(zhì)的三維結(jié)構(gòu),其中大多數(shù)都具備很高的精度和質(zhì)量。
AlphaFold正逐步成為生物學(xué)研究中的便捷且精準(zhǔn)的AI工具,融入很多生物學(xué)領(lǐng)域的研究當(dāng)中——曾經(jīng)耗費(fèi)大量時(shí)間和資金才能獲得的蛋白質(zhì)結(jié)構(gòu),現(xiàn)在“點(diǎn)擊就送”。展望未來(lái),AlphaFold的后續(xù)版本有望解決更多復(fù)雜問(wèn)題,帶來(lái)更多意想不到的應(yīng)用場(chǎng)景。
AI獲得諾獎(jiǎng)
AI正深刻改變各學(xué)科研究方向
這次諾貝爾化學(xué)獎(jiǎng)和物理學(xué)獎(jiǎng)都給了AI,尤其是物理學(xué)獎(jiǎng)直接頒發(fā)給了欣頓(一個(gè)計(jì)算機(jī)學(xué)家)還是令人非常震驚的。除了對(duì)欣頓基于物理啟發(fā)的人工智能算法的開(kāi)發(fā)的認(rèn)可,更體現(xiàn)了諾獎(jiǎng)委員會(huì)對(duì)科學(xué)范式變革的預(yù)見(jiàn)。
物理這門學(xué)科歸根結(jié)底是探索理解這個(gè)世界的方法論。傳統(tǒng)的物理方法論或者說(shuō)占統(tǒng)治地位的方法論是搞清楚底層機(jī)理,通過(guò)不斷地疊加近似來(lái)解讀復(fù)雜事物。但AI反其道行之,是基于數(shù)據(jù)推斷,端到端給出預(yù)測(cè)。這也能解決問(wèn)題,就像諾貝爾化學(xué)獎(jiǎng)的“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)”,最開(kāi)始研究這個(gè)問(wèn)題的是統(tǒng)計(jì)物理學(xué)家,他們基于物理計(jì)算來(lái)預(yù)測(cè)蛋白結(jié)構(gòu),但深度學(xué)習(xí)在這個(gè)問(wèn)題上獲得了完勝傳統(tǒng)物理計(jì)算的精度。
如果科學(xué)問(wèn)題本身就是如何預(yù)測(cè)一個(gè)給定序列蛋白的三維結(jié)構(gòu),那么顯然我們的物理底層知識(shí)和方程是不夠的,但基于大數(shù)據(jù)的AI方法是能解決這個(gè)科學(xué)問(wèn)題的。基于數(shù)據(jù)的推斷就是在這個(gè)科學(xué)問(wèn)題上更好的方法論。這無(wú)疑是對(duì)傳統(tǒng)物理方法論的一種沖擊。
這次諾獎(jiǎng)的頒發(fā)顯示了物理學(xué)的包容,我們期待看到更多基于數(shù)據(jù)推斷的工具在物理學(xué)涌現(xiàn),幫助我們找到更好的超導(dǎo)材料,幫我們找到更優(yōu)的聚變控制方法等等。
諾貝爾獎(jiǎng)一直以來(lái)被視為科學(xué)領(lǐng)域的最高榮譽(yù),用于表彰在物理學(xué)、化學(xué)、生理學(xué)或醫(yī)學(xué)等領(lǐng)域作出突出貢獻(xiàn)的個(gè)人。然而,隨著人工智能技術(shù)的飛速發(fā)展,AI正在深刻改變著各個(gè)學(xué)科的研究方式和方向,成為數(shù)據(jù)推斷的新范式。此次諾獎(jiǎng)將物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)同時(shí)頒發(fā)給AI領(lǐng)域的先驅(qū),正是對(duì)這一趨勢(shì)的最好回應(yīng)。
(作者單位:上海交通大學(xué)自然科學(xué)研究院)
來(lái)源:文匯報(bào)
作者:余元璽 鐘博子韜 洪亮