諾獎(jiǎng)的AI年，帶來(lái)哪些啟示？

余元璽鐘博子韜洪亮2024-10-20 08:51

今年的諾貝爾獎(jiǎng)將人工智能（AI）推到了科學(xué)舞臺(tái)的中央。這不僅是對(duì)幾位杰出科學(xué)家的認(rèn)可，也是對(duì)AI在科學(xué)進(jìn)步中作用的肯定。這些獎(jiǎng)項(xiàng)的頒發(fā)，標(biāo)志著AI在科學(xué)研究中的重要地位得到了認(rèn)可，預(yù)示著AI正在重塑我們的世界，尤其是在科學(xué)探索和創(chuàng)新的范式上掀起了新的浪潮。

工智能勢(shì)不可擋，正在改變我們的世界和科學(xué)研究的方式：AI for science,Science all in AI（科學(xué)智能與人工智能中的科學(xué)）。展望未來(lái)，AI將繼續(xù)引領(lǐng)科學(xué)的發(fā)展，為人類社會(huì)創(chuàng)造更大的福祉。我們正處于一個(gè)新的時(shí)代的開(kāi)端：擁抱AI，將開(kāi)啟無(wú)限的可能。

AI與物理學(xué)的交匯

從霍普菲爾德網(wǎng)絡(luò)到深度學(xué)習(xí)

先簡(jiǎn)單回顧一下今年兩位新晉諾貝爾物理學(xué)獎(jiǎng)得主的貢獻(xiàn)。

1982年，約翰·霍普菲爾德提出了著名的霍普菲爾德網(wǎng)絡(luò)，這是一種具有自組織能力的遞歸神經(jīng)網(wǎng)絡(luò)。霍普菲爾德網(wǎng)絡(luò)模擬了生物神經(jīng)網(wǎng)絡(luò)的聯(lián)想記憶功能，能夠通過(guò)能量最小化的原理，實(shí)現(xiàn)對(duì)部分缺失信息的補(bǔ)全和模式識(shí)別。

霍普菲爾德網(wǎng)絡(luò)的理論基礎(chǔ)深扎根于物理學(xué)，類似于統(tǒng)計(jì)物理學(xué)中的伊辛模型（Ising Model）用于描述磁性材料中自旋相互作用的系統(tǒng)，通過(guò)能量函數(shù)的最小化來(lái)確定系統(tǒng)的穩(wěn)定狀態(tài)。霍普菲爾德巧妙地將這一概念應(yīng)用于神經(jīng)網(wǎng)絡(luò)，使網(wǎng)絡(luò)狀態(tài)的演化可以被視為能量函數(shù)的下降過(guò)程，最終達(dá)到穩(wěn)定的記憶存儲(chǔ)狀態(tài)。霍普菲爾德網(wǎng)絡(luò)的出現(xiàn)，為神經(jīng)網(wǎng)絡(luò)的理論研究提供了堅(jiān)實(shí)的物理學(xué)基礎(chǔ)，也為后來(lái)的機(jī)器學(xué)習(xí)和人工智能發(fā)展奠定了重要的基石。

杰弗里·欣頓被譽(yù)為“深度學(xué)習(xí)之父”，他在1985年與特里·謝澤諾斯基在霍普菲爾德網(wǎng)絡(luò)的基礎(chǔ)上共同提出了玻爾茲曼（Boltzmann）機(jī)。這是一種基于隨機(jī)性和能量函數(shù)的神經(jīng)網(wǎng)絡(luò)模型，可以通過(guò)模擬退火算法學(xué)習(xí)復(fù)雜的概率分布。玻爾茲曼機(jī)的名稱來(lái)源于物理學(xué)中的玻爾茲曼分布（Boltzmann distribution），這是統(tǒng)計(jì)物理中描述粒子能量分布的基本概念。玻爾茲曼機(jī)利用這種分布來(lái)定義網(wǎng)絡(luò)中神經(jīng)元狀態(tài)的概率，從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的生成和特征學(xué)習(xí)，也為后續(xù)生成模型的發(fā)展提供了思路。

欣頓在1986年與大衛(wèi)·羅密爾頓和羅納德·威廉姆斯共同推廣了反向傳播算法，解決了神經(jīng)網(wǎng)絡(luò)做不深的問(wèn)題，使得深層網(wǎng)絡(luò)的訓(xùn)練成為可能。借助受限玻爾茲曼機(jī)（Restricted Boltzmann Machine）引入無(wú)監(jiān)督的逐層預(yù)訓(xùn)練方法，他在2006年提出深度信念網(wǎng)絡(luò)（Deep Belief Network），解決訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)時(shí)梯度消失的問(wèn)題。這一突破為深度學(xué)習(xí)的迅猛發(fā)展奠定了極為重要的基礎(chǔ)。

諾貝爾獎(jiǎng)委員會(huì)將他倆的成果評(píng)價(jià)為“為機(jī)器學(xué)習(xí)革命奠基性的工作”。我們由此可以看到，統(tǒng)計(jì)物理為機(jī)器學(xué)習(xí)的早期發(fā)展提供了思路，如今的深度學(xué)習(xí)也在可控核聚變、天文觀測(cè)等研究方向惠及了物理學(xué)的研究。

生命科學(xué)重新認(rèn)識(shí)AI潛力

從Rosetta軟件到AI驅(qū)動(dòng)的創(chuàng)新

人體內(nèi)擁有數(shù)萬(wàn)種蛋白質(zhì)，已知的蛋白質(zhì)數(shù)量也超過(guò)數(shù)億。然而，在浩瀚的蛋白質(zhì)序列宇宙中，這不過(guò)是冰山一角。科學(xué)家們既希望優(yōu)化現(xiàn)有的工具蛋白，也渴望探索蛋白質(zhì)宇宙中的“暗物質(zhì)”，即那些尚未發(fā)現(xiàn)的功能蛋白。這正是蛋白質(zhì)設(shè)計(jì)的核心使命——通過(guò)這一技術(shù)，科學(xué)家們可以創(chuàng)造出全新、自然界中從未存在的蛋白質(zhì)。這些蛋白質(zhì)不再受限于傳統(tǒng)進(jìn)化規(guī)則，而是完全由人類設(shè)計(jì)，具備定制化功能特征。

在蛋白質(zhì)設(shè)計(jì)領(lǐng)域，華盛頓大學(xué)大衛(wèi)·貝克教授的團(tuán)隊(duì)無(wú)疑站在了最前沿。過(guò)去20年中，該團(tuán)隊(duì)致力于開(kāi)發(fā)計(jì)算驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)方法，從蛋白質(zhì)結(jié)構(gòu)入手，從頭開(kāi)始設(shè)計(jì)出形態(tài)和功能各異的蛋白質(zhì)。隨著時(shí)間的推移，這一領(lǐng)域經(jīng)歷了巨大的進(jìn)步：從最初基于物理和統(tǒng)計(jì)方法的Rosetta軟件，到如今依靠深度學(xué)習(xí)的AI方法，如ProteinMPNN和RFdiffusion，蛋白質(zhì)設(shè)計(jì)技術(shù)不斷革新，但從頭設(shè)計(jì)蛋白的目標(biāo)始終不變。

如今，貝克團(tuán)隊(duì)設(shè)計(jì)的蛋白質(zhì)已具備多種功能，包括從頭設(shè)計(jì)的聯(lián)合疫苗的RSV/hMPV、能夠識(shí)別非天然底物的熒光素酶、以及用于藥物研發(fā)的細(xì)胞因子類似物和抗體。蛋白質(zhì)設(shè)計(jì)已經(jīng)完成了概念驗(yàn)證階段，正逐步拓展在各類生物醫(yī)學(xué)領(lǐng)域的實(shí)際應(yīng)用。

在生命科學(xué)領(lǐng)域，乃至整個(gè)自然科學(xué)中，AI最具影響力的應(yīng)用莫過(guò)于AlphaFold。其誕生故事看似簡(jiǎn)單：一位橫跨數(shù)學(xué)、物理、化學(xué)、生物、計(jì)算機(jī)的年輕博士約翰·江珀，與谷歌DeepMind CEO德米斯·哈薩比斯共同領(lǐng)導(dǎo)的頂尖跨學(xué)科團(tuán)隊(duì)，經(jīng)過(guò)三年努力，打造出一個(gè)專門用于解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)任務(wù)的模型。

盡管AlphaFold2當(dāng)時(shí)在蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)以及藥物分子、核酸、修飾蛋白等方面還存在局限，但三年后的AlphaFold3解決了這些問(wèn)題。

這一突破性的成功使整個(gè)生物學(xué)界重新認(rèn)識(shí)了AI的潛力，并推動(dòng)了新的算法開(kāi)發(fā)，如前文提到的蛋白質(zhì)設(shè)計(jì)方法，也催生了生物技術(shù)公司的蓬勃發(fā)展和全新的科研模式。AlphaFold2毫無(wú)疑問(wèn)改變了生物學(xué)家研究蛋白質(zhì)的方式。

自AlphaFold問(wèn)世以來(lái)，它已被廣泛應(yīng)用在各式各樣的生物學(xué)研究中。在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中，通過(guò)實(shí)驗(yàn)方法解析的蛋白質(zhì)結(jié)構(gòu)數(shù)量已達(dá)到20萬(wàn)，這也成為了AlphaFold訓(xùn)練數(shù)據(jù)的重要來(lái)源。然而，借助AlphaFold等結(jié)構(gòu)預(yù)測(cè)工具，科學(xué)家已經(jīng)預(yù)測(cè)了近10億個(gè)蛋白質(zhì)的三維結(jié)構(gòu)，其中大多數(shù)都具備很高的精度和質(zhì)量。

AlphaFold正逐步成為生物學(xué)研究中的便捷且精準(zhǔn)的AI工具，融入很多生物學(xué)領(lǐng)域的研究當(dāng)中——曾經(jīng)耗費(fèi)大量時(shí)間和資金才能獲得的蛋白質(zhì)結(jié)構(gòu)，現(xiàn)在“點(diǎn)擊就送”。展望未來(lái)，AlphaFold的后續(xù)版本有望解決更多復(fù)雜問(wèn)題，帶來(lái)更多意想不到的應(yīng)用場(chǎng)景。

AI獲得諾獎(jiǎng)

AI正深刻改變各學(xué)科研究方向

這次諾貝爾化學(xué)獎(jiǎng)和物理學(xué)獎(jiǎng)都給了AI，尤其是物理學(xué)獎(jiǎng)直接頒發(fā)給了欣頓（一個(gè)計(jì)算機(jī)學(xué)家）還是令人非常震驚的。除了對(duì)欣頓基于物理啟發(fā)的人工智能算法的開(kāi)發(fā)的認(rèn)可，更體現(xiàn)了諾獎(jiǎng)委員會(huì)對(duì)科學(xué)范式變革的預(yù)見(jiàn)。

物理這門學(xué)科歸根結(jié)底是探索理解這個(gè)世界的方法論。傳統(tǒng)的物理方法論或者說(shuō)占統(tǒng)治地位的方法論是搞清楚底層機(jī)理，通過(guò)不斷地疊加近似來(lái)解讀復(fù)雜事物。但AI反其道行之，是基于數(shù)據(jù)推斷，端到端給出預(yù)測(cè)。這也能解決問(wèn)題，就像諾貝爾化學(xué)獎(jiǎng)的“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)”，最開(kāi)始研究這個(gè)問(wèn)題的是統(tǒng)計(jì)物理學(xué)家，他們基于物理計(jì)算來(lái)預(yù)測(cè)蛋白結(jié)構(gòu)，但深度學(xué)習(xí)在這個(gè)問(wèn)題上獲得了完勝傳統(tǒng)物理計(jì)算的精度。

如果科學(xué)問(wèn)題本身就是如何預(yù)測(cè)一個(gè)給定序列蛋白的三維結(jié)構(gòu)，那么顯然我們的物理底層知識(shí)和方程是不夠的，但基于大數(shù)據(jù)的AI方法是能解決這個(gè)科學(xué)問(wèn)題的。基于數(shù)據(jù)的推斷就是在這個(gè)科學(xué)問(wèn)題上更好的方法論。這無(wú)疑是對(duì)傳統(tǒng)物理方法論的一種沖擊。

這次諾獎(jiǎng)的頒發(fā)顯示了物理學(xué)的包容，我們期待看到更多基于數(shù)據(jù)推斷的工具在物理學(xué)涌現(xiàn)，幫助我們找到更好的超導(dǎo)材料，幫我們找到更優(yōu)的聚變控制方法等等。

諾貝爾獎(jiǎng)一直以來(lái)被視為科學(xué)領(lǐng)域的最高榮譽(yù)，用于表彰在物理學(xué)、化學(xué)、生理學(xué)或醫(yī)學(xué)等領(lǐng)域作出突出貢獻(xiàn)的個(gè)人。然而，隨著人工智能技術(shù)的飛速發(fā)展，AI正在深刻改變著各個(gè)學(xué)科的研究方式和方向，成為數(shù)據(jù)推斷的新范式。此次諾獎(jiǎng)將物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)同時(shí)頒發(fā)給AI領(lǐng)域的先驅(qū)，正是對(duì)這一趨勢(shì)的最好回應(yīng)。

（作者單位：上海交通大學(xué)自然科學(xué)研究院）

來(lái)源：文匯報(bào)

作者：余元璽鐘博子韜洪亮

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【余元璽鐘博子韜洪亮】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù)，不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議