大企業(yè)動向,也是行業(yè)重要指向。
在華為全聯(lián)接大會2024上,華為推出了一系列行業(yè)智能化創(chuàng)新產(chǎn)品和解決方案,其中推動AI技術(shù)與行業(yè)場景深度融合、促進(jìn)人才培養(yǎng)、構(gòu)建更完善的數(shù)智生態(tài)體系等,是眾多信息背后的重要表述。
加大與高校合作,是這一生態(tài)體系中的核心環(huán)節(jié)之一。華為通過“智能基座”、鯤鵬昇騰產(chǎn)教融合基地、鯤鵬昇騰創(chuàng)新大賽、鯤鵬昇騰科教創(chuàng)新卓越中心,與高校開展了一系列合作,培養(yǎng)原生卓越人才,激發(fā)計(jì)算產(chǎn)業(yè)創(chuàng)新。
科研正進(jìn)入“第五范式時(shí)代”,AI技術(shù)驅(qū)動科研的效應(yīng)愈加迅猛,推動新的科技革命“呼嘯而至”,其中科研的生產(chǎn)力已實(shí)現(xiàn)進(jìn)化,生物學(xué)、醫(yī)學(xué)等學(xué)科領(lǐng)域,有了觸及更多秘密或隱秘的可能,而生物醫(yī)藥、硬件、工業(yè)制造等領(lǐng)域的產(chǎn)業(yè)模式也將改變。
以AI為內(nèi)核,高校、企業(yè)在新科技革命中的角色關(guān)聯(lián)更加交雜,推動人才與算力的循環(huán)躍升,不僅正對高校科研的未來進(jìn)行重塑,也將帶來全新的科技比拼與進(jìn)化歷程。
AI重塑高校科研的未來
AlphaFold的問世與進(jìn)化,為理解AI重塑高校科研的未來,提供了鮮明注腳。
2020年,DeepMind(谷歌旗下的人工智能企業(yè))推出的人工智能模型AlphaFold在一場名為“蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估”的競賽中占據(jù)優(yōu)勢地位,揭開了堪稱蛋白質(zhì)3D結(jié)構(gòu)預(yù)測的歷史新篇章。
今年5月初,進(jìn)化迭代后的AlphaFold 3,以前所未有的精準(zhǔn)度成功預(yù)測了所有生命分子(蛋白質(zhì)、DNA、RNA、配體等)的結(jié)構(gòu)和相互作用。
一個(gè)直觀通俗的對比是,在AlphaFold出現(xiàn)前,蛋白質(zhì)結(jié)構(gòu)只能通過X射線晶體學(xué)或冷凍電鏡等實(shí)驗(yàn)技術(shù)來破譯,耗費(fèi)數(shù)月或數(shù)年、數(shù)十萬美元,才可能解析一個(gè)蛋白質(zhì)的精確三維結(jié)構(gòu)。而AlphaFold2成功預(yù)測數(shù)億個(gè)蛋白質(zhì)結(jié)構(gòu),只用了不到三年。
AlphaFold改變了生物學(xué),在國內(nèi)外高校科研中皆有表現(xiàn)。
根據(jù)公開報(bào)道,首爾國立大學(xué)計(jì)算生物學(xué)家Martin Steinegger領(lǐng)導(dǎo)的團(tuán)隊(duì),使用了一種名為Foldseek的工具,在AlphaFold數(shù)據(jù)庫中尋找導(dǎo)致新冠肺炎的病毒SARS-CoV-2的RNA復(fù)制酶的親屬。
這項(xiàng)研究發(fā)現(xiàn)了之前未被確認(rèn)的、病毒可能的古代近親:包括黏液霉菌等真核生物中的蛋白質(zhì)在其3D結(jié)構(gòu)上類似于被稱為逆轉(zhuǎn)錄酶的酶。
公開信息顯示,在國內(nèi),AlphaFold的問世,也為上海交通大學(xué)自然科學(xué)研究院&物理與天文學(xué)院&藥學(xué)院特聘教授洪亮開啟 AI 蛋白質(zhì)設(shè)計(jì)研究提供了契機(jī)。
2021 年,洪亮及其團(tuán)隊(duì)開發(fā)了一套基于預(yù)訓(xùn)練的蛋白質(zhì)設(shè)計(jì)的通用人工智能AccelProtein? ——與 AlphaFold 預(yù)測結(jié)構(gòu)不同,AccelProtein? 開創(chuàng)性地實(shí)現(xiàn)了從序列直達(dá)功能的精準(zhǔn)蛋白質(zhì)設(shè)計(jì)。
該大模型的優(yōu)勢表現(xiàn)之一是,利用小樣本乃至零樣本學(xué)習(xí)方法,提高大模型的工程泛化能力,幫助它在僅有少數(shù)濕實(shí)驗(yàn)數(shù)據(jù)的情況下實(shí)現(xiàn)蛋白質(zhì)性能優(yōu)化,極大地提高了蛋白質(zhì)設(shè)計(jì)的效率——以往需要 2~5 年才能完成的項(xiàng)目,在 AccelProtein? 的支持下只需要 2~6 個(gè)月即可完成。
窺斑見豹。在深度學(xué)習(xí)與人工智能等結(jié)合進(jìn)化下,AI對科研路徑、科研效率帶來實(shí)質(zhì)助力,也帶來更多創(chuàng)新可能,進(jìn)而也對科研人員的生產(chǎn)力帶來變革影響。
其背后邏輯包括但不限于,AI技術(shù)帶來數(shù)據(jù)處理與分析的自動化,實(shí)驗(yàn)設(shè)計(jì)與執(zhí)行、科研輔助工具、科研合作的智能化等,在人類已積累沉淀的龐大知識圖譜體系基礎(chǔ)上,篩選、整合、分析,一方面給科研人員帶來一定程度上的“解放”,讓其相對有限的智力、體力用于更核心的研究上,另一方面提供更多創(chuàng)新的研究思路。
以一個(gè)科研的完整鏈路來說,從提出問題,到搜集與處理繁復(fù)冗雜的數(shù)據(jù)、多方向科學(xué)計(jì)算模擬、理論論證及輔助證明,再到論文成稿,AI技術(shù)都可以深度參與其中,提供必要幫助。
參考公開信息顯示,2023年12月 DeepMind 推出全新多模態(tài) AI 模型 ——Gemini,其可根據(jù)提示,在一個(gè)午休的時(shí)間內(nèi)閱讀 20 萬篇論文,并從中篩選出 250 篇特定有關(guān)論文、提取數(shù)據(jù),進(jìn)而繪制表格或圖片提供給使用者,極大提高科研人工作效率。
華為昇騰計(jì)算系統(tǒng)實(shí)驗(yàn)室主任王均松認(rèn)為,AI技術(shù)的出現(xiàn),相當(dāng)于科研人員多了一個(gè)同行,比如AI大模型,科研人員可以跟AI對話,包括具體科研的下一步應(yīng)該怎么走,AI可以用它自己思維的方法生成給到一些思考,能夠快速促進(jìn)科研創(chuàng)新的過程,“我覺得這個(gè)可能是未來一個(gè)更重要的方式”。
對學(xué)科與科研廣度、人才密度都相對突出的高校來說,前述AI的價(jià)值空間、影響場景與路徑等,表現(xiàn)也更突出。
2024年6月,上海交通大學(xué)與華為合作的“上海交通大學(xué)——鯤鵬昇騰科教創(chuàng)新卓越中心”正式揭牌成立,雙方目標(biāo)之一是其能夠成為華為和上海交大共同推動中國智能化發(fā)展的生態(tài)平臺,讓鯤鵬昇騰的技術(shù)能夠更多的賦能上海交大的各類交叉學(xué)科創(chuàng)新,這些創(chuàng)新又能成為牽引各行各業(yè)智能化發(fā)展的核心動力。
公開信息顯示,上海交大現(xiàn)已成功建成國內(nèi)高校第一個(gè)也是目前規(guī)模最大的鯤鵬高性能系統(tǒng),持續(xù)為相關(guān)學(xué)科提供科研算力服務(wù)。
可發(fā)現(xiàn),在當(dāng)前AI技術(shù)與科研結(jié)合中,高校的角色更深層次化:既是直接的受益者,科研工作流程、科研效率由此而變,具備了科研成果的誕生快捷化、豐富化及更快迭代的可期性,AI正重塑高校科研的未來圖景;也是新的AI技術(shù)策源地和創(chuàng)新高地,科研場景、人才的密度,以及多學(xué)科跨界融合的空間及必要性,為此提供了更多可能。
而這也是未來AI與高校科研互為循環(huán)要素的走向之一。
科研進(jìn)入“第五范式”時(shí)代
從AI for Science(簡稱“AI4S”)字面意思來看,即“人工智能驅(qū)動的科學(xué)研究”,在科研中,AI將繼續(xù)作為“驅(qū)動力”,這一趨向會更明顯,推動科學(xué)研究進(jìn)入“新范式”時(shí)代。
美國科學(xué)哲學(xué)家托馬斯·庫恩在其名著《科學(xué)革命的結(jié)構(gòu)》中曾首次提出術(shù)語“scientific paradigm”(科學(xué)范式),主要指的是各個(gè)學(xué)科在一定歷史時(shí)期形成的對某種專業(yè)知識的見解與共識。
關(guān)于科學(xué)研究的四個(gè)范式有一個(gè)較寬泛的概括,幾千年前是經(jīng)驗(yàn)范式,靠的是觀察和歸納的實(shí)驗(yàn)研究;幾百年前是理論范式,基于科學(xué)假設(shè)和邏輯演繹的理論研究;幾十年前是計(jì)算范式,十幾年前是數(shù)據(jù)范式,特征是數(shù)據(jù)密集型科學(xué)研究。
而今,科學(xué)研究進(jìn)入“第五范式”,基本成為共識。
中國工程院院士李國杰曾撰文稱,現(xiàn)在還很難對第五科研范式做出嚴(yán)格定義,但已逐步顯露的特征有六點(diǎn),包括但不限于人工智能全面融入科學(xué)、技術(shù)和工程研究,知識自動化,科研全過程智能化,以及人機(jī)融合、以復(fù)雜系統(tǒng)為主要研究對象,跨學(xué)科合作,更加依靠以大模型為特征的大平臺,科學(xué)研究與工程實(shí)現(xiàn)密切結(jié)合等。
上海交通大學(xué)網(wǎng)絡(luò)信息中心副主任林新華表示,AI4S的部分現(xiàn)狀趨勢體現(xiàn)在AI與計(jì)算流程結(jié)合更緊密。起初,AI作為一個(gè)單獨(dú)的程序,單獨(dú)訓(xùn)練、單獨(dú)推理,與科學(xué)計(jì)算結(jié)果對比;現(xiàn)在,AI逐漸融合進(jìn)一個(gè)學(xué)科的計(jì)算流程之中,作為計(jì)算方法的一部分;未來,隨著AI的可解釋性和可觀測性加強(qiáng),人們又從中發(fā)現(xiàn)新的科學(xué)規(guī)律,探索出新的科研范式。“AI4S囊括了迄今為止所有的AI網(wǎng)絡(luò)、訓(xùn)練方法,并且還有新方法在不斷被發(fā)現(xiàn)。”
AI技術(shù)的政策及輿論風(fēng)向也走向積極,AI技術(shù)與科研的結(jié)合,進(jìn)入一種相對更樂觀的科研語境中,高校迎來更多新的嘗試機(jī)會。
參考公開信息,研究人員在《英國醫(yī)學(xué)雜志》(The BMJ)上發(fā)表的相關(guān)報(bào)告顯示,截至2023年10月,全球百強(qiáng)科學(xué)期刊中有87家就人工智能生成內(nèi)容的使用向作者發(fā)布了指引。
2024年1月,全球知名學(xué)術(shù)出版機(jī)構(gòu)Elsevier與學(xué)界合作開發(fā),隆重推出全新的AI工具——Scopus AI,將世界上最大的科學(xué)文獻(xiàn)數(shù)據(jù)庫與可靠的AI相結(jié)合。
這一工具也于2024年三四月,在廈門大學(xué)、中國科學(xué)技術(shù)大學(xué)、南方科技大學(xué)等國內(nèi)各大高校中陸續(xù)開放使用。
不過,AI4S對高校科研帶來的機(jī)遇空前,挑戰(zhàn)也甚巨。
比如AlphaFold3 預(yù)測的蛋白質(zhì)等結(jié)構(gòu)也并非完美,其中多蛋白如何形成復(fù)合體,如何與 DNA、RNA 或者小分子交互等,依然還待進(jìn)一步探索。
中國科學(xué)院院士鄂維南曾在一次講座中表示,隨著AI for Science的發(fā)展,科研模式也從作坊式改變到了安卓式,其將依賴于四大基礎(chǔ)設(shè)施:基于基本原理的模型和算法,高效率高精度的實(shí)驗(yàn)表征方法,數(shù)據(jù)庫和知識庫,高效便捷的算力資源。
林新華也提到,AI雖幫助突破科研瓶頸,但對科研團(tuán)隊(duì)的“硬+軟”實(shí)力提出了更高要求。硬實(shí)力包括算力、資金、人員規(guī)模,軟實(shí)力包括交叉學(xué)科合作、數(shù)據(jù)積累等。
校企合作成為突破口之一。
以華為為例。2022年,華為發(fā)布科研創(chuàng)新使能計(jì)劃,該計(jì)劃通過技術(shù)扶持和賦能、資源支撐、行業(yè)影響力構(gòu)建三大維度給予支持,旨在使能國內(nèi)高校和科研院所依托華為全棧自主軟硬件平臺開展科學(xué)技術(shù)研究和軟件研發(fā)與技術(shù)攻關(guān)工作。在技術(shù)扶持和賦能方面,將獲得技術(shù)專家的專項(xiàng)支持,且優(yōu)先獲得與華為的技術(shù)聯(lián)創(chuàng)機(jī)會;受邀參加由華為主辦開發(fā)者活動,與行業(yè)技術(shù)大咖、專家學(xué)者、華為計(jì)算高層面對面共論人工智能生態(tài); 在資源支撐方面,該計(jì)劃將從創(chuàng)新基金、學(xué)習(xí)資源、權(quán)益服務(wù)上提供服務(wù),讓科技工作者們能夠把更多時(shí)間和精力投入在科研創(chuàng)新上。 在行業(yè)影響力構(gòu)建方面,將優(yōu)先受邀作為演講嘉賓參加由華為主辦的重要產(chǎn)業(yè)活動,為科研工作者提供更多溝通交流機(jī)會。
華為未來將繼續(xù)聚焦科研院所、國內(nèi)高校等科技工作者的智慧,不斷釋放AI力量,加速科研創(chuàng)新,推動生態(tài)繁榮。
新科技革命蓄勢將至
AI4S的發(fā)展,關(guān)乎到科研整個(gè)鏈條的重塑,以及相關(guān)產(chǎn)業(yè)鏈的研發(fā)、實(shí)踐落地,實(shí)質(zhì)可以理解為一場科技革命。
早在2017年7月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,對人工智能發(fā)展、科技創(chuàng)新等,做了頂層擘畫。圍繞人工智能及其關(guān)聯(lián)的更宏闊的技術(shù)、產(chǎn)業(yè)發(fā)展與競爭,也早已開始。
有研究報(bào)告認(rèn)為,當(dāng)前中國人工智能人才、投資、技術(shù)、AI論文、算力等核心指標(biāo),第一次與美國一起位列第一梯隊(duì),其中美國大模型(包含同一企業(yè)、同一模型的不同參數(shù)版本)數(shù)量為世界第一(占比44%),中國位列其后(占比36%)。
不過兩國間的差距依然存在,但有專家和企業(yè)家認(rèn)為在呈現(xiàn)逐漸縮小的跡象。
馬斯克在2023年5月的一次訪談中提到,美國具有最先進(jìn)的人工智能,中國緊隨其后。當(dāng)然,中國有資源去規(guī)模化和優(yōu)化人工智能。人工智能最大的單一進(jìn)步仍然來自美國和歐洲。
他認(rèn)為,中美之間的人工智能發(fā)展的確有差距,這個(gè)差距看起來在12個(gè)月的數(shù)量級上。而關(guān)于差距是在縮小還是擴(kuò)大,他表示這很難判斷,“我懷疑它會在一定程度上縮小”。
高校、企業(yè)、科研機(jī)構(gòu)成為其中比拼的關(guān)鍵要素,人才、科研自主或原生創(chuàng)新的能力,又是其中核心。
林新華透露,由上海交通大學(xué)“交我算”團(tuán)隊(duì)與生物信息學(xué)領(lǐng)域師生合作開發(fā)的ParaFold,作為致力于提高蛋白質(zhì)結(jié)構(gòu)預(yù)測效率的開源工具,對AlphaFold的CPU+GPU計(jì)算進(jìn)行了高性能計(jì)算方面的深入優(yōu)化。其更快、更省錢、更省GPU機(jī)時(shí),被牛津大學(xué)、康奈爾大學(xué)等高校使用。
這部分證明國內(nèi)智能化科研具備了一定的走出國門的自主創(chuàng)新能力。
而從CUDA(英偉達(dá)旗下的并行計(jì)算平臺和編程模型)遷移到CANN(華為針對AI場景推出的異構(gòu)計(jì)算架構(gòu)),從國外平臺多國內(nèi)自主適配平臺的演變,這一方向已驗(yàn)證可行,也意味著我國發(fā)展自主平臺的必要性。
有觀點(diǎn)認(rèn)為,CANN的成功不僅取決于其自身的技術(shù)實(shí)力,生態(tài)建設(shè)亦是關(guān)鍵。為推動CANN發(fā)展,華為等企業(yè)已與多個(gè)科研院校合作,共同改進(jìn)技術(shù),包括與高校、產(chǎn)業(yè)界等構(gòu)建更先進(jìn)的人才體系、數(shù)智生態(tài)。
前述華為與高校共建的鯤鵬昇騰科教創(chuàng)新卓越中心/孵化中心,是生態(tài)建設(shè)中的核心一環(huán),其共同基于鯤鵬昇騰計(jì)算平臺進(jìn)行科研創(chuàng)新和卓越人才培養(yǎng),孵化引領(lǐng)世界的研究創(chuàng)新成果。除上海交通大學(xué)外,華為還與清華大學(xué)、北京大學(xué)、浙江大學(xué)、中國科學(xué)技術(shù)大學(xué)達(dá)成合作。
在2023年9月,華為還宣布將攜手教育部和72所試點(diǎn)高校,共建數(shù)智人才新生態(tài)。
華為計(jì)算產(chǎn)品線高級戰(zhàn)略規(guī)劃占杰認(rèn)為,高校有人才,企業(yè)有算力,兩者結(jié)合能夠走向一個(gè)更加完善的生態(tài)體系。
這一生態(tài)的價(jià)值之一,將是算力進(jìn)階及其格局變化趨勢更顯性、更實(shí)體化。
華為也有了更新的動作。
在近期華為全聯(lián)接大會2024期間,華為全新發(fā)布CANN 8.0,新增200多個(gè)深度優(yōu)化的基礎(chǔ)算子、80多個(gè)融合算子、100多個(gè)通信、矩陣運(yùn)算等API,典型融合算子開發(fā)周期從2個(gè)月縮短至1.5人周,加速原生創(chuàng)新。
華為常務(wù)董事、ICT基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會主任汪濤在大會上透露,未來三年,華為每年將投入10億元來加速鯤鵬昇騰原生應(yīng)用生態(tài)發(fā)展,目標(biāo)發(fā)展超過1500原生應(yīng)用伙伴,基本實(shí)現(xiàn)全行業(yè)全場景的應(yīng)用原生。
用占杰的話來說,目前AI能力遇到了一些階段性的局限,但正在被突破,未來如果AI能夠自己反思,或具備了多輪思考能力,那么整個(gè)應(yīng)用創(chuàng)新的風(fēng)口才剛剛開始。
這也將是華為正完善的數(shù)智生態(tài)體系可預(yù)期的部分重要價(jià)值所在。