經(jīng)濟觀察網(wǎng) 記者 陳奇杰 在多次對美國人工智能研究公司OpenAI的閉源路線表達不滿后,3月18日,特斯拉創(chuàng)始人埃隆·馬斯克兌現(xiàn)了此前的承諾,宣布推出開源大語言模型Grok-1。
據(jù)馬斯克旗下的人工智能初創(chuàng)公司xAI介紹,Grok-1由其從頭開始訓練,是一個混合專家模型,沒有針對任何特定應用(例如對話)進行微調(diào)。Grok-1模型參數(shù)量高達3140億,是迄今為止參數(shù)量最大的開源大模型。
在開源Grok-1的同時,馬斯克仍然不忘在社交媒體上調(diào)侃OpenAI:“告訴我們更多有關OpenAI的‘開放’部分的信息……”OpenAI則在該消息下反擊:“(馬斯克)偷了我的整個笑話。”
作為科技界的領袖之一,馬斯克是一位富有爭議性的人物。在《埃隆·馬斯克傳》里,作者沃爾特·艾薩克森對馬斯克的一部分描述是“冷酷”“沖動”“狂熱”。此前,行行AI董事長、工信部工業(yè)文化發(fā)展中心AI(人工智能)應用工作組執(zhí)行組長李明順走訪了中美百家AI前沿科技企業(yè),并在美國硅谷與同行交流過馬斯克和他廣為人知的夢想——在火星建立一座城市。李明順認為,馬斯克并不是一位單純考慮商業(yè)的企業(yè)家,而是“少見的地球主義企業(yè)家”。
“此次Grok-1的開源在人工智能領域可能會帶來新的風潮,且間接地沖擊了Llama-2(美國互聯(lián)網(wǎng)公司Meta發(fā)布的開源大模型)的地位,這是對OpenAI的一次反擊。馬斯克想在起訴OpenAI案開庭之前,強調(diào)自己的世界觀和價值觀。”李明順說。
在盤古智庫高級研究員李培序看來,馬斯克開源Grok-1大模型是對抗OpenAI的一次“行為藝術”,希望通過提供開源模型,建立一個更加開放、協(xié)作的人工智能生態(tài)系統(tǒng)。
馬斯克的AI雄心
馬斯克與OpenAI之間的糾葛,可以追溯到近十年之前。2015年,馬斯克與山姆·奧特曼等人聯(lián)合創(chuàng)立了OpenAI,但由于發(fā)展方向上的分歧,雙方在2018年分道揚鑣。此后馬斯克多次對OpenAI作出批評。
據(jù)路透社報道,馬斯克于今年2月29日向美國舊金山高等法院起訴OpenAI及其CEO(首席執(zhí)行官)山姆·奧特曼,理由是OpenAI違背了最初的使命——為了全人類的福祉而非利潤來開發(fā)人工智能技術。馬斯克的訴訟指控OpenAI違反合同,稱山姆·奧特曼和聯(lián)合創(chuàng)始人格雷格·布羅克曼最初與他接洽是為了創(chuàng)建一家開源、非盈利公司,但這家企業(yè)現(xiàn)在專注于賺錢。
幾天后,OpenAI在官網(wǎng)發(fā)布文章回應了馬斯克的指控,表示“打算駁回埃隆的所有主張”。
文章稱,2017年底,OpenAI和馬斯克決定下一步的任務是創(chuàng)建一個營利性實體。馬斯克想要獲得多數(shù)股權、初始董事會控制權并擔任CEO,“無法與他就營利性條款達成一致,因為我們認為任何個人對OpenAI擁有絕對控制權都是違背使命的……馬斯克很快就選擇離開OpenAI,稱我們成功的概率為0,并計劃在特斯拉內(nèi)部建立一個AGI(人工通用智能)競爭對手”。
3月11日,OpenAI又對文章做了一次更新,表示正在尋求將訴訟分配給專門的案件管理人員,因為它涉及人工智能技術,而且索賠時間跨度近十年。
從大模型競爭層面看,xAI在2023年11月發(fā)布了其首個AI大模型產(chǎn)品Grok,相較OpenAI的大模型產(chǎn)品ChatGPT而言已晚了許多。李培序認為,馬斯克曾公開特斯拉專利,推動全球電動汽車技術發(fā)展,他也憑借技術優(yōu)勢,成為了專利“開源”的最大贏家。這次Grok的開源,可能有戰(zhàn)略邏輯上的考量,反映了馬斯克在人工智能領域的雄心。
Grok的表現(xiàn)
Grok-1開源5天后,在開源社區(qū)GitHub已獲得4.2萬人的收藏。DeepMind(谷歌旗下人工智能公司)的工程師亞歷克薩·戈迪奇預測,Grok-1的能力應該比LLaMA-2要強,但目前尚不清楚有多少數(shù)據(jù)受到了污染。另外,二者的參數(shù)量也不是一個量級。
但Grok-1的大參數(shù)給使用者帶來了困擾。有用戶在GitHub上評論,運行Grok-1的GPU(圖形處理器)配置是8個英偉達A100芯片。xAI也強調(diào),由于Grok-1的模型規(guī)模較大,參數(shù)量達到了3140億,因此需要有足夠GPU內(nèi)存的機器使用示例代碼測試模型。
李培序告訴記者,參數(shù)量是大模型的重要指標。一般而言,大模型參數(shù)量越大,意味著它越能夠捕捉到豐富的數(shù)據(jù)特征,從而可能在某些應用領域展現(xiàn)出更強的性能。Grok-1模型是當前參數(shù)量最大的開源大模型,并且采用先進的混合專家架構,確實標志著它具有一定競爭力。但是參數(shù)量的大小并不是衡量模型性能的唯一標準,模型的架構、訓練數(shù)據(jù)的多樣性、算法的創(chuàng)新性等因素也同樣重要。
“對于大模型賽道而言,開源Grok所帶來的影響可能相對有限。首先,如此大參數(shù)量的模型需要大算力和大數(shù)據(jù)作為支撐,并不適用于個人或小團隊開發(fā),而大企業(yè)往往在技術上已有較強的儲備,并不依賴于開源模型;其次,當前開源的大模型市場已經(jīng)相當豐富,Grok的開源只是為開發(fā)者們增加了一個備選方案,提供了更多的選擇空間,并沒有技術上的顛覆性創(chuàng)新。”李培序表示。
開源與閉源之爭
開源大模型允許任何人訪問和使用源代碼,而閉源模型則由單一實體控制,通常需要付費使用。與IT(互聯(lián)網(wǎng)技術)產(chǎn)業(yè)中Windows(微軟研發(fā)的閉源操作系統(tǒng))和Linux(一種開源操作系統(tǒng))、iOS(蘋果研發(fā)的閉源操作系統(tǒng))和Android(谷歌旗下的開源操作系統(tǒng),下稱“安卓”)的發(fā)展歷史相似,一直以來,AI領域圍繞大模型開源和閉源間的爭論不斷。支持大模型開源的一方認為,開源有利于技術和監(jiān)管透明,推動人類共同進步,另一方則認為,閉源有助于防范AI技術被濫用。
從陣營來看,開源大模型包括Meta的Llama-2、開源生成式AI公司Stability AI的Stable Diffusion、阿里云的通義千問等,閉源大模型則以OpenAI的ChatGPT、百度的文心一言等為代表。
李明順更傾向于站在開源一方,“我自己曾經(jīng)做過開源軟件,當時在沒有很多錢的情況下,沒花太多的經(jīng)費,就推廣了幾百萬的站長用我們的軟件,其中開源發(fā)揮了重要的作用”。他說:“開源能降低使用者的門檻和成本,相較閉源更有生命力。安卓今天可能沒有蘋果那么掙錢,但是它的設備使用量和影響力遠遠大于蘋果。”
李培序表示,開源模型的優(yōu)勢在于可以吸引全球的開發(fā)者共同參與改進和優(yōu)化,形成一個強大的社區(qū)支持網(wǎng)絡,這有助于快速提升模型的性能和質(zhì)量。同時,開源模型降低了個人、企業(yè)、研究機構進入人工智能領域的門檻,使更多的人能參與到人工智能的研究和應用中。此外,開源模型可以作為教學和研究工具,這對培養(yǎng)新一代的技術人才至關重要。
“然而,開源模型也存在劣勢。由于源代碼是公開的,開源模型可能面臨更高的安全風險。對于企業(yè)而言,開源模型較難形成穩(wěn)定的盈利模式。”李培序說。
對于閉源模型,李培序認為,閉源模型更容易形成商業(yè)模式,企業(yè)可以通過銷售許可、提供專業(yè)服務等途徑獲取收益。另外,閉源模型由單一實體集中管理和維護,模型的穩(wěn)定性和安全性更有保障,并且它能夠提供定制化的服務。但與此同時,閉源模型也缺乏開源模型那樣的社區(qū)支持和協(xié)作環(huán)境,通常只能依靠內(nèi)部團隊進行改進和優(yōu)化,因此創(chuàng)新速度可能會比較慢。
“大模型的開源與閉源之爭,實際上是兩種不同的研發(fā)和管理模式的較量,每種模式都有它獨特的優(yōu)勢和劣勢。在未來,大模型的模式可能會趨向于兩者的融合,即在保持一定開源性的同時,通過合理的商業(yè)模式來平衡創(chuàng)新和盈利之間的關系。”李培序稱。