經(jīng)濟觀察網(wǎng) 記者 任曉寧
6月28日下午,字節(jié)跳動公布了大模型業(yè)務最新進展,這是繼百度、阿里巴巴、騰訊之后,又一家互聯(lián)網(wǎng)大廠正式入場大模型。
不過與騰訊一樣,字節(jié)跳動公布的是大模型B端業(yè)務,名為“火山方舟”,其C端自研大模型仍在保密中。
“火山方舟”由字節(jié)旗下火山引擎搭建,提供了一個大模型服務平臺,供開發(fā)者和企業(yè)使用。其運營模式是,在一個平臺內(nèi)提供多個模型,企業(yè)可同步試用多個大模型,選用更適合自身業(yè)務需要的模型組合。火山引擎總裁譚待說,他在過去半年接觸了很多企業(yè),絕大多數(shù)企業(yè)對大模型仍有困惑,不知道該如何使用,他認為應該選擇性價比最合適的,而不一定是效果最好的。他判斷,企業(yè)使用大模型,未來可能會呈現(xiàn)“1+N”的模式:“1”是通過自研或深度合作,形成1個主力模型,同時由于成本和場景復雜多元等原因,在這個主力模型之外,還會有N個模型同時應用。
據(jù)介紹,“火山方舟”內(nèi)集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型,目前正啟動邀測。
近期受到關注的百川智能、MiniMax等大模型創(chuàng)業(yè)公司高管,都出現(xiàn)在字節(jié)跳動活動現(xiàn)場。百川智能聯(lián)合創(chuàng)始人焦可用10分鐘時間介紹了他所在的公司,以及他們研發(fā)2個月就已經(jīng)上線的70 億參數(shù)量中英文預訓練大模型“baichuan-7B”,他說,中國大模型追趕國際頂尖水平的征途會有驚喜。
英偉達也來到了字節(jié)大模型活動現(xiàn)場。此前有消息稱,今年字節(jié)跳動向英偉達訂購了超過 10 億美元的GPU,字節(jié)跳動對此沒有做出回應。活動現(xiàn)場,英偉達開發(fā)與技術部亞太區(qū)總經(jīng)理李曦鵬提到,英偉達與火山引擎合作實現(xiàn)了數(shù)千卡GPU穩(wěn)定訓練,雙方在一個開源社區(qū)也做了大量合作。下一步,英偉達會針對火山方舟建立更多合作,包括NVIDIA Hopper架構適配與優(yōu)化、機密計算等,還會對一些重點開源模型比如GPT、LLaMA進行合作,保證這些模型在方舟上跑的最快。英偉達也會針對方舟的重點客戶做聯(lián)合支持。
對于火山方舟,譚待的定位是,希望這個平臺能加速大模型的應用落地,加快大模型在各行業(yè)發(fā)揮商業(yè)價值。
京公網(wǎng)安備 11010802028547號