競爭白熱化的大模型領(lǐng)域爭議多。
5月16日上午,有消息稱,華為昇騰在近期一場發(fā)布會上展示大模型文生圖能力時(shí),演示過程中出現(xiàn)Time.sleep(6)代碼。在業(yè)內(nèi)人士看來,這一代碼意味著“人為控制從輸入到輸出,過程需要6秒鐘”,有人懷疑其圖文結(jié)果并非大模型生成,而是人為操控,認(rèn)為該發(fā)布會演示“翻車”了。
面對爭議,昇騰社區(qū)回應(yīng)稱,5月10日,在鯤鵬昇騰開發(fā)者大會的一場技術(shù)討論上,我們演示了mxRAG SDK功能。本次演示面向開發(fā)者,展示如何通過十幾行代碼即可完成RAG應(yīng)用開發(fā)。現(xiàn)場圖片為實(shí)時(shí)生成,調(diào)用的是開源大模型。代碼中有Time.sleep(6)等表述,是命令等待讀取外部開源大模型實(shí)時(shí)生成的圖片,并非調(diào)取預(yù)置圖片。
昇騰回應(yīng)大模型演示“翻車”
5月16日,針對網(wǎng)傳發(fā)布會演示造假一事,昇騰社區(qū)正式向券商中國記者發(fā)來回應(yīng)。
昇騰表示,5月10日,在鯤鵬昇騰開發(fā)者大會的一場技術(shù)討論上,演示了mxRAG SDK功能。本次演示面向開發(fā)者,展示如何通過十幾行代碼即可完成RAG應(yīng)用開發(fā)。現(xiàn)場圖片為實(shí)時(shí)生成,調(diào)用的是開源大模型。代碼中有Time.sleep(6)等表述,是命令等待讀取外部開源大模型實(shí)時(shí)生成的圖片,并非調(diào)取預(yù)置圖片。“本次展示的均為真實(shí)代碼,也將在昇騰社區(qū)上開放,歡迎開發(fā)者使用并提出寶貴建議。”
昇騰社區(qū)官網(wǎng)信息顯示:5月10日,以“一起昇騰,逐夢未來”為主題的昇騰AI開發(fā)者峰會在北京舉行。會上,華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊發(fā)表《一起昇騰,逐夢未來》主題演講。
昇騰是華為旗下的人工智能計(jì)算芯片。
據(jù)昇騰社區(qū)官方介紹,昇騰計(jì)算產(chǎn)業(yè)是基于昇騰系列(HUAWEI Ascend)處理器和基礎(chǔ)軟件構(gòu)建的全棧 AI計(jì)算基礎(chǔ)設(shè)施、行業(yè)應(yīng)用及服務(wù),包括昇騰系列處理器、系列硬件、CANN(Compute Architecture for Neural Networks,異構(gòu)計(jì)算架構(gòu))、AI計(jì)算框架、應(yīng)用使能、開發(fā)工具鏈、管理運(yùn)維工具、行業(yè)應(yīng)用及服務(wù)等全產(chǎn)業(yè)鏈。
大模型百花齊放
在激烈行業(yè)競爭之下,國內(nèi)外廠商不斷推出新的大模型以及對原有大模型進(jìn)行迭代。
例如,5月15日,字節(jié)跳動(dòng)正式發(fā)布“豆包大模型”,這也是國內(nèi)又一家互聯(lián)網(wǎng)巨頭發(fā)布的自研大語言模型。性能方面,據(jù)字節(jié)跳動(dòng)有關(guān)負(fù)責(zé)人介紹,豆包大模型目前日均處理1200億Tokens(表示和傳遞信息的標(biāo)識符)文本,生成3000萬張圖片。
5月9日,阿里云正式發(fā)布通義千問2.5。相比上一版本,2.5版模型的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。據(jù)介紹,在中文語境下,通義千問2.5在文本理解、文本生成、知識問答、生活建議、閑聊、對話、安全風(fēng)險(xiǎn)等多項(xiàng)能力趕超GPT-4。
在國外廠商方面,北京時(shí)間5月15日凌晨,谷歌在2024年I/O開發(fā)者大會上一次性推出十幾款產(chǎn)品更新,重磅級的發(fā)布包括輕量化的模型Gemini 1.5 Flash、AI通用智能體Project Astra、強(qiáng)大的AI搜索、視頻生成模型Veo、第六代TPU Trillium等,Gemini 1.5 Pro的上下文窗口也從100萬tokens升級到200萬。
5月14日,美國人工智能公司OpenAI最新發(fā)布了GPT-4o多模態(tài)大模型,相較于GPT-4 Trubo速度更快、價(jià)格也更便宜,最突出特點(diǎn)是在與人的交互方面更為自然。
OpenAI稱,GPT-4o可以檢測人的情緒,并以類似人類或機(jī)器人的語調(diào)與用戶交談。同時(shí),它可以在最快232毫秒的時(shí)間內(nèi)響應(yīng)音頻輸入,平均響應(yīng)時(shí)間為320毫秒,幾乎接近人類在交談中的響應(yīng)時(shí)間。
華泰證券在發(fā)布的研報(bào)中分析,在AI大模型的商業(yè)模式和競爭格局方面,可能形成贏者通吃或國內(nèi)外寡頭競爭的局面,而行業(yè)大模型則有望百花齊放。目前“基礎(chǔ)大模型”到“行業(yè)大模型”再到“終端應(yīng)用”的大模型路線非常清晰。訓(xùn)練基礎(chǔ)大模型的高成本和高技術(shù)壁壘,決定了科技巨頭或成為主要玩家。
來源:證券時(shí)報(bào)