刷屏！大模型"翻車"？最新回應(yīng)來了

胡飛軍2024-05-28 06:47

競爭白熱化的大模型領(lǐng)域爭議多。

5月16日上午，有消息稱，華為昇騰在近期一場發(fā)布會上展示大模型文生圖能力時(shí)，演示過程中出現(xiàn)Time.sleep（6）代碼。在業(yè)內(nèi)人士看來，這一代碼意味著“人為控制從輸入到輸出，過程需要6秒鐘”，有人懷疑其圖文結(jié)果并非大模型生成，而是人為操控，認(rèn)為該發(fā)布會演示“翻車”了。

面對爭議，昇騰社區(qū)回應(yīng)稱，5月10日，在鯤鵬昇騰開發(fā)者大會的一場技術(shù)討論上，我們演示了mxRAG SDK功能。本次演示面向開發(fā)者，展示如何通過十幾行代碼即可完成RAG應(yīng)用開發(fā)。現(xiàn)場圖片為實(shí)時(shí)生成，調(diào)用的是開源大模型。代碼中有Time.sleep(6）等表述，是命令等待讀取外部開源大模型實(shí)時(shí)生成的圖片，并非調(diào)取預(yù)置圖片。

昇騰回應(yīng)大模型演示“翻車”

5月16日，針對網(wǎng)傳發(fā)布會演示造假一事，昇騰社區(qū)正式向券商中國記者發(fā)來回應(yīng)。

昇騰表示，5月10日，在鯤鵬昇騰開發(fā)者大會的一場技術(shù)討論上，演示了mxRAG SDK功能。本次演示面向開發(fā)者，展示如何通過十幾行代碼即可完成RAG應(yīng)用開發(fā)。現(xiàn)場圖片為實(shí)時(shí)生成，調(diào)用的是開源大模型。代碼中有Time.sleep(6）等表述，是命令等待讀取外部開源大模型實(shí)時(shí)生成的圖片，并非調(diào)取預(yù)置圖片。“本次展示的均為真實(shí)代碼，也將在昇騰社區(qū)上開放，歡迎開發(fā)者使用并提出寶貴建議。”

昇騰社區(qū)官網(wǎng)信息顯示：5月10日，以“一起昇騰，逐夢未來”為主題的昇騰AI開發(fā)者峰會在北京舉行。會上，華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊發(fā)表《一起昇騰，逐夢未來》主題演講。

昇騰是華為旗下的人工智能計(jì)算芯片。

據(jù)昇騰社區(qū)官方介紹，昇騰計(jì)算產(chǎn)業(yè)是基于昇騰系列（HUAWEI Ascend）處理器和基礎(chǔ)軟件構(gòu)建的全棧 AI計(jì)算基礎(chǔ)設(shè)施、行業(yè)應(yīng)用及服務(wù)，包括昇騰系列處理器、系列硬件、CANN（Compute Architecture for Neural Networks，異構(gòu)計(jì)算架構(gòu)）、AI計(jì)算框架、應(yīng)用使能、開發(fā)工具鏈、管理運(yùn)維工具、行業(yè)應(yīng)用及服務(wù)等全產(chǎn)業(yè)鏈。

大模型百花齊放

在激烈行業(yè)競爭之下，國內(nèi)外廠商不斷推出新的大模型以及對原有大模型進(jìn)行迭代。

例如，5月15日，字節(jié)跳動(dòng)正式發(fā)布“豆包大模型”，這也是國內(nèi)又一家互聯(lián)網(wǎng)巨頭發(fā)布的自研大語言模型。性能方面，據(jù)字節(jié)跳動(dòng)有關(guān)負(fù)責(zé)人介紹，豆包大模型目前日均處理1200億Tokens（表示和傳遞信息的標(biāo)識符）文本，生成3000萬張圖片。

5月9日，阿里云正式發(fā)布通義千問2.5。相比上一版本，2.5版模型的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。據(jù)介紹，在中文語境下，通義千問2.5在文本理解、文本生成、知識問答、生活建議、閑聊、對話、安全風(fēng)險(xiǎn)等多項(xiàng)能力趕超GPT-4。

在國外廠商方面，北京時(shí)間5月15日凌晨，谷歌在2024年I/O開發(fā)者大會上一次性推出十幾款產(chǎn)品更新，重磅級的發(fā)布包括輕量化的模型Gemini 1.5 Flash、AI通用智能體Project Astra、強(qiáng)大的AI搜索、視頻生成模型Veo、第六代TPU Trillium等，Gemini 1.5 Pro的上下文窗口也從100萬tokens升級到200萬。

5月14日，美國人工智能公司OpenAI最新發(fā)布了GPT-4o多模態(tài)大模型，相較于GPT-4 Trubo速度更快、價(jià)格也更便宜，最突出特點(diǎn)是在與人的交互方面更為自然。

OpenAI稱，GPT-4o可以檢測人的情緒，并以類似人類或機(jī)器人的語調(diào)與用戶交談。同時(shí)，它可以在最快232毫秒的時(shí)間內(nèi)響應(yīng)音頻輸入，平均響應(yīng)時(shí)間為320毫秒，幾乎接近人類在交談中的響應(yīng)時(shí)間。

華泰證券在發(fā)布的研報(bào)中分析，在AI大模型的商業(yè)模式和競爭格局方面，可能形成贏者通吃或國內(nèi)外寡頭競爭的局面，而行業(yè)大模型則有望百花齊放。目前“基礎(chǔ)大模型”到“行業(yè)大模型”再到“終端應(yīng)用”的大模型路線非常清晰。訓(xùn)練基礎(chǔ)大模型的高成本和高技術(shù)壁壘，決定了科技巨頭或成為主要玩家。

來源：證券時(shí)報(bào)

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【胡飛軍】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù)，不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議