經(jīng)濟(jì)觀察網(wǎng) 記者 任曉寧 9月24日下午,字節(jié)跳動(dòng)旗下火山引擎發(fā)布了兩款A(yù)I視頻模型,這意味著字節(jié)跳動(dòng)正式加入了AI視頻大戰(zhàn)。
AI視頻是當(dāng)下互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)公司集體發(fā)力的領(lǐng)域。8月底,AI創(chuàng)業(yè)公司MiniMax推出視頻模型。9月19日,阿里巴巴也發(fā)布了通義萬(wàn)相視頻模型。據(jù)經(jīng)濟(jì)觀察網(wǎng)不完全統(tǒng)計(jì),僅在國(guó)內(nèi),過(guò)去4個(gè)月時(shí)間便有超過(guò)10家公司推出了AI視頻產(chǎn)品。
相較其他公司,字節(jié)跳動(dòng)的視頻模型發(fā)布時(shí)間較晚。火山引擎總裁譚待接受經(jīng)濟(jì)觀察網(wǎng)在內(nèi)媒體采訪時(shí)說(shuō),字節(jié)跳動(dòng)不一定非要搶第一,他們對(duì)模型的認(rèn)知是,這是一個(gè)能影響未來(lái)10年、20年的長(zhǎng)遠(yuǎn)技術(shù),所以希望推出的模型質(zhì)量是經(jīng)過(guò)考驗(yàn)的。
字節(jié)為何入局
時(shí)至9月,AI視頻模型已經(jīng)不再罕見(jiàn),甚至成了AI創(chuàng)業(yè)公司必選的賽道。為什么這些公司如此重視AI視頻?譚待說(shuō),視頻的消費(fèi)在當(dāng)下已經(jīng)成為主流,無(wú)論是娛樂(lè)、電商還是本地生活,各行各業(yè)都離不開(kāi)視頻,這意味著視頻是用戶(hù)的核心需求。
此前MiniMax創(chuàng)始人閆俊杰接受經(jīng)濟(jì)觀察網(wǎng)采訪時(shí)也有類(lèi)似觀點(diǎn)。他說(shuō),為了讓產(chǎn)品能有非常高的用戶(hù)覆蓋度和非常深的用戶(hù)使用度,唯一的辦法就是輸出動(dòng)態(tài)的視頻內(nèi)容,而不是僅輸出基于文字的文本內(nèi)容。
相比其他公司,擁有抖音和剪映的字節(jié)跳動(dòng)在視頻領(lǐng)域具有優(yōu)勢(shì),其主要優(yōu)勢(shì)在于視頻內(nèi)容積累。一位AI視頻創(chuàng)業(yè)公司創(chuàng)始人告訴經(jīng)濟(jì)觀察網(wǎng),他們訓(xùn)練視頻的數(shù)據(jù)主要是海外開(kāi)源數(shù)據(jù)、AI合成數(shù)據(jù),以及向版權(quán)方購(gòu)買(mǎi)的數(shù)據(jù)。
譚待提到,抖音和剪映在視頻領(lǐng)域的業(yè)務(wù)理解和技術(shù)積累,對(duì)于豆包視頻模型是一個(gè)很大的加分項(xiàng)。同時(shí),由于豆包是全體系的模型,目前包括文本、音樂(lè)、視頻、圖片等多個(gè)模態(tài),因此能更好地理解用戶(hù)的指令。
他認(rèn)為,豆包視頻模型與其他視頻模型的不同之處在于,它可以生成多個(gè)主體運(yùn)動(dòng)的復(fù)雜交互畫(huà)面,也可以保證多鏡頭切換的內(nèi)容一致性,這兩項(xiàng)能力能讓AI視頻看起來(lái)不那么像PPT版視頻。
AI視頻仍不盡如人意
雖然入局者眾多,但從AI視頻的效果和AI視頻制作簡(jiǎn)易度來(lái)看,這個(gè)行業(yè)目前發(fā)展并不算快。
北京國(guó)際電影節(jié)上有一個(gè)獲獎(jiǎng)的2分鐘AI視頻,主創(chuàng)團(tuán)隊(duì)提到,他們3個(gè)人花了十幾天時(shí)間做這個(gè)視頻。當(dāng)前創(chuàng)作者制作AI視頻,都要經(jīng)過(guò)一個(gè)較為復(fù)雜的流程,先寫(xiě)文字腳本,再把腳本拆分為多個(gè)場(chǎng)景,為每個(gè)場(chǎng)景寫(xiě)像咒語(yǔ)一樣的提示詞,讓每個(gè)場(chǎng)景生成多張圖,一般每張圖需要生成幾十次,才能得到自己想要的結(jié)果。
一位創(chuàng)作者說(shuō):“做AI視頻就像玩抽卡游戲,嘗試幾百次才能試出好結(jié)果。”
主流的AI視頻工具,一次能生成4—10秒左右的視頻片段。生成一段2分鐘的完整故事,需要使用多段視頻拼接。但在當(dāng)前算力條件下,創(chuàng)作者往往需要排隊(duì)超過(guò)10分鐘,才能使用AI視頻工具。除了專(zhuān)業(yè)創(chuàng)作者,沒(méi)有人有耐心制作AI視頻。
AI視頻當(dāng)下并不是一個(gè)大市場(chǎng)。頭豹研究院的數(shù)據(jù)顯示,預(yù)計(jì)到2026年,中國(guó)AI視頻市場(chǎng)規(guī)模將增長(zhǎng)至92.79億元。
上述AI視頻創(chuàng)業(yè)公司創(chuàng)始人說(shuō),目前AI視頻行業(yè)處于極早期,現(xiàn)在仍在新手保護(hù)期的階段,用戶(hù)對(duì)產(chǎn)品性能有很高的容忍度。最終哪家公司能跑到最后,還要看它的產(chǎn)品能力能不能獲得用戶(hù)認(rèn)可。在這個(gè)維度上,互聯(lián)網(wǎng)大廠和AI創(chuàng)業(yè)公司都處于同一起跑線。