陳沛/文 今年二月OpenAI突然放出Sora生成視頻的精美效果時,應該很難想到在接下來短短幾個月時間,AI視頻的各個新老對手紛紛發(fā)力,在AI生成視頻的賽道上競相追逐。
老對手紛紛跟進
長期處在AI發(fā)展最前沿的谷歌DeepMind自然不甘落后,在五月谷歌I/O大會上推出Veo模型,宣稱能生成1分鐘1080P高質量視頻,并在官網展示了多個從文本提示詞生成的視覺效果連貫的精美視頻。但目前Veo模型還處于私有預覽版,沒有對公眾用戶開放,用戶需通過谷歌實驗室的VideoFX平臺申請,獲得訪問權限后才有機會使用。
另一家深耕視頻領域的AI公司Runway也在六月發(fā)布新版視頻模型Gen-3 Alpha,將生成視頻時長從前一版的4秒左右增加至10秒,已向付費用戶開放使用。Runway同時還發(fā)布了AI生成視頻的提示詞指南,包括運鏡方式、動作方式、文字效果、藝術風格等多方面的說明,幫助用戶更好地使用AI視頻服務。
新對手也不甘示弱
近期陸續(xù)還有多家初創(chuàng)公司以“Sora挑戰(zhàn)者”的姿態(tài)登場。
Luma在六月推出公開可用的視頻生成服務Dream Machine,可生成5秒的視頻,生成等待時間約在2至3分鐘左右。雖然生成時長和視頻質量并不像宣傳中的效果,但其公開可用性仍在業(yè)內引發(fā)很多關注。本周,Luma繼續(xù)在生成視頻中新增了loop功能,通過讓背景動態(tài)效果循環(huán)起來的方式,將生成視頻長度延長至十幾秒,同時保證了視頻效果的一致性。
Haiper也在七月突然出現(xiàn)在廣大公眾視野中,支持用戶公開訪問,能生成并延長至8秒高清視頻。Haiper的生成功能也頗具特色,為首次使用的用戶提供了結構化提示詞,降低首次體驗的不確定性。同時,Haiper還為生成視頻提供了多社交平臺共享接口,這應該與創(chuàng)始人之前擔任倫敦Tiktok機器學習負責人的背景有關。
Odyssey則高調宣稱將能夠生成好萊塢級別的視覺效果,直言現(xiàn)在這些基于互聯(lián)網公開低質量視頻訓練的AI視頻模型根本達不到專業(yè)級視頻的水平。雖然Odyssey還沒有未正式提供視頻生成服務,但近期已經獲得了900萬美元種子輪融資,投資者中不乏谷歌創(chuàng)投(Google Ventures)、DCVC、Air Street Capital等AI領域知名投資機構。
OpenAI努力維持Sora熱度
面對這些新老對手的你追我趕,OpenAI身處在狼煙四起的AI視頻賽道中并非毫無反應。除了此前發(fā)布基于Sora制作的首部品牌商業(yè)廣告之外,OpenAI近期還頻頻放出由Tammy Studio、Studio Tim Fu等AI藝術工作室使用Sora制作的樣片。
不過,這些樣片對于OpenAI用來維持Sora熱度的實際效果有限。因為用戶發(fā)現(xiàn)這些深度使用AI的工作室做出的視頻雖然設計精美、天馬行空、配樂考究,但依然能看出物體細節(jié)和動作協(xié)調性方面的問題。而且這些樣片的驚艷感已經下降,廣大用戶呼聲最高的還是何時能夠公開訪問Sora。
目前,OpenAI并沒有推出Sora服務的準確時間表,而這看上去也情有可原。一方面,在正式推出Sora服務前,AI直接生成1分鐘長視頻的等待時長和推理成本必須大幅優(yōu)化,以適應用戶反復調整提示詞、迭代生成視頻的需求;另一方面,AI生成視頻在傳播錯誤信息、偽造內容方面的濫用風險要比AI生成文本高的多,Sora必須全面開發(fā)阻止不安全內容生成的內置防護措施和鑒別機制,才能在推出服務時盡可能消除AI生成視頻的風險。