新V觀海外：全球AI視頻賽道已現(xiàn)百舸爭流之勢

陳沛2024-07-26 10:57

陳沛/文 今年二月OpenAI突然放出Sora生成視頻的精美效果時，應該很難想到在接下來短短幾個月時間，AI視頻的各個新老對手紛紛發(fā)力，在AI生成視頻的賽道上競相追逐。

老對手紛紛跟進

長期處在AI發(fā)展最前沿的谷歌DeepMind自然不甘落后，在五月谷歌I/O大會上推出Veo模型，宣稱能生成1分鐘1080P高質量視頻，并在官網展示了多個從文本提示詞生成的視覺效果連貫的精美視頻。但目前Veo模型還處于私有預覽版，沒有對公眾用戶開放，用戶需通過谷歌實驗室的VideoFX平臺申請，獲得訪問權限后才有機會使用。

另一家深耕視頻領域的AI公司Runway也在六月發(fā)布新版視頻模型Gen-3 Alpha，將生成視頻時長從前一版的4秒左右增加至10秒，已向付費用戶開放使用。Runway同時還發(fā)布了AI生成視頻的提示詞指南，包括運鏡方式、動作方式、文字效果、藝術風格等多方面的說明，幫助用戶更好地使用AI視頻服務。

新對手也不甘示弱

近期陸續(xù)還有多家初創(chuàng)公司以“Sora挑戰(zhàn)者”的姿態(tài)登場。

Luma在六月推出公開可用的視頻生成服務Dream Machine，可生成5秒的視頻，生成等待時間約在2至3分鐘左右。雖然生成時長和視頻質量并不像宣傳中的效果，但其公開可用性仍在業(yè)內引發(fā)很多關注。本周，Luma繼續(xù)在生成視頻中新增了loop功能，通過讓背景動態(tài)效果循環(huán)起來的方式，將生成視頻長度延長至十幾秒，同時保證了視頻效果的一致性。

Haiper也在七月突然出現(xiàn)在廣大公眾視野中，支持用戶公開訪問，能生成并延長至8秒高清視頻。Haiper的生成功能也頗具特色，為首次使用的用戶提供了結構化提示詞，降低首次體驗的不確定性。同時，Haiper還為生成視頻提供了多社交平臺共享接口，這應該與創(chuàng)始人之前擔任倫敦Tiktok機器學習負責人的背景有關。

Odyssey則高調宣稱將能夠生成好萊塢級別的視覺效果，直言現(xiàn)在這些基于互聯(lián)網公開低質量視頻訓練的AI視頻模型根本達不到專業(yè)級視頻的水平。雖然Odyssey還沒有未正式提供視頻生成服務，但近期已經獲得了900萬美元種子輪融資，投資者中不乏谷歌創(chuàng)投（Google Ventures）、DCVC、Air Street Capital等AI領域知名投資機構。

OpenAI努力維持Sora熱度

面對這些新老對手的你追我趕，OpenAI身處在狼煙四起的AI視頻賽道中并非毫無反應。除了此前發(fā)布基于Sora制作的首部品牌商業(yè)廣告之外，OpenAI近期還頻頻放出由Tammy Studio、Studio Tim Fu等AI藝術工作室使用Sora制作的樣片。

不過，這些樣片對于OpenAI用來維持Sora熱度的實際效果有限。因為用戶發(fā)現(xiàn)這些深度使用AI的工作室做出的視頻雖然設計精美、天馬行空、配樂考究，但依然能看出物體細節(jié)和動作協(xié)調性方面的問題。而且這些樣片的驚艷感已經下降，廣大用戶呼聲最高的還是何時能夠公開訪問Sora。

目前，OpenAI并沒有推出Sora服務的準確時間表，而這看上去也情有可原。一方面，在正式推出Sora服務前，AI直接生成1分鐘長視頻的等待時長和推理成本必須大幅優(yōu)化，以適應用戶反復調整提示詞、迭代生成視頻的需求；另一方面，AI生成視頻在傳播錯誤信息、偽造內容方面的濫用風險要比AI生成文本高的多，Sora必須全面開發(fā)阻止不安全內容生成的內置防護措施和鑒別機制，才能在推出服務時盡可能消除AI生成視頻的風險。