今年初,OpenAI 公布的生成式 AI 影片服務 Sora 引發市場震撼,本週另一家新創公司 Luma AI 公布了名為 Dream Machine 的高品質 AI 影片生成服務。
Luma AI 總部位於舊金山,創立於 2021 年。公司創辦人包括柏克萊大學的 AI 研究人員 Alex Yu 和曾在蘋果擔任 Vision Pro 多媒體體驗開發的 Amit Jain。去年 11 月,Luma AI 募得 430 萬美元,今年初在 B 輪融資中募得 4,300 萬美元。
Luma AI 近日發布的 Dream Machine 類似於 OpenAI 的 Sora,能讓用戶輸入自然語言生成逼真的影片。Dream Machine 在 2 分鐘內產出每秒 120 影格的高畫質短影片。其高擴充性及高效 transformer 模型可生成精準、一致化而精緻的場景。
Dream Machine 是 Luma AI 打造統合式「想像力引擎」的第一步,已開放大眾試用。首日上線後因網路塞車引發用戶抱怨,Techradar 等待超過 20 分鐘才看到影片,部分用戶等了數小時。Luma AI 產品與成長部門主管 Barkley Dai 在 Discord 上解釋,正在緊急增加頻寬以應對高需求,強調正常情況下只需 2 到 3 分鐘即可完成生成。
生成動態影片
一般來說生成動物的靜態照都沒什麼問題,再來看看人像照片


嘗試動漫風格的圖片

這是店員實際照片的側臉
有趣的是,居然有幾份神似
好的,那讓我們來實測看看
原始靜態照片


這裡我是使用AI生成的照片再生成影片,大家可以比較看看

不加Prompt的話,看起來AI會天馬行空發揮,後面兩次有加Prompt來限制生成的範圍和動作



最後測試實際照片,這是我之前去義大利,看到做Panino(帕尼尼)的店員,旁邊有Prosciutto Crudo(帕爾瑪火腿)和Salame(義大利香腸),一時興起拍的製作過程,可以看到在照片裡,店員是背向我的,所以完全沒有臉部資訊,蠻好奇AI會如何生成店員的臉


儘管 Luma AI 的 Dream Machine 在使 AI 影片生成更加普及方面取得了一定的進展,但看起來它在這些挑戰生成影像上仍然存在困難。OpenAI 和快手等競爭對手在改進其模型方面投入了大量資金,導致其輸出更加一致和高質量。這使得 Luma AI 在技術進步和用戶體驗方面處於劣勢。
另外,構建最先進模型所需的巨大計算能力和廣泛的訓練數據導致能力集中在少數行業領導者手中。Luma AI 的開放生態系統方法能否讓其有效競爭還有待觀察。公司鼓勵廣泛使用和社區參與的策略是一個大膽的舉動,但它必須解決 Dream Machine 的技術缺陷才能保持競爭力。
