Sora 輸出的并不需要出現(xiàn)的面部圖案|圖片來源:fxguide
分辨率和圖像處理:
《Air Head》使用了 Sora 生成的鏡頭,但其中很多都被分級、處理和穩(wěn)定化了,所有鏡頭都被放大或提升了分辨率。團隊處理的片段都是以較低分辨率生成的,然后使用 Sora 或 OpenAI 之外的 AI 工具進行了放大?!肝覀兯械摹禔ir Head》都是以 480 的速度制作的,然后使用 Topaz 進行校正。」
時間控制的不精確性:
Shy Kids 使用的是最早的原型(Sora 仍在不斷改進中),盡管可以在時間線上對關鍵幀進行調(diào)整,但對于動作發(fā)生的確切時間點控制并不精確,結果具有一定的不確定性。
寬高比的選擇:
Sora 允許用戶選擇不同的寬高比,如肖像或風景模式,這一功能對于特定的鏡頭設計至關重要。盡管 Sora 提供了靈活性,但它在原生渲染某些復雜鏡頭動作方面存在限制。例如,當需要從角色 Sonny 的牛仔褲向上搖攝到他的氣球頭時,Sora 無法直接生成這樣的鏡頭。為了解決這一限制,團隊先以肖像模式渲染了鏡頭,然后通過后期裁剪手動創(chuàng)建了后期的全景。
Sora 生成的鏡頭需要后期手動裁剪|圖片來源:fxguide
相機方向的提示:
Sora 在理解和執(zhí)行相機運動指令方面還不夠成熟。盡管用戶可以輸入如「相機平移」的提示,但 Sora 并不總是能夠準確執(zhí)行。
渲染時長:
根據(jù)不同的云使用需求和時間,渲染一個片段可能需要 10 到 20 分鐘。團隊傾向于渲染更長的片段,以便在后期制作中有更多編輯和調(diào)整的空間。
旋轉:
雖然所有的圖像都是在 Sora 中生成的,但氣球仍然需要大量的后期工作。除了隔離氣球以便重新上色外,還需要移除一些不應該出現(xiàn)的面部圖案或其他痕跡。
Sora 的原始輸出|圖片來源:fxguide
后期成品頁面|圖片來源:fxguide
素材與成品比例:
帕特里克估計,最終影片中一分半鐘的鏡頭,是基于「數(shù)百次生成,每次 10 到 20 秒」的素材制作的,大約是 300:1 的源材料與最終成品比例。
拍攝合成和重新定時:
在《Air Head》中,大多數(shù)鏡頭是一次性生成的,沒有將多次拍攝合成在一起。
許多由 Sora 生成的視頻片段似乎被自動處理成了慢動作,速度只有正常速度的 50% 到 75%。團隊需要重新定時,以讓它們看起來像是實時拍攝的。
版權:
Sora 不允許生成會構成侵犯版權或看起來像是模仿特定作品的內(nèi)容。
例如輸入以下提示詞:「在一艘未來主義的太空船中,使用 35mm 膠片拍攝,一個男人手持光劍向前走」,Sora 將不允許生成片段,因為這樣的內(nèi)容太接近《星球大戰(zhàn)》。
Shy Kids 在早期測試中也遇到了這個問題。帕特里克回憶說,「我輸入了『阿羅諾夫斯基式的鏡頭』,結果收到了無法執(zhí)行的反饋?!顾€提到,「希區(qū)柯克式變焦」也是一個會被 Sora 拒絕的提示。
去年,大模型的快速發(fā)展引起了一場好萊塢大編劇罷工,電影行業(yè)對于這項技術的擔憂開始增多。今年 2 月,OpenAI 推出的 Sora 被視為硅谷再次對好萊塢發(fā)起沖擊的信號。3 月初,更是有計劃了 4 年,資金規(guī)模約 8 億美元,場地面積高達 330 英畝的 12 個攝影棚的設計和建造等一系列的影視工作室擴建計劃,因為 Sora 的出現(xiàn)被迅速擱淺。一時間,似乎好萊塢人人自危。
但當使用 Sora 制作了短片的 Shy Kids 對這一技術進行了全揭秘,人工后期被大量使用,Sora 還不能完成一些高級的復雜需求,這些似乎又都給了好萊塢更多緩沖的時間——畢竟 Sora 目前尚處于非常早期的階段,還遠遠不能在電影工業(yè)的各個環(huán)節(jié)替代人工。
但值得注意的是:人工智能正在以比過去摩爾定律更快的速度提升智能,這點在以 GPT 為代表的大語言模型已經(jīng)得到了驗證。今天 Sora 的出現(xiàn)意味著視頻生成模型已經(jīng)來到了拐點,或許用不了多久我們就能看到可以用于視頻產(chǎn)業(yè)甚至電影工業(yè)的視頻大模型。
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論