更豐富的原生音訊品質
增強的音訊生成,具有更自然的對話、環境音和音效。VEO 3.1 在 VEO 3 的音訊基礎上構建,在語音清晰度、音調品質和音景真實感方面有顯著改良。
Google DeepMind 的 VEO 3.1 以更自然的音訊品質、改良的提示詞遵循和增強的角色一致性優化影片 AI,適用於對話驅動和多鏡頭敘事。
將 創意化為現實
Loading video...
Prompt:
背景:一隻名為Bamboo的熊貓和一隻名為Tweed的紅狐主持一個輕鬆、機智的播客,名為「Quantum Quibbles(量子糾紛)」。 任務:為量子糾纏這一集撰寫最短、最有力的開場對話。僅專注於快速介紹和主題標題。 熊貓(Bamboo):「歡迎來到量子糾紛!我是Bamboo。」 紅狐(Tweed):「我是Tweed!」 熊貓(Bamboo):「今天:量子糾纏!」 紅狐(Tweed):「讓我們開始吧。」
增強的音訊生成,具有更自然的對話、環境音和音效。VEO 3.1 在 VEO 3 的音訊基礎上構建,在語音清晰度、音調品質和音景真實感方面有顯著改良。
視覺動作與音訊線索之間更緊密的時間對齊,對話密集場景的唇語同步精度增強。VEO 3.1 減少時間漂移並改良嘴部動作與語音模式匹配的準確度。
對電影風格和複雜創意指令的更深理解,提供更準確的視覺詮釋。VEO 3.1 在解析電影術語、光線描述和構圖指導方面表現出色,忠實度更高。
改良的參考遵循確保角色在多鏡頭中保持一致的外觀、服裝和視覺特徵。對於角色連續性對敘事連貫性至關重要的敘事來說必不可少。
正式的 API 支援以 7 秒步驟擴展影片最多 20 次,創建最長約 148 秒的序列。Flow 整合實現精確的多段編輯,提供專業敘事控制。
更好地保持照明、氛圍、調色和環境細節,跨擴展序列和多鏡頭敘事。VEO 3.1 為品牌內容和專業製作維持視覺風格一致性。
VEO 3.1 帶來更豐富、更自然的音訊品質、改良的音視訊同步、電影風格的更好提示詞遵循、跨鏡頭的增強角色一致性,以及通過 API 和 Flow 整合的形式化擴展工作流程。雖然 VEO 3 引入了原生音訊生成,VEO 3.1 在語音清晰度、敘事控制和時間連貫性方面進行了明顯的品質改良。
還有其他問題? 聯繫客服團隊
體驗更豐富的音訊品質、改良的角色一致性和更好的敘事控制,用於您的對話驅動和多鏡頭影片專案。VEO 3.1 提供對專業內容創作至關重要的改良。