- すべてのFlowツールのネイティブオーディオ:同期されたダイアログ、アンビエンス、エフェクト
- プロンプトへの遵守率が向上し、画像から動画への変換結果が向上します
- 新しい編集コントロール: 材料、フレーム、拡張、挿入。削除は近日中に追加予定。
- Flow、Gemini アプリ、Vertex AI、Gemini API で利用可能
GoogleはVeo 3.1でビデオ生成モデルを更新しましたオーディオビジュアル品質、クリエイティブコントロール、信頼性を重視したイテレーションです。同社は エディターと指示の理解に関する重要な改善 映画のような作品の制作をスピードアップします。
La 最も目立った新しさは ネイティブオーディオワークフロー全体を通して、セリフ、雰囲気、エフェクトが映像と同期して制作されます。さらに、 Flow には、シーンの微調整、テストの削減、テイク間の一貫性の維持を容易にする調整機能が組み込まれています。.
Veo 3.1 とは何ですか? Veo 3 と比べて何が変わりましたか?

Veoをベースに 3新しいモデルでは、 指示に従う ビデオとサウンドの出力の精度。Google チューニングにより不要な反復が削減され、より制御しやすく一貫した結果が得られる点を指摘する リクエストされたもので。
このアップデートは、クリエイターによるFlowの集中的な使用の数ヶ月後に行われ、 数億のクリップ 発売以来生成されたこの学習により、複雑なシーンの解釈の信頼性が向上し、テクスチャのリアリティが向上し、ショット間の連続性が向上します。
同社はまた、水平と垂直の両方で16:9のアスペクト比のサポートを強化し、 クロスプラットフォーム環境 そして現在の出版の流れ。
ネイティブオーディオ統合とサポートされるフォーマット
Veo 3.1では、サウンドは 同期とコンテキスト すべてのフローツールで: 雰囲気、効果、音声は外部のポストプロダクションに頼ることなく、各ショットに合わせて調整されます。.
このモデルは約 8秒 1080p解像度、24 FPS時間的な一貫性を失うことなく拡張できる可能性があります。 9:16の縦型フォーマットもサポートモバイル配信用に設計されています。
これらのオーディオ機能は、これまでは聞こえなかった機能にも拡張され、視覚的にも聴覚的にも進化し、 節約ステップ 最終組み立てにおいて.
フローツール: 制御と編集

Flowには、視覚的な物語を方向づけるのに役立つコントロールが組み込まれています。 ビデオの材料、彼らはできる キャラクター、オブジェクト、スタイルを確立するために複数の参照画像をアップロードします。 ショット間の一貫性を維持する.
機能 ビデオのフレーム 最初の画像と最後の画像の間の遷移を生成するシーンの開始と終了を定義し、試行錯誤の時間を短縮するのに役立ちます。
と 伸ばすそれは可能です クリップを1分以上に延長する、セグメントを視覚的および音響的な連続性でリンクして、ロング ショットやゆっくりとした物語を構築します。
編集セクションでは、 入れる 照明、影、遠近感を尊重しながら、既存のショットに要素を追加できます。オプション なくす もうすぐ到着する予定で、その目的は不要な物体を除去し、海底を自然に再生することです。
パフォーマンス、限界、品質
Veo 3.1は、 キャラクターの一貫性 フレーム間および基本的な物理学 (重力、衝突、流体) の表現が改善され、画像からビデオへの変換も改善され、細部がより適切に保持されます。
生成AIと同様に、 ポイントアーティファクト特に動きの速いシーンや複雑なトランジションでは、リップシンクは改善されましたが、それでも 要求の厳しい制作におけるレタッチ.
Googleは目に見える透かしを適用し、 シンセID 生成されたコンテンツの追跡可能性を確保するため、無効化できない対策として、デジタル フレーム識別 (デジタル フレーム識別) が採用されています。
可用性とそのテスト方法
Veo 3.1は、 流れ, Gemini アプリ、Vertex AI、Gemini Developer API地域によって在庫状況が異なる場合があり、 一部の高度な機能にはサブスクリプションが必要です.
技術チームや企業にとって、Vertex AIとAPIを介したアクセスにより、モデルを社内ツールに簡単に統合できるようになり、 個々のクリエイターはアプリから実験できる ジェミニ またはフローエディタ.
競合製品と実用性

直面する ソラ2 OpenAIによるVeo 3.1 では、作成中のユーザー コントロール (イメージ キュー ポイント、シーン編集、統合オーディオ) が重視されています。 ソラ2はリアリズムを重視している点が際立っているしたがって、選択はクリエイティブな目標によって異なります。
マーケティング、ジャーナリズム、教育の分野では、これらの機能により プロトタイプのアイデア従来の撮影なしで説明的な視覚化を作成し、テーマ別のクリップを制作し、コンテンツの配信を加速します。
このアップデートでGoogleは、より多くのコントロール、統合されたオーディオ、そしてより優れた編集ツールを導入し、クリエイターが 物語を監督する 主要プラットフォームと互換性のある形式とフローを維持しながら、摩擦を軽減します。
私はテクノロジー愛好家であり、その「オタク」の興味を職業に変えています。私は 10 年以上、純粋な好奇心から最先端のテクノロジーを使用し、あらゆる種類のプログラムをいじくり回してきました。現在はコンピューター技術とビデオゲームを専門にしています。これは、私が 5 年以上、テクノロジーやビデオ ゲームに関するさまざまな Web サイトに執筆し、誰にでも理解できる言語で必要な情報を提供することを目的とした記事を作成しているためです。
ご質問がございましたら、私の知識は Windows オペレーティング システムから携帯電話用の Android に関連するあらゆるものまで多岐にわたります。そして、私はあなたに対して、いつでも喜んで数分を費やして、このインターネットの世界であなたが抱いている疑問を解決するお手伝いをしたいと考えています。