Google、市場に革命をもたらす超リアルなビデオを生成する新しい AI、Veo 2 を発表

最終更新: 17/12/2024

2 ia-0 が見えます

Google は、最新技術の逸品である Veo 2 を発表することで、人工知能 (AI) におけるリーダーシップを再び実証しました。 これは、ビデオの作成方法を変革し、生成 AI 市場の前後を示す革新的なツールです。このテクノロジーは、以前のテクノロジーと比較して大幅な改善が施されており、Sora モデルが取り残されているように見える主な競合他社である OpenAI と比較して、リーダーとしての地位を確立するという Google の意図を再確認しています。

Veo 2 の発売は、単独で行われた動きではありません。これは、生成 AI を進歩させるための多国籍企業による継続的な取り組みの一環であり、より強力なツールであるだけでなく、より信頼性の高いツールも提供します。さらに、このツールは、AI の幻覚や生成されたビデオのリアリズムの欠如などの従来の問題に対処する技術革新により、品質と使いやすさの面で高いハードルを設定することを約束します。

AI グーグルが 2 つ見える

見えます 2: 人工知能による 4K 動画

Veo 2 は、4K 解像度で最大 XNUMX 分のビデオを生成できる機能が際立っています。 この改善により、主な競合他社である Sora が現在提供できる品質が 3 倍になり、ユーザーは前例のないレベルの詳細さとリアリズムを備えたビジュアル作品を作成できるようになります。さらに、このツールは映画言語を理解するため、ショット、アングル、視覚効果、フィルターに関する特定のプロンプトを含めることができます。

限定コンテンツ - ここをクリックしてください  Google Nest カメラの Wi-Fi を変更する方法

たとえば、Veo 2 を使用すると、犬がプールに飛び込み、カメラが水中の動きを追跡し、濡れた毛皮や没入時のダイナミックな泡の細部を照らし出すなど、詳細な映画のようなショットを注文することができます。現実世界の物理学の理解と仮想カメラのより洗練された制御のおかげで、 結果は非常に現実的で、クリエイティブまたは商用アプリケーションに最適です。

主な技術的特徴と進歩

Veo 2 は、さまざまな解像度と再生時間の驚異的な範囲に加えて、他の生成ビデオ モデルと異なる技術的進歩を導入しています。 その最も重要な新機能の 1 つは、AI の幻覚、つまりモデルが一貫性のない要素や非現実的な要素を生成する典型的なエラーの減少です。現在、Google ツールは結果の一貫性と精度を保証し、ビデオ内のオブジェクト、テクスチャ、インタラクションをより自然なものにしています。

もう 2 つのハイライトは、Veo XNUMX で作成されたすべてのビデオに目に見えない SynthID ウォーターマークが含まれていることです。この革新的なシステムにより、クリップが人工知能によって生成されたものであることが確実に識別され、誤った情報と闘い、帰属を保証することができます。 透明。

限定コンテンツ - ここをクリックしてください  これはマイクロソフトがMidjourneyと競合するAIモデルであるMAI-Image-1である。

Veo 2 の映画のようなコントロール

現在の制限と限定された可用性

現時点では、Veo 2 はすべてのユーザーが利用できるわけではありません。 Google は、Google Labs の実験ツールである VideoFX を介したアクセスを有効にしましたが、これは一部のユーザーのみが対象です。 これにより、同社はパフォーマンスに関するデータを収集し、改善すべき領域を特定し、2025 年に予定されている世界的な発売に先立って調整を行うことができます。

しかし、 最初のテストは大成功でしたが、 ユーザーは、以前のバージョンや競合ツールと比べて大幅に改善された点を強調しています。このような進歩にもかかわらず、DeepMind 開発者は、より複雑なビデオの一貫性や連続的に動くシーンの長時間の生成など、克服すべき課題がまだあることを認識しています。

実験的に使用されているのが 2 つあります

OpenAIのSoraとの比較

Veo 2 の登場は、Google ユーザーにとっての進歩を示すだけでなく、OpenAI を不快な立場に置くことになります。その Sora モデルは革新的ではありますが、解像度、再生時間、全体的なビデオ品質の点で遅れをとっています。 Sora はかろうじてフル HD 解像度に達し、約 20 秒のクリップを生成しますが、 Veo 2 は、映画のような効果と物理的なリアリズムをより詳細に制御できる、最大 4 分の XNUMXK ビデオを提供します。

限定コンテンツ - ここをクリックしてください  スポーツにおける人工知能の応用

これは、Google の技術的熟練だけでなく、その戦略的アプローチも強調しています。 OpenAIはSoraを一般公開しましたが、 Googleはより慎重なアプローチをとっており、 Veo 2 へのアクセスを制限して、ツールの品質とセキュリティが最適なレベルに達するようにします。

I See 2 は、生成人工知能に対する Google の最大の賭けの XNUMX つを表しています。このようなツールを使用すると、 同社はこの分野をリードするだけでなく、超リアルなオーディオビジュアル コンテンツの作成における新たな標準を確立します。 クリエイターや企業の要求を満たすように設計された Veo 2 は、アイデアを視覚的な傑作に変換する機能で業界全体に革命を起こすことを目指しています。