最終更新日 24/12/19
特集記事

Googleが動画生成AI「Veo 2」を発表!「Sora」を超える性能を発揮

AI
Share this post

Googleは2024年12月16日(現地時間)、新たな動画生成AI「Veo 2」を発表しました。このツールは、多様なビジュアルスタイルに対応し、最大4K解像度の映像を生成することが可能です。

特に、現実世界の物理法則や人間の動き、表情の微妙なニュアンスを深く理解している点が大きな特徴であり、よりリアルな映像を実現します。

Googleによると、Metaのベンチマーク「MovieGenBench」において、「Veo 2」は米OpenAIの動画生成AI「Sora Turbo」を含む他のツールを上回る性能を記録したそうです。

このように、新たな動画生成AIとして注目を集める「Veo 2」について、その性能や利用方法をくわしく解説します。

Googleの新たな動画生成AI「Veo 2」

(引用:Google DeepMind公式HP)

Veo 2は、Googleが新たに発表した動画生成AIツールです。テキストプロンプトを入力するだけで、高品質な動画を生成してくれます。その特徴は次のとおりです。

<Veo 2の特徴>

  • 高解像度でリアルな映像を生成
  • 映画撮影の専門用語などを理解
  • 見えない電子透かしを搭載

特徴①:高解像度でリアルな映像を生成

Veo 2は最大4Kの解像度で動画を生成でき、細部までリアルに描写します。特に、現実世界の物理現象や人間の動き、表情のニュアンスを深く理解しており、従来の生成AIに見られる不自然さを排除している点が大きな特徴です。

動画生成モデルはしばしば余分な指や予期せぬ物体など、不必要な要素を幻覚(ハルシネーション)として生み出してしまう傾向にあります。Veo 2ではこういった事態を避けることができるので、より自然な出力を得られるでしょう。

特徴②:映画撮影の専門用語などを理解

Googleによると、Veo 2は映画撮影に関する専門用語や映像効果を的確に理解することができます。

たとえば、「A cinematic, high-action tracking shot(シネマティックで動きのあるトラッキングショット)」というプロンプトを入力すると、水中を泳ぐ犬を追いかけるような映像を生成しました。

このように、ユーザーが求める映像を正確に把握し、それを忠実に再現できる点が特徴です。

特徴③:見えない電子透かしを搭載

Veo 2で作成された動画には、肉眼では確認できない「SynthIDウォーターマーク」が埋め込まれています。このウォーターマークは、動画がAIによって生成されたものであることを識別するための仕組みです。これにより、AI生成コンテンツを悪用した誤情報の拡散や、不正利用のリスクを抑えることが可能になります。

「Veo 2」の性能:他の動画生成AIツールを凌駕

左からPrompt adherence(プロンプトの順守性)、Overall preference(全体的な評価)の比較(引用:Google DeepMind公式HP)

Googleによると、Veo 2は他の動画生成AIを上回る性能を発揮しており、多くのユーザーから高い評価を得ているそうです。

実際に、Veo 2はMetaのベンチマーク「MovieGenBench」において、「プロンプトの順守性」「全体的な評価」で高いスコアを記録しました。上記のグラフは、「Veo 2が優れている」と評価した人々の割合を緑で示しており、その数値はMeta Movie GenやSora Turboと比較して明らかに高いことがわかります。

残された課題:複雑なシーンでの動きの一貫性

しかしながら、Veo 2にもまだ課題が残っているそうです。特に、複雑なシーンでの動きの一貫性を維持することには、さらなる改善の余地があると指摘されています。

Googleは今後も継続的な技術開発を通じて、これらの課題を克服していく方針を示しています。

「Veo 2」の使い方

(引用:VideoFX公式HP)

Veo 2は現在、Google LabsのVideoFXプラットフォーム上で限定的に利用可能です。ウェイティングリスト登録者に限り、以下の条件で利用できます。

  • クリップの長さ: 最大8秒
  • 解像度: 最大720p

今後、YouTubeやAI開発プラットフォーム「Vertex AI」、AI動画作成ツール「VideoFX」などでの展開が予定されています。2025年にはYouTube Shortsにも導入される計画です。

避けられないVeo2・Soraの激突

OpenAIの「Sora」もまた、注目を集める動画生成ツールです。Soraはテキストプロンプトを元に短く高品質な動画を生成し、リミックスやブレンド機能も備えています。しかし、生成動画には不自然な手足や動きなどの問題が見られる場合があるため、SNS上で議論が活発化しています。

Soraは現在、ChatGPT PlusまたはProプランの有料ユーザーだけに提供されており、480p解像度の動画を50本まで生成可能です。Proプランではさらに高解像度の動画が作成可能です。

Soraの性能や利用方法等について、くわしく知りたい方は次の記事をご覧ください。

Veo 2の将来展望

Veo 2が広く普及すれば、Soraとの比較や使い分けが進むことが予想されます。Googleはより多くのユーザーがアクセス可能になるよう、段階的に展開を進める方針です。また、AI生成動画の精度向上に向けた研究開発も続けられるでしょう。

Veo 2は、リアリズムと利便性の両面で大きな進化を遂げたツールです。今後の進展が期待される中、動画生成の未来にどのような影響を与えるのか注目されます。

まとめ

Googleの動画生成AI「Veo 2」は、リアルで高品質な映像を生成できる革新的なツールです。高解像度対応や専門的な映像表現の理解、電子透かしの搭載など、他の動画生成AIを上回る性能を備えています。

一部課題は残るものの、将来的にはYouTubeや商用AI開発プラットフォームでの展開が予定されており、幅広いユーザーに利用されることが期待されています。急速に進化する動画生成AI分野において、「Veo 2」の動向は今後も注目です。

目次に戻る

タイトルとURLをコピーしました