Googleが最新AIモデル「Gemini 2.0」を発表！応答速度を重視した新モデル「Gemini 2.0 Flash」を提供開始

2024年12月11日、Googleは次世代AIモデルファミリー「Gemini 2.0」を発表しました。この最新モデルは、「エージェント時代」を象徴するものであり、AIがユーザーの指示に応じて考え、行動し、課題を解決する能力を大幅に強化しています。

同時に、応答速度を重視した新モデル「Gemini 2.0 Flash」の試験運用版もリリースされ、すべてのGeminiユーザーが利用可能となりました。その性能は、現行の最上位モデル「Gemini 1.5 Pro」の2倍の応答速度で、各種ベンチマークで1.5 Proを上回っています。

さらに、リサーチアシスタント機能「Deep Research」も新たに提供され、Gemini Advancedプランのユーザーが利用できるようになりました。この新機能は、複雑なトピックを調査し、短時間でレポートを生成することを可能にします。

この記事では、新モデル「Gemini 2.0 Flash」の性能をはじめ、Googleが行った発表についてわかりやすく解説します。

発表①: Gemini 2.0と新モデル「Gemini 2.0 Flash」の提供開始
1. Gemini 2.0 Flashの性能
2. Gemini 2.0 Flashの利用方法
発表②: 新機能「Deep Research」の発表
1. 「Deep Research」の利用方法
発表③: エージェント時代の実現に向けたプロジェクト
まとめ: Gemini 2.0が示す未来

発表①: Gemini 2.0と新モデル「Gemini 2.0 Flash」の提供開始

2024年12月11日に発表された「Gemini 2.0」は、Google DeepMindが開発した最新のAIモデルであり、複雑な問題の解決を目指して設計されています。そして、この新しいモデルファミリーの第一弾として、試験運用版「Gemini 2.0 Flash」が一般公開されました。

「Gemini 2.0 Flash」は、低い遅延と高い性能を両立させたAIモデルです。このモデルは、「Gemini 1.5 Flash」をもとに構築されており、高い処理速度を維持しつつ、各種パフォーマンスが向上しています。実際、主要なベンチマークテストでは、2.0 Flashが1.5 Proを超える性能を発揮し、2倍の速度で処理を実行できることが確認されています。

また、新たに追加された機能として、テキストと連携した画像生成や、操作可能なテキスト読み上げ(TTS)による多言語音声のサポートがあります。さらに、Google検索やコードの実行、サードパーティのユーザー定義関数など、さまざまなツールをネイティブに呼び出すことができるようになりました。これにより、より高度な操作が可能となり、さまざまな用途に対応できるようになっています。

Gemini 2.0 Flashの性能

「Gemini 2.0 Flash（Experimental）」は、従来の「Gemini 1.5 Flash」や「1.5 Pro」モデルを大幅に上回る性能を発揮しています。以下が、主な性能の比較です。

コード生成 (Natural2Code)
- Gemini 1.5 Pro: 85.4%
- Gemini 2.0 Flash Experimental: 92.9% (約7.5ポイント向上)
高度な数学問題 (HiddenMath)
- Gemini 1.5 Pro: 52.0%
- Gemini 2.0 Flash Experimental: 63.0% (約11ポイント向上)
マルチモーダル理解 (MMMU)
- Gemini 1.5 Pro: 65.9%
- Gemini 2.0 Flash Experimental: 70.7% (約4.8ポイント向上)

これらの結果から、「Gemini 2.0 Flash」は、優れた推論能力、高度なマルチモーダル処理能力、そして高速な応答性能を実現していることがわかります。

Gemini 2.0 Flashの利用方法

「Gemini 2.0 Flash」は現在、Google AI StudioとVertex AIのGemini APIを通じて開発者向けに提供されています。すべての開発者がマルチモーダル入力とテキスト出力を利用でき、早期アクセスパートナーにはテキスト読み上げや画像生成機能も提供されています。なお、2025年1月には一般公開が予定されており、さらに大規模なモデルが利用できるようになる見込みです。

また、一般ユーザーはGeminiアプリを使って「Gemini 2.0 Flash」の試験運用版を試すことができます。具体的には、デスクトップやモバイル版で、ドロップダウンメニューからモデルを選んで利用することが可能です。

さらに、2025年初頭には「Gemini 2.0 Flash」が、Google検索などの他のGoogle製品にも統合される予定です。

発表②: 新機能「Deep Research」の発表

「Deep Research」は、Gemini Advancedプランのユーザー向けに提供される新しいリサーチエージェント機能です。この機能は、AIがユーザーの代わりに調査を行い、結果をレポート形式で提供する高度なサポートを提供します。

具体的には、複雑な調査タスクを自動化するリサーチエージェントとして、指定されたテーマに基づいて、複数のステップにわたるWeb検索や情報整理を行い、最終的に数分でレポートを生成。このレポートには参考リンクが含まれており、情報源に簡単にアクセスできます。そのため、学術研究や市場分析、ビジネス戦略の立案など、さまざまなシナリオで活用することが可能です。

【Deep Researchの特徴】

複数ステップの調査を自動化: AIが一連の検索を行い、関連する情報を抽出・整理・要約
レポート形式で結果を提供: 参考URLや出典付きで論理的に整理されたレポートを生成
1Mトークンのコンテキスト対応: 幅広い情報を収集し、包括的な知見を提供

「Deep Research」の利用方法

現在、「Geminiアプリ(ウェブ版）」でGemini Advancedプランに加入しているユーザーだけが、「Deep Research」を試すことができます。ただし、現時点では日本語には対応していないため、利用する際にはGoogleアカウントの言語設定を英語(United Statesなど)に変更する必要があります。

【Deep Researchの利用手順】