OpenAIが開発した「ChatGPT」がリリースから2ヶ月で利用者1億人を突破したように、人々の生活を大きく変える存在として、生成AIへの関心が世界的に高まっています。GoogleやMicrosoftなど、世界の名だたる企業が生成AIの開発に多額の投資をおこなっており、今最も競争が激しい領域といえるでしょう。
そんな中、国内外から大注目されるAIスタートアップが日本国内に登場しました。それが「Sakana AI株式会社(以下、Sakana AI)」です。元Googleの天才たちによって設立された同社は、生成AIへの革新的なアプローチが評価され、シードラウンドにも関わらず、総額45億円もの資金調達を成功させています。
また2024年9月にはシリーズAラウンドで1億ドルの資金調達を成功させ、半導体大手であるNVIDIAとの包括連携も発表。日本経済新聞によると、この際に企業価値が11億ドル(約1700億円)を突破したそう。2023年7月の創業からわずか1年でユニコーン企業になっており、これは日本初の事例です。
この記事では、今大注目のAIスタートアップ「Sakana AI」について紹介します。
Sakana AIとは:元Googleの天才たちが創業したAIスタートアップ
Sakana AIは、元Googleの研究者であるDavid Ha(デイビッド・ハ)氏とLlion Jones(ライオン・ジョーンズ)氏、そして外務省からメルカリに移り執行役員を務めた伊藤 錬(いとう れん)氏によって創業されました。
同社は「LLM(大規模言語モデル)同士を組み合わせることで、より高度なLLMを生み出す」という新しいアプローチでのLLM開発に取り組んでいます。このアプローチは「進化的モデルマージ」と呼ばれる世界初の技術であり、より優れたLLMを短期間かつ低コストで開発できる点が大きな特徴です。そのため、LLMの自社開発を目指すGoogleやMicrosoft、NVIDIAといった、世界の大企業から大きく期待を寄せられています。
Sakana AIが研究する世界初の技術「進化的モデルマージ」
Sakana AIは、LLM開発の新しいアプローチとして、「進化的モデルマージ」という世界初の技術を研究しています。このアプローチの最大の特徴は、「世の中に存在するオープンソースのLLMを組み合わせて、新たなLLMを生成し、その中からより優れたモデルを選ぶ」という進化的アルゴリズムを活用している点です。
具体的には、まず親となるLLMをランダムに組み合わせて、複数の異なる「子LLM」を作成します。その後「子LLM」の性能を機械的に評価して、優秀だった「子LLM」を再び組み合わせることで、「孫LLM」を作成。「LLMの融合→評価→選択」というプロセスを何世代も繰り返すことで、人間の手を介さずに、高性能なLLMを生み出します。
実際にSakana AIは、「英語しか対応していない画像生成モデル」と、「日本語のLLM」を組み合わせることで、「日本語に対応した高性能の画像生成モデル」を作成することに成功しています。
また同社が研究する「進化的モデルマージ」の最大のメリットは、開発コスト・計算リソースを大幅に削減できる点です。無数に存在するパラメータの組み合わせを、機械が自動で生成・検証してくれるため、迅速なLLM開発を行うことができます。
従来のように、人間が1つ1つパラメータの組み合わせを考えたり、大量のデータを活用して0からLLMを開発したりする必要がないので、非常に効率的な開発手法といえるでしょう。
創業者3人の輝かしい経歴
Sakana AIのCEOであるDavid Ha氏は、2016年にGoogle Brain(Google ResearchのAI開発チーム)に入社し、2017年にGoogle Brainの東京チームトップを務めます。その後2022年にGoogleを退社し、英国のユニコーン企業であるStability AIの研究トップとして活動しました。2023年6月にStability AIを退社し、同年7月にSakana AIを創業しています。
次に同社のCTOを務めるLlion Jones氏は、2017年に発表された、現在の生成AI革命のきっかけとなった論文「Attention Is All You Need」の著者の1人です。2015年から2023年までのおよそ8年間、Googleのエンジニアとして勤務した後、Sakana AIを創業します。
最後に同社のCOOを務める伊藤 錬氏は、日本の外務省出身で、メルカリで執行役員を務めていました。メルカリではグローバル事業を担当しており、Sakana AIの組織づくりに過去の経歴を活かしていると報じられています。
資金調達:シリーズAにてNVIDIAや日系大手から約300億円を獲得
Sakana AIは2024年9月4日に、シリーズAラウンドで1億ドルの資金調達に成功したことを発表しました。この資金調達はNew Enterprise AssociatesやKhosla Ventures、Lux Capitalといったアメリカの大手VCが主導したもので、半導体大手のNVIDIAも出資したそうです。
また2024年9月17日には、シリーズAラウンドの一環として、日本のリーディングカンパニーからの資金調達にも成功したと発表しました。先ほどの1億ドルと合わせて、シリーズAにて合計で約300億円を資金調達したとのこと。
今後は日本がAI開発において世界をリードできるよう、日本企業とのパートナーシップを活かして、研究開発に加えて、特に、事業での連携を加速していくと発表しています。
なお日経スクープなどが発表するように、今回の投資ラウンドにてSakana AIの企業価値は11億ドル(約1700億円)を突破し、2023年7月の創業からわずか1年でユニコーン企業になりました。これは日本初の事例であり、まさに快挙といえます。
2024年9月のアナウンスにてNVIDIAとの包括連携も発表
Sakana AIは2024年9月のアナウンスにて、出資者であるNVIDIAとの包括連携も発表しました。
同社がNVIDIAと協業した目的は3つあり、1つ目が「NVIDIAのGPUテクノロジーを活用して、進化的モデルマージなどの技術開発を追求すること」。これにより、より効率的な基盤モデルの開発に向けた新しい手法を模索するそう。
2つ目が「NVIDIAがサポートする日本のデータセンターへの早期アクセス」です。初期テスト段階での実験が行いやすくなるので、NVIDIAの最新テクノロジーを活用したAI開発において、日本が競争優位に立てると主張しています。
3つ目が「日本のAIコミュニティの発展」です。現在、日本のAI人材は中国や米国の主要都市に比べて技術的に劣っています。しかし、NVIDIAのサポートを受けて、さらに高度なAIを作成することで、日本のAIの発展につながるだろうとSakana AIは主張。今後はイベントの主催、ハッカソン、大学への支援などを通じて、日本のAIコミュニティの発展に尽力するそうです。
2024年1月にシードラウンドにて3000万ドルを資金調達
Sakana AIは2024年1月に、シードラウンドでLux Capital主導のもと3000万ドルを資金調達したと発表しました。
この資金調達には、最初にOpenAIへ投資したVC「Khosla Ventures」をはじめとして、NTTグループやKDDI、JAFCOなど日本の大手企業も参加しています。まさに国内外の企業・投資家から注目を集めるAIスタートアップといえるでしょう。
Sakana AIが開発したモデル一覧
Sakana AIは「進化的モデルマージ」の研究に励んでおり、開発したモデルを多数リリースしています。どんなモデルを開発しているのか最後に見ていきましょう。
<Sakana AIが開発したモデル>
- 「The AI Scientist」:アイデア創出や論文執筆など、AIが研究開発を自動で行う
- 「Llama-3-EvoVLM-JP-v2」:複数の画像について日本語で質疑応答ができる
- 「Evo-Ukiyoe」:日本語のプロンプトから浮世絵風の画像を生成する
- 「Evo-Nishikie」:浮世絵を入力するとカラーになって出力される
- 「EvoSDXL-JP」:日本語のプロンプトから高速で画像を生成する
「The AI Scientist」AIが自動で科学研究を行う
Sakana AIが開発した「The AI Scientist」は、アイデア創出や実験の実行、結果の要約、論文の執筆、ピアレビューといった科学研究のサイクルを自動的に遂行するAIシステムです。
このモデルの最大の特徴は、最初の準備を除くと人間の介入が一切不要である点。「The AI Scientist」に研究を依頼するだけなので、研究自体を効率化できるうえ、費用も抑えることが可能です。実際に今回の実証実験では、論文1本あたり約15ドル(2300円)のコストしかかからなかったそう。
また論文執筆を担当するLLMとは別に、査読者役のLLMがいるため、生成された原稿を批評し、フィードバックを提供することが可能です。そのためAIが自動で研究を改善する他、次のサイクルでさらに発展させるべき有望なアイデアの選定も行うことができます。
「The AI Scientist」の普及を進めることで、人材不足が指摘されている日本のAI研究を促進したいと、Sakana AIは述べています。
「Llama-3-EvoVLM-JP-v2」複数の画像について質疑応答ができる
Sakana AIが開発した「Llama-3-EvoVLM-JP-v2」は、複数の画像を扱える日本語の*VLMです。
*VLM:Vision-Language Modelの略。言語の処理に特化したLLMと異なり、言語・画像の両方を処理することが可能。 |
「複数の画像を扱える英語のVLM」「日本語の能力に長けたLLM」「1枚の画像の説明能力に長けたVLM」という、3つの異なる特性を持つモデルをマージすることで本モデルを構築したそう。
「Llama-3-EvoVLM-JP-v2」を利用すると、複数の画像についての説明を求めたり、文章の途中に画像に関する情報を埋め込んだりすることができます。
すぐに試せるデモも用意されているので、ぜひお試しください。
「Evo-Ukiyoe」:日本語のプロンプトから浮世絵風の画像を生成する
Sakana AIが開発した「Evo-Ukiyoe」はText-to-Imageモデルであり、プロンプトから浮世絵風の画像を生成します。
桜や富士山、着物など、浮世絵でよく取り上げられる要素をプロンプトに含めると効果的だそう。一方、江戸時代に存在しないもの(パソコンやハンバーガーなど)を入力すると、画像は生成されるものの、全体的に浮世絵らしくない画像になってしまうそうです。
また「人物」の生成にも課題が残っているらしく、「男性」をプロンプトに入れても、女性の着物や髪型を生成してしまうことがあるとのこと。男女をより明確に区別するために、プロンプトに「男性」を入れ、ネガティブプロンプト(除去したい要素に関するテキスト)に「女性」を加えると良いそう。
「Evo-Nishikie」:浮世絵を入力するとカラーになって出力される
Sakana AIが開発した「Evo-Nishikie」はImage-to-Imageモデルであり、浮世絵の画像と染めたい色を指定すると、カラーになった浮世絵が出力されます。
より美しくカラー化するには、生成したい色や対象物に関する具体的な指示をプロンプトに含めると効果的だそう。歴史や文化を学ぶための新たなコンテンツ作成のツールとして利用されれば、世界の人々が浮世絵や日本文化に興味を持つきっかけを生み出せると述べています。
「EvoSDXL-JP」:日本語のプロンプトから高速で画像を生成する
Sakana AIが開発した「EvoSDXL-JP」は日本語に対応しており、日本スタイルの画像を高速で生成することができます。
日本特化の画像生成モデルと英語の基盤画像生成モデルをマージした後、さらに高速画像生成モデルとマージすることで、日本語対応かつ高速な画像生成モデルを構築したそう。
従来の日本語モデルは画像出力に40ステップを要していたが、同モデルはわずか4ステップであり、10倍の生成速度を記録したとSakana AIは述べています。
会社概要
- 企業名:Sakana AI株式会社
- 代表者:CEO David Ha
- 設立:2023年7月
- 所在地:東京都港区虎ノ門1-17-1虎ノ門ヒルズ ビジネスタワー
- 公式HP:https://sakana.ai/
まとめ
本記事では、「進化的モデルマージ」という新たな手法でのLLM開発に挑むSakana AIについて紹介しました。
New Venture Voiceでは、このような注目スタートアップを多数紹介しています。
Sakana AIのように、国内外の面白い企業についてもまとめているため、関連記事もご覧ください。