2024年12月3日、Amazon Web Services(AWS)は、新型AI基盤モデル「Amazon Nova」の開発に加えて、次世代AIスーパーコンピュータ「Ultracluster(ウルトラクラスター)」の開発計画を発表しました。
このスーパーコンピュータは、AWSが自社開発したAI向け半導体「Trainium」を基盤とし、生成AIや機械学習モデルのトレーニングを効率的に行うための最新技術を搭載しています。完成は2025年を予定しており、世界最先端の計算能力を誇るシステムになるとされています。
「Ultracluster」とは:Trainiumを搭載した次世代スーパーコンピュータ
AWSが発表した「Ultracluster」は、自社製のAI向け半導体「Trainium」を搭載した最先端のAIスーパーコンピュータです。「Trainium」は、高度なディープラーニングや生成AIモデルのトレーニングを効率的かつ低コストで実現することを目的に設計されており、その性能はエヌビディアの最新GPUに匹敵するとも言われています。
AWSのコンピュート&ネットワークサービス担当副社長デイブ・ブラウン氏は、「Ultraclusterは世界で最も計算能力の高いAIスーパーコンピュータの1つになる」と述べており、AIモデルの開発を大幅に効率化する画期的なプラットフォームとなることが期待されています。
Anthropicとの連携:生成AIの新たな可能性
AWSはAIスタートアップの「Anthropic(アンソロピック)」と連携し、「Ultracluster」を次世代の大規模言語モデル(LLM)の開発に活用する予定です。 Anthropicは主に生成AIモデルの開発を手掛けており、特にAIの安全性や信頼性に特化した研究を行っています。最近AWSから総額40億ドルの追加出資を受けており、この資金をもとに、AnthropicはTrainiumの改良に共同で取り組んでいるそうです。
また、AnthropicはAWSの「Project Rainier」にも参加しています。このプロジェクトでは、数十万のTrainiumチップを使用した世界最大級のAIクラスターが構築される予定で、生成AIの新たな可能性を切り開く基盤となるでしょう。
AWSの競争戦略:TrainiumでNVIDIAに対抗
現在、生成AI分野ではNVIDIAのGPUが市場の大半を占めています。これに対し、AWSは自社の「Trainium」を低コストかつ効率的な代替手段として提供することで、この独占状態を打破する計画です。実際に、AWSのマット・ガーマンCEOは「顧客に複数の選択肢を提供することで、顧客の成功をサポートできる」と述べました。
しかし、AWSはNVIDIAと競争するだけでなく、協力も進めています。実際に、2万個以上のNVIDIA製「Blackwell GPU」を搭載したスーパーコンピュータ「Project Ceiba」も開発中であり、競争と協力を両立した柔軟な戦略を打ち出しています。
「Ultraserver」の発表:Trainiumの実用化
AWSは「Ultracluster」の発表に加え、「Ultraserver」というTrainium搭載の新しいクラウドサーバーもリリースしました。このサーバーは、生成AIモデルのトレーニングや推論のために設計されており、リアルタイムチャットやトランザクション分析といった低遅延が求められるユースケースにおいて、高い性能とコスト効率を実現します。
まとめ:AWSが描くAIコンピューティングの未来
今回発表された「Ultracluster」と「Trainium」は、AWSがAI分野でリーダーシップを発揮するための重要なステップとなるでしょう。
Anthropicとの連携やNVIDIAへの対抗を通じて、AWSはAI技術の進化を支える基盤を築いています。これにより、企業や研究者はこれまで達成不可能だったスケールや精度でAI技術を活用できるようになることが期待されています。