Sakana AIが開発した日本語言語モデル「TinySwallow-1.5B」とは？革新的な知識蒸留手法「TAID」も解説

近年、ChatGPTやGeminiといった大規模言語モデル(LLM)が急速に発展し、私たちの生活やビジネス環境を大きく変えています。高度なテキスト生成や自動翻訳、プログラミング支援など、多様な用途で活用されていますが、その一方で莫大な計算資源が必要となり、運用コストや消費電力の増大が喫緊の課題です。特に、クラウドサーバー上で動作するLLMは、リアルタイム処理の遅延やデータプライバシーの問題を抱えており、これらを解決する技術が求められています。

そこで注目されているのが、小規模言語モデル(SLM)です。SLMは、スマートフォンやPCなどの端末上で直接動作し、オフラインでも利用可能なコンパクトなAIです。特定用途に最適化されているため、軽量でありながら実用的な精度を確保できるのが大きな強みです。ただし、SLMはLLMほどの学習能力を持たないため、「いかにして小規模ながら高性能な言語モデルを構築するか」が大きな課題となっていました。

この課題を解決するために、2025年1月30日、日本のAI企業「Sakana AI」が新しい知識蒸留技術「TAID」を採用した日本語特化のSLM「TinySwallow-1.5B」を発表しました。このモデルは、わずか15億のパラメータでありながら、大規模AIに匹敵する日本語理解能力を発揮します。さらに、クラウドを介さずにスマートフォンやPC上でオフライン動作できるため、プライバシー保護や処理の高速化にも貢献するでしょう。

本記事では、TinySwallow-1.5Bの特徴や技術的な革新性、実際の活用シーンについてわかりやすく解説します。

TinySwallow-1.5Bとは？小型で高性能な日本語AIモデル
TinySwallow-1.5Bの技術的革新「TAID」とは？
TinySwallow-1.5Bの活用シーン
TinySwallow-1.5Bの利用方法
Sakana AIの今後の展望
まとめ

TinySwallow-1.5Bとは？小型で高性能な日本語AIモデル

TinySwallow-1.5Bを用いたiPhone上でのテキスト生成(引用：Sakana AI公式HP)

TinySwallow-1.5Bは、Sakana AIが開発した日本語特化型の小規模言語モデル(SLM：Small Language Model)です。このモデルは、大規模言語モデル(LLM)の知識を小規模なモデルに転移する新手法「TAID」を活用して開発されました。なお、TAIDによって作った小規模モデルを多くの人に使ってもらうため、英語のSLMである「TAID-LLM-1.5B」も開発されています。

TinySwallow-1.5Bの最大の特徴は、やはり小規模ながら高性能である点。わずか15億のパラメータしかなく、スマホで快適に動くほど軽量であるものの、日本語の小規模言語モデルとして最高性能を示しました。

また、従来のLLMと比べて、軽量かつ省エネルギーであるため、スマートフォンやPC上でオフラインでも動作可能です。たとえば、従来のAIチャットボットはクラウド経由で大規模サーバーを利用する必要がありましたが、TinySwallow-1.5Bはローカル環境で直接動作できるため、プライバシー面でもメリットがあります。

＜TinySwallow-1.5Bの特徴＞