基盤モデル(ベースモデルとも呼ばれます)は、大量のデータでトレーニングされ、幅広いタスクに適応できる強力な人工知能(AI)モデルです。「基盤モデル」という用語は、2021 年にスタンフォード大学人間中心の AI 研究所(HAI)によって作られました。
このテクノロジーは、ソフトウェア開発の効率化からカスタマー サービスとのやり取りの改善まで、業界全体に新たな可能性をもたらします。
基盤モデルは、さまざまなタスクを実行できるよう大量のデータで事前トレーニングされる AI モデルの一種です。このトレーニング プロセスでは、自己教師あり学習がよく用いられ、データ内の複雑なパターンや関係性を学習することで、さまざまなタスクをより高精度で実行できるようになります。さらに重要なのは、この大規模な学習によって創発的な能力が生まれる点です。つまり、明示的にトレーニングされていないタスクまでもこなせるようになります。こうした、特化型ツールから柔軟な汎用モデルへの転換こそが、基盤モデルというパラダイムの特徴です。
「基盤モデル」と「大規模言語モデル」(LLM)という用語は同じ意味で使用されることがよくありますが、重要な違いがあります。LLM は基盤モデルの主要なタイプですが、それだけが基盤モデルではありません。いわば親子関係のようなものです。LLM は基盤モデルの一部であり、基盤モデルはそれより広い概念を指します。
主な違いは、基盤となるデータの種類です。LLM は、その名のとおり、膨大な量のテキストとコードで特別にトレーニングされています。「基盤モデル」というより広いカテゴリには、画像、音声、動画などの他のデータタイプ、またはそれらの組み合わせ(マルチモーダル)でトレーニングされたモデルも含まれます。
生成 AI と基盤モデルは異なる概念ですが、密接に関連しています。両者の違いを理解する最も簡単な方法は、それぞれを「エンジン」と「機能」として考えることです。
多くの一般的な基盤モデルは生成タスクに利用されていますが、複雑な分類や分析といった非生成用途にも適応可能です。つまり、すべての基盤モデルが本質的に生成型であるわけではありませんが、今日の生成 AI アプリケーションの波を支える中核技術となっています。
基盤モデルにはさまざまなアーキテクチャがあり、それぞれ独自の強みと用途を持つように設計されています。主なタイプをいくつかご紹介します。
基盤モデルは、自己教師あり学習を使用して膨大なデータセットでトレーニングされます。自己教師あり学習は、従来は教師あり学習が必要だったタスク(たとえば、人間の入力を使ったデータのラベル付け)に、教師なし学習の手法を活用する ML のアプローチです。これにより、モデルは入力データのマスクされた部分や欠損した部分を予測するようにトレーニングされます。モデルは予測を繰り返すことで、データ内のパターン、関係、基盤となる構造を特定することを学習します。
基盤モデルのトレーニング プロセスは、ML モデルのトレーニング プロセスと似ており、通常は以下の主要なステップを含みます。
基盤モデルには、企業やデベロッパーにとって以下のようなメリットがあります。
汎用性
基盤モデルは幅広いタスクに適応できるため、特定の用途ごとに個別のモデルをトレーニングする必要がありません。この適応性により、さまざまな業界やユースケースで価値を発揮します。
効率性
事前トレーニング済みの基盤モデルを使用すると、新しい AI アプリケーションの開発に必要な時間とリソースを大幅に削減できます。事前トレーニング済みモデルのファインチューニングは、モデルをゼロからトレーニングするよりも高速で効率的であることがよくあります。
精度
基盤モデルは膨大なデータセットで広範なトレーニングを受けているため、高い精度でさまざまなタスクを実行でき、小規模なデータセットでトレーニングされたモデルを上回る性能を発揮します。
費用対効果
基盤モデルは、大量のトレーニング データやコンピューティング リソースを必要としないため、AI アプリケーションを開発するための費用対効果の高いソリューションとなります。
イノベーション
基盤モデルは、AI 分野のイノベーションを推進し、より高度で新しい AI アプリケーションの開発を可能にしています。
スケーラビリティ
基盤モデルは、大規模なデータセットや複雑なタスクにも対応できるようスケーリング可能であり、要求の厳しいアプリケーションに適しています。
基盤モデルには多くのメリットがある一方で、ユーザーやデベロッパーが対処しなければならない大きな課題もあります。
基盤モデルのエコシステムは日々進化し、競争が激化しています。業界をリードする企業が提供する、最も注目すべきモデルの一部をご紹介します。
Google Cloud は、組織が基盤モデルを実践的な用途に活用できるよう、アクセス、カスタマイズ、デプロイを包括的に支援するエンタープライズ向けプラットフォーム Vertex AI を提供しています。この戦略は、選択肢、強力なツール、統合されたインフラストラクチャを提供することを柱としています。
Google Cloud での基盤モデルの活用方法: