Google が The Forrester Wave™: AI Foundation Models for Language, Q2 2024 のリーダーに選出
Warren Barkley
Sr. Director of Product Management
※この投稿は米国時間 2024 年 6 月 6 日に、Google Cloud blog に投稿されたものの抄訳です。
このたび Google が、2024 年第 2 四半期の The Forrester Wave™: AI Foundation Models for Language で Leader に選出され、「現在のサービス」と「戦略」のカテゴリにおいて、全ベンダーの中で最高スコアを獲得しました。
「Gemini は、特にマルチモダリティとコンテキストの長さにおいて市場で際立って差別化されているだけでなく、補完的クラウド サービスの広範なエコシステムとの相互接続性も確保されています。」- The Forrester Wave™: AI Foundation Models for Language, Q2 2024
The Forrester Wave™: AI Foundation Models for Language, Q2 2024 を無料でダウンロードできます。
生成 AI はテクノロジーとの関わり方を変える存在です。高度なマネージド モデルがデベロッパーに提供されるようになり、エンドユーザーに向けた革新的なアプリ、エクスペリエンス、エージェントの構築に活かされています。モデルのチューニングも従来のわずか 1% のデータで行えるようになり、これまで以上に手軽になりました。さまざまな面で、生成 AI は加速し続けています。
Google には、AI 研究とイノベーションに深く携わってきた実績があり、これには Transformer アーキテクチャや拡散モデルなど、現在の生成 AI アプリケーションの中核となっている先駆的な取り組みが含まれます。
Gemini はマルチモーダル モデルのファミリーです。その開発は、Google DeepMind や Google Research など、Google のさまざまなチームが参加する大規模なものとなりました。テキスト、コード、画像、音声、動画をシームレスに組み合わせて理解することを目標にゼロから構築された Gemini モデルは、ほぼすべての業界で最先端の AI エージェントの作成に役立てられています。
Gemini は Vertex AI を介してお客様に提供されています。Vertex AI は、ML モデルの開発、デプロイ、モニタリングを大規模に行うための Google Cloud のフルマネージド統合プラットフォームです。生成 AI モデルと予測 AI モデルの両方をサポートしているため、お客様はエンタープライズ対応のチューニング機能、グラウンディング機能、モニタリング機能、推論機能を使用して、Gemini やその他の AI モデルをカスタマイズしてデプロイできます。また、業界最先端の AI インフラストラクチャと使いやすいツールを利用して AI エージェントを構築できます。
最先端のパフォーマンス
エンタープライズのお客様は、次の Gemini モデルを Vertex AI を介して利用できます。
-
Gemini 1.5 Pro: 今年に入って Google が発表した Gemini 1.5 Pro は、業界トップクラスの 100 万トークンという画期的なコンテキスト ウィンドウを備え、大量のドキュメントやコードベースを、あるいは動画全体を単一のプロンプトで正確に処理できます。非常に大規模なコードベースやドキュメント ライブラリの分析など、より大きなコンテキスト ウィンドウが必要となるユースケースに応えるため、コンテキスト ウィンドウが最大 200 万トークンの Gemini 1.5 Pro の試用が近々開始される予定です(こちらで順番待ちリストに登録できます)。
-
Gemini 1.5 Flash: 100 万トークンという画期的なコンテキスト ウィンドウを提供すると同時に、1.5 Pro より軽量です。スピードと規模の両立をコンセプトとした設計により、チャット アプリケーションなどのタスクに効率的に対応できます。
-
Gemini 1.0 Pro: 自然言語タスク、マルチターンのテキストとコードチャット、およびコード生成の処理のために設計されています。新しいバージョンが一般提供となりました。レイテンシと品質が改善され、教師ありチューニング機能が追加されています。
-
Gemini 1.0 Pro Vision: マルチモーダル プロンプトをサポートします。プロンプト リクエストにテキスト、画像、動画を含めて、テキストまたはコードのレスポンスを取得できます。
Gemini 1.0 Pro だけでなく、Gemini 1.5 Pro と Gemini 1.5 Flash も一般提供を開始したことを発表いたします。
Vertex AI
Vertex AI を使用すると、Gemini をカスタマイズしてデプロイし、新しい差別化されたアプリケーションを構築できます。現段階ではテキスト、コード、画像、動画の情報の処理が可能です。Vertex AI を使用すると、デベロッパーは次のことができるようになります。
-
Gemini を探索して使用、または Google、オープンソース、サード パーティの 130 以上のキュレーション リストからモデルを選択: これらのモデルは、エンタープライズ向けに Google が定義している安全性と品質の厳格な基準を満たしています。デベロッパーは、使いやすい API の形式でモデルにアクセスし、アプリケーションに素早く組み込むことができます。
-
モデルの動作をカスタマイズ: チューニング ツールを使用してトレーニング データを補強したり、必要に応じてモデルの重みを調整したりすることによって、特手の分野や会社の専門などに合わせてモデルの動作をカスタマイズできます。Vertex AI は、プロンプト設計、Low Rank Adaptation(LoRA)などのアダプタベースのチューニング、蒸留など、さまざまなチューニングの手法を提供しています。Google が提供する「人間からのフィードバックを用いた強化学習」(RLHF)のサポートを通じて、ユーザーのフィードバックを収集してモデルを改善することもできます。
-
ツールによってモデルを補強: Gemini Pro を特定のコンテキストやユースケースに適応させることができます。Vertex AI Extensions とコネクタを使うと、デベロッパーは Gemini Pro を外部 API にリンクしてトランザクションなどを実行したり、外部のソースからデータを取得したり、コードベース内の関数を呼び出したりできます。また、Vertex AI では、独自のデータソースを使って基盤モデルの出力をグラウンディングすることができ、モデルの回答の精度と関連性を向上させるのに役立ちます。独自の構造化データと非構造化データに対するグラウンディングと、Google 検索テクノロジーによるグラウンディングが可能です。
-
本番環境のモデルの管理とスケーリング: 専用のツールを使用して本番環境のモデルの管理とスケーリングを行い、アプリケーションを一度構築すれば、簡単にデプロイとメンテナンスができるようにします。お客様は、モデルを比較するオンデマンドの自動ツールである Automatic side-by-side(AutoSxS)を使用してモデルを評価できます。AutoSxS は、手作業によるモデル評価よりも高速でコスト効率に優れているだけでなく、新しい生成 AI のユースケースに対応できるよう、さまざまなタスクの仕様に応じたカスタマイズが可能です。
-
ローコード / ノーコード環境で AI エージェントを構築: Vertex AI Agent Builder を使うと、あらゆる ML スキルレベルのデベロッパーが Gemini モデルを使用して本番環境グレードの効果的な AI エージェントを作成でき、かかる時間もこれまでの週単位や月単位から数時間あるいは数日に短縮できます。
-
責任を持ってイノベーションを実現: 安全フィルタやコンテンツ管理用 API といった Vertex AI の責任ある AI のためのツールを使用し、モデルが不適切なコンテンツを出力しないようにすることで、デベロッパーは責任を持ってイノベーションを実現できます。
-
データ保護をサポート: Google Cloud に組み込まれているデータ ガバナンスとプライバシー管理でデータの保護をサポートします。データはお客様のものであり、それが変わることはありません。Google がモデルのトレーニングに顧客データを使用することは一切ありません。Vertex AI は、顧客管理の暗号鍵や VPC Service Controls を含む、お客様がデータを単独で管理し続けるためのさまざまなメカニズムを提供しています。
最近のイノベーション
現在も続く Vertex AI のイノベーションは、Google と業界からの選りすぐりのモデルと併せて、エンドツーエンドのモデル構築プラットフォームや、エージェントをより迅速に開発してデプロイするための機能を提供することを意図したもので、すべてエンタープライズ向けのスケーラブルな基盤をベースとしています。最近のイノベーションをご紹介します。
-
Gemma 2: Gemini に使用されているのと同じテクノロジーで、幅広い AI デベロッパーのユースケースに対応できるよう構築された、次世代のオープンモデル ファミリーです。
-
Imagen 3: Google で最も高品質な、テキストからの画像生成モデル。細部まで表現された、写実的で現実感のある画像を生成できます。
-
Batch API: レイテンシの影響を受けにくい大量のテキスト プロンプト リクエストを送信するのに極めて効率的な方法であり、分類と感情分析、データ抽出、説明の生成などのユースケースで利用できます。単一のリクエストで複数のプロンプトをモデルに送信できるため、デベロッパーのワークフローを加速するうえで役立つとともに、費用の削減にもつながりなす。
-
コンテキスト キャッシュ保存: 来月公開プレビュー版になるこの機能を使用すると、キャッシュに保存されたコンテキスト データを積極的に管理して再利用できます。コンテキストが長いほど処理費用は増えることから、長いコンテキストのアプリケーションを本番環境に移行するには費用がかかります。Vertex AI のコンテキスト キャッシュ保存を利用すれば、キャッシュに保存されたデータを利用できるので、費用を大幅に削減できます。
-
生成制御機能: 今月中に公開プレビュー版として利用可能になるこの機能では、Gemini モデルの出力を特定の形式やスキーマに応じて定義できます。ほとんどのモデルでは、明示的に指示したとしても、その出力の形式や構文を保証できません。Vertex AI の生成制御機能により、お客様は事前構成済みのオプション(YAML、XML など)を選択するか、カスタム形式を定義することで、目的とする形式の出力を選択できるようになります。事前構築済みオプションとして JSON をすでに提供中です。
-
LlamaIndex on Vertex AI: データの取り込みと変換からエンベディング、インデックス登録、取得、生成までの検索拡張生成(RAG)プロセスを簡素化します。これにより Vertex AI のお客様は、Google のモデル、AI に最適化されたインフラストラクチャ、LlamaIndex のシンプルで柔軟なオープンソース データ フレームワークを活用して、カスタム データソースを生成モデルに接続できます。
-
Genkit: Firebase が発表した、プロダクション レディな AI エージェントの開発、デプロイ、モニタリングを簡素化するためのオープンソース TypeScript / JavaScript フレームワークです。これにより Firebase デベロッパーは、Vertex AI プラグインを使用して Gemini や Imagen 2 などの Google モデルとテキスト エンベディングを利用できるようになりました。
-
Google 検索によるグラウンディング: 一般提供を開始。インターネット上の世界中の知識、幅広いトピック、最新情報にモデルを接続できます。Gemini モデルを Google 検索によってグラウンディングすることで、Google の最新の基盤モデルを組み合わせた総合的な力と、最新かつ高品質の情報へのアクセスを得られ、応答の完全性と精度を大幅に向上させることができます。
Gemini モデルを活用したイノベーションの事例
Vertex AI は好調に導入されており、昨年上半期から下半期にかけて API リクエストが 6 倍近く増加しています。なかでも Gemini モデルはマルチモーダルで、複雑な推論を非常によく処理できるため、Gemini モデルを使用したお客様の素晴らしい取り組みには目を見張るものがあります。
Samsung: Samsung は最近、Galaxy S24 シリーズが Gemini モデルを搭載した初のスマートフォンであることを発表しました。Samsung ネイティブのアプリから搭載が開始され、Notes、ボイスレコーダーなどで要約機能を利用できます。Samsung は、Vertex AI に組み込まれたセキュリティ、安全性、プライバシーによってエンドユーザーが保護されていると確信しています。
Jasper: 企業のマーケティング チームが優れたブランド コンテンツとキャンペーンを大規模に作成できるようにする AI マーケティング プラットフォームである Jasper は、顧客向けのマーケティング キャンペーンのコンテンツを迅速に生成するために Gemini モデルを使用しています。これにより、ブランドボイスとマーケティングのガイドラインを確実に守りながら、高品質なコンテンツとより迅速な行動を両立できるようになりました。
Quora: よく使われている質疑応答プラットフォームである Quora は、Gemini を使用して AI チャット プラットフォーム「Poe」でのクリエイターによる収益化を支援しています。Poe では、ユーザーが AI 搭載の多種多様な bot を探索できます。Gemini を使うことで Poe のクリエイターは、ライティング支援、コード生成、パーソナライズされた学習など、さまざまなユースケースにわたってカスタム bot を構築できます。
Google は、このたび「The Forrester Wave™: AI Foundation Models for Language, Q2 2024」レポートおよび「The Forrester Wave: AI Infrastructure Solutions, Q1 2024」レポートにおいてリーダーに選出されたことを大変光栄に思います。これまで、お客様のお役に立つために、長年にわたる AI の研究開発から得た専門知識をモデル、超大規模なインフラストラクチャ、Vertex AI 機能の構築に注ぎ込んできました。今後も AI 分野における研究を続け、イノベーションをお届けできるよう取り組んでまいります。
「Google は、AI インフラストラクチャの膨大なキャパシティ、精鋭揃いの多数の AI 研究者、拡大する Google Cloud 利用企業のお客様など、AI 市場をリードするために必要なすべての要素を備えています。」- The Forrester Wave™: AI Foundation Models for Language, Q2 2024
レポートの全文については、「The Forrester Wave™: AI Foundation Models for Language, Q2 2024」をご覧ください。
- Cloud AI, Product Management, Sr. Director, Warren Barkley