Vertex AI を最もエンタープライズに対応した生成 AI プラットフォームに
Amin Vahdat
VP/GM, Machine Learning, Systems, and Cloud AI, Google Cloud
※この投稿は米国時間 2024 年 6 月 28 日に、Google Cloud blog に投稿されたものの抄訳です。
Google Cloud は本日、Vertex AI によるモデルとエンタープライズ プラットフォーム機能の大幅な刷新を発表しました。これらは、エンタープライズ AI プラットフォームである Vertex AI のチューニング、拡張、カスタマイズ、スケール、信頼性、セキュリティに関する多数の画期的な機能に基づいて構築しており、企業は魅力的な AI エージェントをより迅速に展開できます。
Gemini 1.5 Flash: 市場をリードするコストパフォーマンスと低レイテンシ
2024 年 5 月にパブリック プレビューを発表し、現在一般提供中の Gemini 1.5 Flash は、低レイテンシ、競争力のある価格設定、画期的な 100 万トークンのコンテキスト ウィンドウを備えており、リテールのチャット エージェントや、ドキュメント処理やリポジトリ全体を合成できるリサーチ エージェントなど、大規模なさまざまなユースケースに最適なオプションとなっています。
まず最も重要なこととして、Gemini 1.5 Flash の強力な機能、低レイテンシ、およびコスト効率は、すぐにお客様から高い評価を受けることができました。Gemini 1.5 Flash は GPT 3.5 Turbo などといった同等のモデルよりも多くの魅力的な利点を提供しています。
-
100万トークンのコンテキストウィンドウ (GPT-3.5 Turbo が提供するコンテキストウィンドウの約 60 倍)
-
10,000 文字の入力の際、GPT-3.5 Turbo より平均 40% 高速1
-
32,000 文字を超える入力でもコンテキスト キャッシュが有効で、入力価格は GPT-3.5 Turbo より最大 4 倍安い
Vertex AI の Gemini 1.5 Flash を今すぐ使い始めたいお客様は、こちらをクリックしてください。
Gemini 1.5 Pro: 業界トップクラスの 200 万コンテキストの機能を搭載
Gemini 1.5 Pro は、最大 200 万トークンのコンテキスト ウィンドウを搭載し、他のモデルでは対応できないユニークなマルチモーダル ユースケースを得ることができます。
わずか 6 分間の動画を処理するのに 10万を超えるトークンが必要であり、大規模なコードベースでは 100 万トークンを超えることもあります。無数のコード行からバグを見つけたり、研究ライブラリから適切な情報を見つけたり、何時間もの音声や動画を分析したりする場合など、Gemini 1.5 Pro は組織が新たなユースケースを開拓する際に役立っています。
200 万トークンのコンテキスト機能を備えた Gemini 1.5 Pro はこちらより今すぐ使い始めることができます。
Imagen 3: より高速な画像生成と優れたプロンプト理解
Imagen 3 は、Google の最新の画像生成基盤モデルです。ラピッド プロトタイピングとイテレーションの生成を 40% 以上高速化し、より優れたプロンプトの理解と指示への追従性の向上、フォトリアリスティックな人物群像の生成、画像内のテキスト レンダリング制御の向上など、Imagen 2 と 比較した複数の改善点に加えて、卓越した画質を提供します。
早期アクセスが可能なお客様向けに Vertex AI のプレビュー版がリリースされ、さらに Imagen 3 には、多言語サポート、Google DeepMind の SynthID 電子透かしなどの組み込みの安全機能、および複数のアスペクト比のサポートも含まれています。
Imagen 3 で生成した画像
お客様はこちらをクリックして Vertex AI の Imagen 3 の早期アクセスを申し込むことができます。
サードパーティ モデルとオープン モデル: Vertex AI でモデルの選択肢を拡大
Google Cloud では、Vertex AI で利用できる厳選されたファーストパーティ、オープン、およびサードパーティのモデルを通じて、お客様の選択肢とイノベーションを支援することに尽力しています。この度、先日 Anthropic が新たにリリースした「Claude 3.5 Sonnet」モデルを Vertex AI に追加しました。お客様は、Google Cloud の Claude 3.5 Sonnet で本番環境での試用やデプロイを実行できます。2024 年夏には、Mistral とのパートナーシップを拡大し、Mistral Small、Mistral Large、Mistral Codestral が Vertex AI Model Garden に追加される予定です。
2024 年前半、Google Cloud は、Gemini モデルと同じ研究と技術に基づいて構築された、軽量で最先端のオープンモデルファミリーである Gemma を発表しました。この度、世界中の研究者や開発者向けに Gemma 2 を正式にリリースします。90 億と 270 億の両方のパラメータサイズで利用できるGemma 2 は、第 1 世代よりもはるかに強力かつ効率的になり、安全性が大幅に向上しています。 お客様は、2024 年 7 月 から Vertex AI の Gemma 2 にアクセスすることができます。
より低コストに:Gemini 1.5 Pro と Gemini 1.5 Flash にコンテキスト キャッシュを使用
本日より、Gemini 1.5 Pro モデルと Gemini 1.5 Flash モデルでコンテキスト キャッシュをパブリック プレビューで展開し、お客様は Gemini の大規模なコンテキスト ウィンドウを効率的に活用できるようになります。コンテキストが長くなると、コンテキストの長いアプリケーションの応答を取得するのにコストがかかるだけでなく、パフォーマンスが遅くなり、運用環境へのデプロイが困難になる場合もあります。Vertex AI コンテキスト キャッシュは、頻繁に使用されるコンテキストのキャッシュ データを活用することで、コストを 76% 削減させるのに役立ちます。現在、Google はコンテキスト キャッシュ API を提供する唯一のプロバイダです。
予測可能なパフォーマンス:Gemini モデルのプロビジョニングされたスループット
本日より、許可リストに登録されているお客様を対象に、プロビジョニングされたスループットを活用することで、Gemini 1.5 Flash などの Google のファーストパーティ モデルの使用を責任を持ってスケーリングし、容量と価格の両方を保証します。Vertex AI のこの機能は、お客様の本番環境のワークロードに予測可能性と信頼性をもたらし、生成 AI ワークロードを積極的にスケーリングするために必要な保証を提供します。
エンタープライズ トゥルースを提供:Google 検索によるグラウンディングと、サードパーティ データによるグラウンディング
エンタープライズ対応には、モデルだけでなく、事実性を最大化し、ハルシネーションを最小限に抑える必要があります。これは、データガバナンスや主権などの厳しい企業対応基準を満たしながら、ウェブ、ファーストパーティ、サードパーティの事実とデータに基づいてモデル出力を行うことを意味します。
Google I/O では、Vertex AI での Google 検索によるグラウンディングの一般提供を発表しました。企業は Gemini の出力を Google 検索のグラウンディングで強化し、モデルは新鮮で高品質の情報にアクセスできるようになります。さらにお客様は、強化された Gemini モデルを AI エージェントに簡単に統合できます。
Google 検索でのグラウンディングはこちらより利用開始できます。
さらに、Vertex AI は 2024 年第 3 四半期より、特殊なサードパーティ データを使用して AI エージェントをグラウンディングできる新しいサービスの提供を発表しました。企業はこれにより、サードパーティ データを生成 AI エージェントに統合し、独自のユースケースを創出し、AI 体験全体で企業の真実性を高めることができます。当社は、Moody’s、MSCI、Thomson Reuters、Zoominfo などの主要プロバイダーと協力して、このサービスにデータを提供しています。
「Google Cloud のサードパーティ データ グラウンディング サービスは、KPMG と当社のクライアントに新たなアプリケーションの機会をもたらします。業界リーダーの専門的なサードパーティ データを当社の生成 AI 製品にシームレスに統合することで、インサイトを得るまでの時間を短縮し、より多くの情報に基づいた意思決定を促進、最終的には信頼性の高いデータソースを使用してより大きな価値を提供することができます。」- KPMG、グローバル財務兼法務 CTO、Brad Brown 氏
より事実に基づく結果:高忠実度モードによるグラウンディング
金融サービス、ヘルスケア、保険などのデータ集約が重要な業界では、内部モデルの世界のナレッジベースではなく、提供されたコンテキストのみから生成された応答を必要とする生成 AI のユースケースが多数あります。本日実験的に発表された高忠実度モードのグラウンディングは、複数のドキュメントにわたる要約、財務データのコーパスに対するデータ抽出、または事前定義されたドキュメント セット全体にわたる処理などのグラウンディングのユースケースをサポートするために設計されています。 高忠実度モードは、お客様から提供されたコンテキストのみを使用して回答を生成するようにチューニングされた Gemini 1.5 Flash モデルのバージョンにより強化されており、事実性の高い応答を保証します。
データ主権のための最適の選択肢 - 安全に保存し、リージョンで制限して ML 処理するための Data Residency
特に規制の厳しい業界のお客様は、生成 AI 機能を使用する際に、データの保存場所と処理場所の制御を求めています。これらのデータ主権の要件を満たすために、23 か国 (のうちスペイン、イタリア、イスラエル、スイス、ポーランド、フィンランド、ブラジル、インド、台湾、香港、オーストラリア、サウジアラビア、カタールの 13 か国は 2024 年に追加) で保存データの Data Residency を保証しており、さらに関連する ML 処理を米国と EU に制限することも追加で保証しています。現在、さらに 8 か国に ML 処理のコミットメントを拡大できるよう取り組んでいます。
今すぐ Vertex AI を使い始めましょう
Google はお客様からの評判のほかにも、Forrester Research の「The Forrester Wave™: AI Foundation Models for Language, Q2 2024」でリーダーに選出、Gartner® の「2024 Magic Quadrant for Cloud AI Developer Services」2 および「2024 Magic Quadrant™ for Data Science and Machine Learning Platforms」でもリーダーに選出されるなど、アナリストからも高い評価を得ています。
Vertex AI が組織にどう役立つかについてはこちらを、Google Cloud のお客様が生成 AI でどのようにイノベーションを起こしているかについては、世界をリードする組織による 101 の実例をご覧ください。
-ML、システム、クラウド AI 担当バイス プレジデント兼ゼネラル マネージャー、Amin Vahdat
- 2024 年 6 月 14 日に Gemini チームが発表した研究「Gemini 1.5: Unlocking multimodal understanding across millions of token of context」より
- ガートナー、Magic Quadrant for Cloud AI Developer Services、Jim Scheibmeir、Arun Batchu、Mike Fang、2024年4月29日。ガートナー、Gartner Magic Quadrant for Data Science and Machine Learning Platforms、Afraz Jaffri、Aura Popa、Peter Krensky、Jim Hare、Raghvender Bhati、Maryam Hassanlou、Tong Zhang、2024 年 6 月 17 日。GARTNER は、米国およびその他の国における Gartner, Inc. またはその関連会社の登録商標およびサービスマークであり、MAGIC QUADRANT は、Gartner, Inc. またはその関連会社の登録商標であり、許可を得て使用しています。All rights reserved. Gartner は、リサーチに関する発行物に掲載されている特定のベンダー、製品、サービスを推奨するものではありません。また、最高の格付けまたはその他の評価を得たベンダーのみを選択するように助言するものでもありません。Gartner のリサーチに関する発行物は、Gartner のリサーチ組織の見解により構成されるものであり、事実の表明とは解釈されません。Gartner は、明示または黙示を問わず、商品性や特定の目的への適合性を含め、本リサーチに関連したいかなる保証も行いません。