コンテンツに移動
AI & 機械学習

Google Cloud、Gemini モデルへのアクセスを Vertex AI ユーザーにも拡大

2024年2月16日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Blog_Gemini_Vertex.max-2500x2500.jpg
Google Cloud Japan Team

Gemini 1.5 モデル をお試しください。

Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。

試す

※この投稿は米国時間 2024 年 2 月 15 日に、Google Cloud blog に投稿されたものの抄訳です。

Google は 2023 年 12 月、これまでで最も高性能かつ汎用的なモデルである Gemini を発表しました。発表以降、サムスン電子やパロアルトネットワークスなどのお客様が、Vertex AI の Gemini モデルを活用し、洗練された AI エージェントを構築して、生産性やパーソナライズされた学習体験などを向上してきました。Google Cloud は本日、新たな機能アップデートと利用可能地域の拡大を発表し、より多くの Gemini モデルをご提供します。

  • Gemini 1.0 Pro は、さまざまな AI タスクで広範囲にご利用いただくために最適なモデルであり、本日 Vertex AI をご利用のすべてのユーザーを対象に一般提供を開始しました。開発者は Gemini Pro を本番環境での構築に活用できます。1.0 Pro は、コンテンツ生成、編集、要約、分類など多くの AI タスクを、最適な品質、パフォーマンス、コストで実現します。
  • Gemini 1.0 Ultra は、複雑なタスク向けの最も洗練された高性能モデルで、Vertex AI の一部のお客様向けに一般提供を開始しました。1.0 Ultra は、複雑な指示、コード、推論、多言語などの分野で特に高い性能を発揮し、高品質なアウトプットが可能になるよう最適化されています。

さらに本日、より効率的なアーキテクチャでパフォーマンスの向上を実現する、新世代の Gemini モデル Gemini 1.5 を発表しました。

早期テスト用にリリースする最初の Gemini 1.5 モデルは、Gemini 1.5 Pro で、Vertex AI 上で一部のお客様にプレビュー版をご利用いただけるようになりました。Gemini 1.5 Proは、中規模のマルチモーダル モデルで、幅広いタスクでのスケーリングに最適化されており、これまでで最大モデルである 1.0 Ultra と同レベルのパフォーマンスを発揮します。1.5 Pro は大規模基盤モデルとしてこれまでで最長のコンテキスト ウィンドウに対応する、実験的なブレークスルーを兼ね備えました。さらにアプリケーションは本番環境で 100 万トークンまで実行できます。これにより、1 時間の動画、11 時間の音声、30,000 行以上のコードベース、70 万以上の単語など、膨大な量の情報を一度に処理することが可能となります。

コンテキスト ウィンドウを大きくすることで、モデルはより多くの情報を参照し、ストーリーの流れを把握し、長い文章でも一貫性を維持し、よりコンテキストに富んだ回答を生成することができます。1.5 Pro では、以下のことが可能です:

  • コードのエラー、非効率性、矛盾など、開発者が見落としがちな詳細を理解し、推論することを含め、モデルをファインチューニングしなくても 1 回のプロンプトでコード ライブラリ全体を正確に分析します。
  • 契約書の詳細な比較や、アナリスト レポート、調査研究、複数の書籍のテーマや意見の統合と分析など、非常に長い文書を横断して推論します。
  • スポーツの映像から特定のシーンを探し出したり、ビデオ会議のサマリーから詳細な情報を見つけ、質疑応答を的確にサポートするなど、何時間分もの動画コンテンツを分析して比較します。
  • チャットボットは、複雑なタスクや何度もフォローアップが必要な場合でも、詳細を忘れることなく長い会話を続けることができます。
  • モデルの複雑なファインチューニングを行わずに、関連するユーザー情報をプロンプトに取り込むことで、ハイパー パーソナライズされた体験を実現します。

革新的な Gemini モデルの活用事例

Vertex AI の導入が拡大し、2023 年上半期から下半期にかけてAPI リクエストは 6 倍近く増加しました。マルチモーダルで、複雑な推論を処理できる Gemini モデルは、多くのお客様により革新的な方法でご活用いただいています。

サムスン電子:サムスンは、「Galaxy S24 シリーズ」に Gemini モデルを搭載、Gemini モデルを導入した初のスマートフォンとなりました。ユーザーは、サムスン純正のアプリを始め、ノートやボイスレコーダーなどで要約機能を利用できます。また、Vertex AI に組み込まれたセキュリティ、安全性、プライバシーによってエンドユーザーへの保護が提供されます。

パロアルトネットワークス:パロアルトネットワークスは、ユーザーがより直感的に製品ポートフォリオと接し、カスタマーサポートに費やす時間を短縮するインテリジェントな製品エージェントなど、さまざまなユースケースで Gemini モデルをテストしています。

Jasper:企業のマーケティング チームのコンテンツ作成、および再パッケージ化を支援する AI 製品を提供する Jasper は、Gemini モデルを使用して、ブログや製品説明を自動生成しています。ブランド ボイスとマーケティング ガイドラインの遵守と高品質なコンテンツ制作を両立し、より迅速に作業を進めることができるようになりました。

Quora:Q&A プラットフォームである Quora は、Gemini を利用して AI チャットの Poe の開発者の収益化を支援しています。Gemini は、Poe の開発者が、文章作成支援、コード生成、パーソナライズされた学習体験など、様々なユースケースでのカスタム ボットの構築を可能にしています。

Vertex AI の Gemini API で、本番環境のアプリケーションを構築

Vertex AI の Gemini API は、テキスト、コード、画像、動画などのモダリティにまたがる情報を同時に処理できるため、開発者は次世代の AI エージェントやアプリを構築できます。組織と開発者はエンタープライズ グレードのアプリケーションを構築し、本番稼動できます。Vertex AI は、モデル、ツールおよびインフラストラクチャのための統合された単一のプラットフォームを提供する唯一のクラウド AI プラットフォームです。Gemini モデルで構築したアプリケーションは、容易に展開および保守が可能です。Vertex AI を使用することで、以下が可能となります。

ビジネスニーズに合わせて Gemini モデルをカスタマイズできます。Vertex AI の Gemini API は、Low-Rank Adaptation(LoRA)のようなアダプタ ベースのチューニングをサポートするため、開発者が効率的かつ低コストな方法でモデルをカスタマイズできます。人間からのフィードバックを用いた強化学習(RLHF)や蒸留などの追加のカスタマイズ技術は、今後数か月のうちに Gemini API に追加予定です。

Gemini モデルの回答を最新の情報で補強し、モデルが実世界で行動を起こすことを可能にします。フルマネージドなグラウンディングのサポートにより、開発者は、企業独自のデータを使用して、Gemini モデルの回答の精度と関連性を向上させることができます。一般提供を開始した関数呼び出しにより、開発者は Gemini モデルを外部 API に接続し、トランザクションやその他のアクションを実行することができます。

Gemini は、アプリケーションを構築した後、容易に展開および保守できるようにするために構築されたツールによって、本番環境で管理および拡張することができます。Vertex AI は、生成 AI モデルの自動評価ツールである Automatic Side by Side を提供します。この機能により、開発者は Gemini のパフォーマンスを理解し、そのフィードバックに基づいてプロンプトの調整やチューニングを行うことができます。

最小限のコーディングの専門知識で、Gemini モデルを使って検索エージェントや会話エージェントを構築できます:

  • Vertex AI Search は、Google 検索と同等の情報検索と回答生成システムを開発者に提供します。Gemini モデルのサポートにより開発者は、より強固なグラウンディング、正確な引用、適切な回答を備えた検索アプリケーションを構築することができます。
  • Vertex AI Conversation は、Gemini モデルを使用して、洗練された 生成 AI による会話型チャットボットを構築する機能を提供します。Gemini の高度な推論とマルチモーダル機能により、開発者はアプリケーションにおいて、よりパーソナライズされた、有益かつ魅力的な会話型のAI 体験を提供できます。

Gemini の時代は始まったばかり

開発者は、Vertex AI のエンタープライズ グレードのモデル強化、テスト、デプロイメント、および管理ツールを利用しプロダクション グレードのアプリケーションを構築することができます。さらに開発者は、API キーでアプリのプロトタイプを作成し、迅速に起動するための無料のウェブベースの開発者ツールである Google AI Studio の API で Gemini モデルをご体験いただけます。すべての新しい Gemini モデルが利用可能になった今、新世代のインテリジェントなアプリやエージェントの開発が進むことを期待しています。しかし、Gemini の時代は始まったばかりです。最先端の Gemini モデルにご興味をお持ちのお客様は、信頼できるテスターとして登録してください。また、2024 年 4 月にラスベガスで開催する Google Cloud Next '24 にぜひご参加ください。最新の AI に関するニュース、製品や戦略については Google Cloud のイベントでご覧ください。

- Cloud AI, VP & GM, Burak Gokturk

投稿先