AI & 機械学習

Vertex AI Model Garden 向けの組み込みパフォーマンスモニタリング機能のご紹介

2025年3月26日

Kate Brea

Product Manager, Google Cloud Observability

Warren Barkley

Senior Director, Product Management, Google Cloud

※この投稿は米国時間 2025 年 3 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。

このたび、Gemini やその他のマネージド基盤モデル向けにパフォーマンスモニタリング機能とアラート機能が組み込まれたことをお知らせします。これらは、Vertex AI のホームページからご利用できます。

高速で信頼性の高いスケーラブルなアプリケーションを構築するには、生成 AI モデルのパフォーマンスをモニタリングすることが不可欠です。しかし、これらのモデルのパフォーマンスを理解することは容易ではなく、これまでは、指標がどこに保存されているか、それらの指標が Cloud コンソールのどこにあるかを学ぶ必要がありました。

このたび、これらの指標に Vertex AI のホームページから直接アクセスして、モデルの健全性を簡単に確認、把握できるようになりました。Cloud Monitoring に組み込まれているダッシュボードでは、生成 AI モデルの使用状況、レイテンシ、エラー率に関する情報を確認できます。また、リクエストが失敗または遅延した場合にアラートを迅速に構成することもできます。

仕組み

Vertex AI 基盤モデルを使用している場合は、Vertex AI の [ダッシュボード] タブでモデルの全体的な指標を確認できます。また、Cloud Monitoring のすぐに使えるダッシュボードをクリックして、詳細情報を取得したりダッシュボードをカスタマイズしたりできます。ここでは、容量の制約、費用の予測、エラーのトラブルシューティングをより適切に行うことができます。また、障害とその原因を迅速に通知するアラートを簡単に構成することもできます。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/1-_Vertex_Model_Garden_Gif.gif

Vertex AI でのモデルのオブザーバビリティの表示

https://storage.googleapis.com/gweb-cloudblog-publish/images/2-_429_alert.max-2200x2200.png

アラートの構成

たとえば、あなたは会社の SRE として、新しいカスタマーサービス chatbot の稼働時間を確保する責任を担っており、速度低下、エラー、予期しない使用量など、chatbot で発生する可能性のある問題を俯瞰的に把握できるダッシュボードを探しているとします。この場合、適切な指標を探して、それらを表示するダッシュボードを作成する代わりに、Vertex のダッシュボードページにアクセスすることで、大まかな指標を表示できます。また、[すべての指標を表示] をクリックすると、クエリレート、文字とトークンのスループット、レイテンシ、エラーに関する情報を網羅した詳細かつ独自のダッシュボードを表示できます。

次に、モデルが多数のリクエストに対して 429 エラーを返していることに気付いたとします。これは、モデルに関連付けられた ML サービスを提供するリージョンで、お客様全体の合計容量が不足したときに発生します。この問題を解決するには、プロビジョンドスループットを購入する、ML 処理の場所を切り替える、あまり混雑していない時間に緊急でないリクエストをバッチリクエストを使用してスケジュールする、などの方法があります。また、推奨されるアラートをすぐに有効にして、以後、リクエストの 1% 以上が 429 エラーを返す場合に通知するように設定できます。

使ってみる

Vertex AI Model Garden のマネージド生成 AI モデルをご利用の場合は、各プロジェクトの Vertex ダッシュボードページにある [モデルのオブザーバビリティ] タブをご確認ください。[すべての指標を表示] をクリックすると、組み込みのダッシュボードが表示されます。生成 AI ワークロードに関連する推奨アラートを構成するには、Cloud Monitoring の Vertex AI の統合をご確認ください。

-Google Cloud Observability、プロダクトマネージャー Kate Brea

-Vertex、プロダクト管理担当シニアディレクター Warren Barkley

投稿先

AI & 機械学習

Partners

Google Cloud でパートナーが構築した AI セキュリティイノベーションを発表

執筆者: Vineet Bhan • 所要時間: 4 分

AI & Machine Learning

Baseten が AI 推論の費用対効果を 225% 改善した方法

執筆者: Philip Kiely • 所要時間: 4 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/hero_image_gaudiy_horizontal.max-700x700.jpg

Customers

Gaudiy: AI を活用したガンプラのデジラマ画像生成サービスで、IP とファンをつなぐ新たなコミュニティを開拓

執筆者: Google Cloud Japan Team • 所要時間: 3 分

AI & Machine Learning

会話型コマースエージェントで直感的なショッピングエクスペリエンスを提供

執筆者: Sachin Padwal • 所要時間: 3 分

Vertex AI Model Garden 向けの組み込みパフォーマンス モニタリング機能のご紹介