コンテンツに移動
デベロッパー

コードからクラウドへ: AI エージェントをデプロイするための 3 つのラボ

2026年1月5日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Deploying_agents_module_2.max-2500x2500.png
Mollie Pettit

Developer Relations Engineer

※この投稿は米国時間 2025 年 12 月 20 日に、Google Cloud blog に投稿されたものの抄訳です。

デベロッパーが高性能の AI エージェントを構築しました。ローカルマシンでは正常に動作し、優れた知能を備え、世界に対応する準備ができています。では、このエージェントをノートパソコンのスクリプトの環境から、安全性と拡張性に優れ、信頼性の高い本番環境のアプリケーションに移行するにはどうすればよいでしょうか。Google Cloud にデプロイする方法は複数あり、それぞれでデベロッパーのエクスペリエンスが異なります。

アーキテクチャを Cloud RunGoogle Kubernetes Engine(GKE)Vertex AI Agent Engine のいずれにするかを決めるために詳細を比較する場合は、まず、Google ADK エージェントのデプロイに適切な方法の選択をお読みください。

Google では、ビルドの準備が完了している方向けに、Google Cloud のプロダクション レディな AI に関する学習プログラムの一環として、各デプロイ オプションを実際に体験できる 3 つのハンズオンラボを用意しています。

マネージド ソリューション: Vertex AI Agent Engine

最も簡単な方法で本番環境に移行したいチームは、Vertex AI Agent Engine を使用すると、ウェブサーバーやコンテナを管理する必要がなくなります。Python エージェント向けに最適化されており、細かい設定が不要な環境です。この環境では、エージェントのロジックを定義すると、プラットフォームが実行、メモリ処理、ツール呼び出しを行います。

サーバーレス エクスペリエンス: Cloud Run

運用上のオーバーヘッドなくコンテナの柔軟性を求めるチームの場合、Cloud Run はインフラストラクチャを抽象化するため、エージェントをコンテナとしてデプロイできます。このコンテナは負荷が高くなると自動的にスケールアップし、負荷が低くなるとゼロまでスケールダウンします。

この方法は、Python 以外の言語で構築する必要がある場合、カスタム フレームワークを使用する場合、またはエージェントを既存の宣言型 CI / CD パイプラインに統合する場合に特に有効です。

オーケストレーションされたエクスペリエンス: Google Kubernetes Engine(GKE)

環境を正確に設定する必要があるチームに向けて、GKE は、複雑な環境を管理できるように設計されています。この方法では、AI エージェントがスクリプトとして機能するだけでなく、より広範にオーケストレーションされたクラスタ内のマイクロサービスとして機能することがわかります。

本番環境への移行方法

サーバーレスのスピード、オーケストレーションされた制御、フルマネージドのランタイムのいずれを求めている場合でも、この 3 つのラボで、それらを実現するためのブループリントを確認できます。

今回ご紹介したラボは、Google の公式プログラム「Google Cloud のプロダクション レディな AI」の「エージェントのデプロイ」モジュールの一部です。有望なプロトタイプから本番環境グレードの AI アプリケーションへの移行に役立つコンテンツについては、カリキュラム全体をご覧ください。

ハッシュタグ #ProductionReadyAI で成果を共有し、仲間とつながりましょう。ご利用をお待ちしております。

投稿先