フロントエンド サービスやバックエンド サービス、バッチジョブの実行、LLM のホスト、キュー処理ワークロードの実行ができ、インフラストラクチャを管理する必要がありません。
毎月 200 万件のリクエストを無料でご利用いただけます。
機能
お好みの言語、フレームワーク、ライブラリを使用してコードを記述し、それをコンテナとしてパッケージ化して「gcloud run deploy」を実行すれば、本番環境での稼働に必要なものがすべて揃った状態でアプリがデプロイされます。コンテナの構築は完全に任意です。Go、Node.js、Python、Java、.NET Core、Ruby を使用している場合は、使用している言語のベスト プラクティスに従って、コンテナをビルドするソースベースのデプロイ オプションを使用できます。
イベント ドリブンな長時間実行サービスを所有していても、データを処理するコンテナ化されたジョブをデプロイしていても、Cloud Run はコンテナをゼロから自動的にスケールアップ / スケールダウンします。つまり、料金が発生するのはコードが実行されているときだけです。
AI 推論ワークロードを実行するための NVIDIA L4 GPU へのオンデマンド アクセス。GPU インスタンスは 5 秒で起動し、ゼロへのスケーリングが行われます。
Cloud Run で直接関数を作成してデプロイできるため、基盤となるサービス構成の完全な制御が可能になりました。
Cloud Run は、Buildpack を使用すると、マシンに Docker をインストールしなくてもソースから直接デプロイできるため、本番環境への移行方法を自動化することもできます。新しい commit が Git リポジトリの特定のブランチに push された際に、自動的にコードのビルドとデプロイが行われるようにすることができます。
Cloud Run ジョブを使用すると、複数のインスタンスを並列稼働してバッチ処理を実行できます。HTTP リクエストに応答しない実行から完了までのジョブをすべてサーバーレス プラットフォームで実行できます。ジョブは最大 24 時間実行できます。
VPC ネットワークにトラフィックを直接送信し、VPC で実行しているすべてのサービスに接続します。
一般的な使用例
Cloud Run でウェブサイトをデプロイしてホストする
お好みのスタックを使ってウェブアプリを構築し、SQL データベースにアクセスして動的な HTML ページをレンダリングします。 Cloud Run では、ウェブサイトでリクエストを受信していないときは「ゼロにスケール」できます。
この Codelab では、まず Cloud Shell で Cloud Build をトリガーして Docker イメージを作成します。次に、Cloud Shell でコマンドを使用して、そのイメージを Cloud Run にデプロイします。
Cloud Run でウェブサイトをデプロイしてホストする
お好みのスタックを使ってウェブアプリを構築し、SQL データベースにアクセスして動的な HTML ページをレンダリングします。 Cloud Run では、ウェブサイトでリクエストを受信していないときは「ゼロにスケール」できます。
この Codelab では、まず Cloud Shell で Cloud Build をトリガーして Docker イメージを作成します。次に、Cloud Shell でコマンドを使用して、そのイメージを Cloud Run にデプロイします。
Cloud Run GPU で LLM をホストする
Llama 3.1、Mistral、Gemma 2 など、お好みの LLM を使用して Cloud Run でリアルタイムの AI 推論を実行します。画像認識、動画のコード変換、ストリーミングといったコンピューティング負荷の高いアプリケーションにも最適です。
Cloud Run GPU で LLM をホストする
Llama 3.1、Mistral、Gemma 2 など、お好みの LLM を使用して Cloud Run でリアルタイムの AI 推論を実行します。画像認識、動画のコード変換、ストリーミングといったコンピューティング負荷の高いアプリケーションにも最適です。
AI エージェントは、高度な AI モデルとツールを活用して、ユーザーの管理下でユーザーに代わってアクションを実行します。Cloud Run サービスとして実装でき、非同期タスクの管理や、複数のリクエスト / レスポンス サイクルを通じたユーザー インタラクションの促進を可能にします。
AI エージェントは、高度な AI モデルとツールを活用して、ユーザーの管理下でユーザーに代わってアクションを実行します。Cloud Run サービスとして実装でき、非同期タスクの管理や、複数のリクエスト / レスポンス サイクルを通じたユーザー インタラクションの促進を可能にします。
料金
| Cloud Run の料金の仕組み | 料金は無料枠が設定された従量課金制で、100 ミリ秒単位で切り上げられます。使用しなかった場合は料金が発生しません。 | |
|---|---|---|
| SKU | 無料枠を超過した料金(割引なし) | 無料 |
CPU | $0.00001800 / vCPU 秒 | 毎月最初の 240,000 vCPU 秒は無料 |
メモリ | $0.00000200 / GiB 秒 | 毎月最初の 450,000 GiB 秒は無料 |
ビジネスケース
Cloud Run で、他の企業が費用の削減、ROI の向上、イノベーションの促進を実現した方法をご覧ください

Telegraph Media Group: Cloud Run で費用と二酸化炭素排出量を 90% 削減
マイクロサービス アーキテクチャからサーバーレス アーキテクチャに移行したことで、これらのサービスとリソースの実際の使用状況とニーズを把握できるようになりました。
主なお客様








よくある質問
Cloud Run を使用すると、VM ベースや Kubernetes ベースのデプロイに伴うオーバーヘッドなしでウェブサイトを管理、デプロイできます。管理が簡素化されるだけでなく、ウェブサイトでリクエストを受信していないときは「ゼロにスケール」できます。
Cloud Run は、App Engine のエクスペリエンスを改善するために設計されており、App Engine スタンダード環境と App Engine フレキシブル環境の両方の多くの最良の機能が組み込まれています。 Cloud Run サービスは、ウェブサイトのデプロイやホスティングをはじめとして、App Engine サービスと同じワークロードを処理できますが、Cloud Run はこれらのサービスをより柔軟に実装できます。