フロントエンド サービスとバックエンド サービス、バッチジョブの実行、LLM のホスト、ワークロードのキュー処理を行います。インフラストラクチャを管理する必要はありません。
毎月 200 万件のリクエストを無料でご利用いただけます。
機能
お好みの言語、フレームワーク、ライブラリを使用してコードを記述し、それをコンテナとしてパッケージ化して「gcloud run deploy」を実行すれば、本番環境での稼働に必要なものがすべて揃った状態でアプリがデプロイされます。コンテナの構築は完全に任意です。Go、Node.js、Python、Java、.NET Core、Ruby を使用している場合は、使用している言語のベスト プラクティスに従って、コンテナをビルドするソースベースのデプロイ オプションを使用できます。
イベント ドリブンな長時間実行サービスを所有していても、データを処理するコンテナ化されたジョブをデプロイしていても、Cloud Run はコンテナをゼロから自動的にスケールアップ / スケールダウンします。つまり、料金が発生するのはコードが実行されているときだけです。
(現在公開プレビュー版)AI 推論ワークロードを実行するための NVIDIA L4 GPU へのオンデマンド アクセスを提供します。最大 90 億個のパラメータを持つモデルで高速なトークンレートを提供します。
(現在は公開プレビュー版)Cloud Run で直接関数を作成してデプロイし、基盤となるサービス構成を完全に制御できます。
Cloud Run は、Buildpack を使用すると、マシンに Docker をインストールしなくてもソースから直接デプロイできるため、本番環境への移行方法を自動化することもできます。新しい commit が Git リポジトリの特定のブランチに push された際に、自動的にコードのビルドとデプロイが行われるようにすることができます。
Cloud Run ジョブを使用すると、複数のインスタンスを並列稼働してバッチ処理を実行できます。HTTP リクエストに応答しない実行から完了までのジョブをすべてサーバーレス プラットフォームで実行できます。ジョブは最大 24 時間実行できます。
VPC ネットワークにトラフィックを直接送信し、VPC で実行しているすべてのサービスに接続します。
仕組み
Cloud Run は、フルマネージド プラットフォームで、Google のスケーラブルなインフラストラクチャ上で直接コードを実行できます。Cloud Run はシンプルで自動化されており、生産性を高めるように設計されています。
一般的な使用例
Cloud Run を使用してウェブサイトをデプロイしてホストする
お好みのスタックを使ってウェブアプリを構築し、SQL データベースにアクセスして動的な HTML ページをレンダリングします。 Cloud Run では、ウェブサイトでリクエストを受信していないときにゼロにスケーリングすることもできます。
この Codelab では、まず Cloud Build を介して作成された Docker イメージを作成し、それを Cloud Shell でトリガーします。次に、Cloud Shell でコマンドを使用して、そのイメージを Cloud Run にデプロイします。
Cloud Run を使用してウェブサイトをデプロイしてホストする
お好みのスタックを使ってウェブアプリを構築し、SQL データベースにアクセスして動的な HTML ページをレンダリングします。 Cloud Run では、ウェブサイトでリクエストを受信していないときにゼロにスケーリングすることもできます。
この Codelab では、まず Cloud Build を介して作成された Docker イメージを作成し、それを Cloud Shell でトリガーします。次に、Cloud Shell でコマンドを使用して、そのイメージを Cloud Run にデプロイします。
Cloud Run GPU を使用して LLM をホストする
Cloud Run で、Llama 3.1、Mistral、Gemma 2 などの任意の LLM を使用して、リアルタイムの AI 推論を実行します。また、画像認識、動画のコード変換、ストリーミングなど、コンピューティング負荷の高いアプリケーションにも最適です。
Cloud Run GPU を使用して LLM をホストする
Cloud Run で、Llama 3.1、Mistral、Gemma 2 などの任意の LLM を使用して、リアルタイムの AI 推論を実行します。また、画像認識、動画のコード変換、ストリーミングなど、コンピューティング負荷の高いアプリケーションにも最適です。
料金
Cloud Run の料金の仕組み | 料金は無料枠が設定された従量課金制で、100 ミリ秒単位で切り上げられます。使用しない場合は料金は発生しません。 | |
---|---|---|
SKU | 割引なしの無料枠を超える料金 | 無料 |
CPU | $0.00001800 / vCPU 秒 | 毎月最初の 240,000 vCPU 秒は無料 |
メモリ | $0.00000200 / GiB 秒 | 毎月最初の 450,000 GiB 秒は無料 |
ビジネスケース
Cloud Run で、他の企業が費用の削減、ROI の向上、イノベーションの促進を実現した方法をご覧ください
BBC: エンド ツー エンドのサーバーレス アーキテクチャを使用して、ニュース記事のトラフィックの急増に対応
BBC は 150~200 のコンテナ インスタンスを実行していましたが、劇的なトラフィックの急増時には 1,000 を超えることもありました。「それでも、インフラストラクチャは正常に機能しました。」
全文を読む主なお客様
よくある質問
Cloud Run を使用すると、VM ベースや Kubernetes ベースのデプロイに伴うオーバーヘッドなしでウェブサイトを管理、デプロイできます。管理が簡素化されるだけでなく、ウェブサイトでリクエストを受信していないときは「ゼロにスケール」できます。
Cloud Run は、App Engine のエクスペリエンスを改善するために設計されており、App Engine スタンダード環境と App Engine フレキシブル環境の両方の多くの最良の機能が組み込まれています。 Cloud Run サービスは、ウェブサイトのデプロイやホスティングなど、App Engine サービスと同じワークロードを処理できますが、Cloud Run はこれらのサービスをより柔軟に実装できます。