Cloud Run ジョブで GPU を使用してバッチ推論を実行する

Cloud Run ジョブで Meta の Llama 3.2-1b LLM と vLLM を使用してバッチ推論を実行し、その結果を Cloud Run ボリュームマウントを使用して Cloud Storage に直接書き込むことができます。

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2025-10-19 UTC。