設定 Cloud Run 服務

本頁面提供 Cloud Run 服務的設定選項總覽。

避免冷啟動並縮短延遲時間

您可以設定執行個體數量下限,避免應用程式冷啟動,並縮短應用程式延遲時間。請注意,設定執行個體數量下限會產生費用。詳情請參閱「為服務設定執行個體數量下限」。

容量

您可以控管服務可使用的記憶體CPU並行上限

使用帳單設定控管收費方式,您可以選擇按要求收費,只有在執行個體處理要求時才付費,也可以選擇支付執行個體整個生命週期的費用。

環境變數

您可以建立鍵/值組合,供 Cloud Run 服務使用。詳情請參閱「為服務設定環境變數」。

執行環境

Cloud Run 有兩種執行環境。瞭解兩種執行環境之間的差異

GPU

如需代管 AI 工作負載 (例如推論模型和模型訓練),您可以設定含或不含 GPU 的 Cloud Run 服務。

防範高要求量

您可以設定執行個體數量上限執行個體數量下限,控管 Cloud Run 服務建立的執行個體數量,藉此處理要求。這有助於控制費用,並防範異常高的要求量

健康狀態檢查

Cloud Run 可讓您設定兩種健康狀態檢查探針。 其中一個探測會判斷容器何時準備好接受流量,另一個探測則會判斷是否要重新啟動容器。進一步瞭解容器健康狀態檢查

標籤

Cloud Run 標籤是鍵/值配對,可套用至 Cloud Run 服務、修訂版本和 Cloud Run 函式。標籤可協助您整理 Cloud Run 資源,並以所需的精細程度大規模管理費用。

使用 gcloud functions 指令或 Cloud Functions v2 API 為 Cloud Run functions 設定的標籤,會在您在 Cloud Run 中部署函式時,傳播至 Cloud Run。

資源調度

根據預設,Cloud Run 會依據流量和 CPU 使用率,自動擴充至指定或預設的執行個體數量上限。不過,在某些情況下,您可能需要使用手動調整資源配置,設定特定數量的執行個體。

密鑰

您可以搭配 Cloud Run 使用 Secret Manager,安全地儲存 API 金鑰、密碼和其他機密資訊。詳情請參閱「設定密鑰」。

服務身分

Cloud Run 服務身分是服務帳戶,用來做為經過驗證的帳戶,從 Cloud Run 執行個體容器存取Google Cloud API。建議您建立服務帳戶,並決定服務帳戶存取特定 Google Cloud資源所需的最低權限。

逾時

您可以設定 Cloud Run 要求逾時,指定必須傳回回應的時限。

建議

請參閱「透過 Recommender 進行最佳化」,瞭解 Recommender 在 Cloud Run 上提供的最佳化建議。

流量拆分

每次部署或重新部署服務時,系統都會自動建立基礎 Cloud Run 服務的新修訂版本。詳情請參閱「工作階段相依性和流量分配」。

標記服務

標記是可以套用至資源的鍵/值組合,可透過 Cloud Run 控制台進行精細的存取控管。

標記管理員會在機構或專案層級,為 Google Cloud 中的資源建立標記。建立標記之後,您就能將資源是否具備特定標記設為條件,並按照這個條件允許或拒絕政策。詳情請參閱「標記服務」。

磁碟區掛接

透過 Cloud Run 磁碟區掛接,您可以從容器存取儲存在本機檔案系統中的共用資料,例如儲存空間 bucket 或檔案伺服器內容。您可以掛接 Cloud Storage 值區NFS 共用 (例如 Filestore 執行個體),或 Cloud Run 提供的記憶體內檔案系統