佈建 GPU 並啟用 Vertex AI 預先訓練 API

如「容量規劃和運算需求」一文所述,每項 Vertex AI 服務都需要不同的運算資源,包括圖形處理單元 (GPU)。本頁說明如何佈建 GPU 資源,在 GPU 環境中執行人工智慧 (AI) 和機器學習 (ML) 工作負載。本頁面也會逐步說明如何在 Google Distributed Cloud (GDC) 氣隙裝置上啟用 Vertex AI 預先訓練 API,以便開始導入 Vertex AI 功能。

如要設定 GPU 資源,以及啟用或停用 Vertex AI 預先訓練的 API,大多需要管理員存取權。如果沒有必要權限,請管理員代您啟用 GPU 和 Vertex AI 預先訓練 API。

GDC 氣隙裝置上的 Vertex AI 包含三項 API,分別對應一項預先訓練模型。如要進一步瞭解這些預先訓練模型,請參閱下列說明文件:

您可以使用 GDC 控制台啟用、停用及查看 Vertex AI 預先訓練 API 的端點。

事前準備

如要取得啟用預先訓練 API 所需的權限,請要求機構組織 IAM 管理員或專案 IAM 管理員,在專案命名空間中授予您 AI Platform 管理員 (ai-platform-admin) 角色。

如需這個角色的相關資訊,請參閱「準備 IAM 權限」。 如要瞭解如何授予主體權限,請參閱「授予及撤銷存取權」。

請按照下列步驟佈建 GPU,然後再啟用預先訓練的 API:

  1. 設定專案以使用 Vertex AI
  2. 確認專案已設定適當的連入通訊。
  3. 管理 GPU 工作負載
  4. 登入 GDC 控制台。 如果無法登入,請參閱「如果身分識別提供者無法使用,如何復原裝置」。

啟用預先訓練的 API

您可以使用 GDC 控制台啟用 OCR、Speech-to-Text 和 Vertex AI Translation 預先訓練的 API。

符合必要條件後,請按照下列步驟啟用預先訓練的 API:

  1. 登入 GDC 控制台
  2. 在導覽選單中,依序點按「Vertex AI」>「預先訓練的 API」
  3. 在「預先訓練的 API」頁面中,按一下特定服務的「啟用」,即可啟用該 API。

  4. 在確認對話方塊中,按一下「啟用」。系統會顯示進度訊息。

啟用時間長度不一。這項作業可能需要 15 到 45 分鐘才能完成。

如要查看預先訓練 API 的狀態,請查看服務狀態和端點

停用預先訓練的 API

您可以使用 GDC 控制台停用 OCR、Speech-to-Text 和 Vertex AI Translation 預先訓練的 API。

符合必要條件後,請按照下列步驟停用預先訓練的 API:

  1. 登入 GDC 控制台
  2. 在導覽選單中,依序點按「Vertex AI」>「預先訓練的 API」
  3. 在「預先訓練的 API」頁面中,按一下特定服務的「停用」,即可停用該 API。

  4. 在確認對話方塊中,於文字欄位輸入 disable,確認要執行該動作。然後按一下「停用」。畫面上會顯示進度訊息。

如要查看預先訓練 API 的狀態,請查看服務狀態和端點