查看 Application Integration 支援的連接器

Vertex AI - 預測工作

Vertex AI - Predict 工作可讓您執行線上預測。「線上預測」是對模型端點發出的同步要求。如要依據應用程式輸入內容發出要求,或是需要及時進行推論,您可以選用「線上預測」模式。

Vertex AI 是 Google Cloud 服務,可讓您訓練及部署機器學習模型和 AI 應用程式,並自訂大型語言模型 (LLM) 用於 AI 技術輔助應用程式。

事前準備

請務必先在 Google Cloud 專案中執行下列工作,再設定 Vertex AI - Predict 工作:

  1. 啟用 Vertex AI API (aiplatform.googleapis.com)。

    啟用 Vertex AI API

  2. model 資源部署至 endpoint
  3. 建立驗證設定檔。Application Integration 會使用驗證設定檔,連線至 Vertex AI - Predict 工作的驗證端點。
  4. 確認 Google Cloud 專案中為 Application Integration 設定 VPC Service Controls

設定 Vertex AI - Predict 工作

  1. 前往 Google Cloud 控制台的「Application Integration」頁面。

    前往「Application Integration」

  2. 在導覽選單中,按一下「整合」

    系統隨即會顯示「整合」頁面,列出 Google Cloud 專案中可用的所有整合功能。

  3. 選取現有整合,或按一下「建立整合」建立新整合。

    如要建立新的整合項目:

    1. 在「建立整合」窗格中輸入名稱和說明。
    2. 選取整合作業的區域。
    3. 選取整合的服務帳戶。如要變更或更新整合的服務帳戶詳細資料,請隨時前往整合工具列的「整合摘要」窗格。
    4. 按一下「建立」,新建立的整合服務會在整合服務編輯器中開啟。

  4. 整合編輯器的導覽列中,按一下「Tasks」(工作),即可查看可用工作和連結器的清單。
  5. 在整合服務編輯器中,按一下並放置「Vertex AI - Predict」元素。
  6. 在設計工具中,按一下「Vertex AI - Predict」(Vertex AI - 預測) 元素,即可查看「Vertex AI - Predict」(Vertex AI - 預測) 任務設定窗格。
  7. 前往「驗證」,然後選取要使用的現有驗證設定檔。

    (選用步驟) 如果您尚未建立驗證設定檔,請在設定工作前按一下「+ 新增驗證設定檔」,然後按照「建立新的驗證設定檔」一文中的步驟操作。

  8. 前往「Task Input」(任務輸入內容),然後使用下列「Task input parameters」(任務輸入參數) 表格,設定顯示的輸入欄位。

    系統會自動儲存輸入欄位的變更。

工作輸入參數

下表說明「Vertex AI - Predict」工作的輸入參數:

屬性 資料類型 說明
區域 字串 模型端點位置。例如:us - 美國。
ProjectsId 字串 您的 Google Cloud 專案 ID。
端點字串 要求提供預測結果的端點名稱。
要求 JSON 請參閱要求 JSON 結構

工作輸出

「Vertex AI - Predict」工作會傳回包含「prediction」的回應。

錯誤處理策略

工作錯誤處理策略會指定工作因暫時性錯誤而失敗時,系統應採取的動作。如要瞭解如何使用錯誤處理策略,以及不同類型的錯誤處理策略,請參閱「錯誤處理策略」。

配額與限制

如要瞭解配額和限制,請參閱配額和限制

後續步驟