Vertex AI 簡介

Google Distributed Cloud (GDC) 氣隙裝置上的 Vertex AI,可將機器學習 (ML) 和人工智慧 (AI) 平台的功能帶到安全的可攜式裝置。GDC 實體隔離裝置可存取一組預先訓練的 Vertex AI API,在私有雲解決方案中啟用 AI 功能。

主要功能與特色

GDC 實體隔離裝置上的 Vertex AI 提供下列功能:

  • 無網路連線部署:完全在可攜式裝置中執行 Vertex AI 服務,確保資料主權和法規遵循。
  • 熟悉的 Vertex AI 體驗:運用與 Google Cloud相同的工具和 API,簡化開發和管理作業。
  • 預先建構的模型和演算法:存取一系列預先訓練的模型,用於常見的機器學習工作,加快實現價值。

可用服務

GDC 實體隔離裝置上的 Vertex AI 提供下列預先訓練服務:

容量規劃和運算需求

每項 Vertex AI 服務都需要不同的運算資源。下表列出各個預先訓練模型的相關需求:

預先訓練的 API 運算資源 GPU 數量需求 GPU 記憶體需求
光學字元辨識 (OCR) GPU 單一 A100 80 GB GPU 40 GB
Speech-to-Text CPU 不適用 (僅限 CPU) 不適用 (僅限 CPU)
Vertex AI Translation GPU 單一 A100 80 GB GPU 50 GB

GDC 氣隙裝置包含單一 NVIDIA A100 80 GB GPU。這會限制裝置一次只能執行一個需要 GPU 的 Vertex AI 預先訓練 API。如果您嘗試同時啟用 Vertex AI Translation 和 OCR,系統會顯示 GPU 資源不足的錯誤訊息,導致第二個 API 無法啟用。不過,您可以同時執行 Speech-to-Text 和 Vertex AI Translation 或 OCR,因為 Speech-to-Text 只需要 CPU 資源。

為協助您判斷 AI/ML 工作負載所需的設備單元數量,請查看各 Vertex AI 預先訓練 API 的容量限制:

預先訓練的 API 每個裝置單位的容量
光學字元辨識 (OCR) 每分鐘最多 30 張圖片 (每兩秒一張圖片)。
Speech-to-Text 每分鐘最多可轉錄七分鐘的音訊 (每秒最多可轉錄七秒的音訊)。
Vertex AI Translation 每分鐘最多 61,000 個字元 (每秒 1,024 個字元)。

規劃部署作業時,請參考下列指引:

  • 容量限制為約略值,無法保證。實際容量可能會受下列因素影響:

    • 輸入資料的複雜度 (例如翻譯的語言、OCR 的圖片品質,以及語音轉文字的音訊清晰度)。
    • 設備的特定設定。
    • 在裝置上同時使用其他服務。
  • 由於 GDC 氣隙裝置僅限使用單一 A100 80 GB GPU,因此一次只能啟用一個 GPU 密集型 API (Vertex AI Translation 或 OCR)。

  • 預估尖峰用量和未來的潛在成長。

  • 如果工作負載要求嚴苛,需要較高的輸送量,建議部署多個設備單元。

下表列出 GDC 離線裝置上各項 Vertex AI 服務的儲存空間需求:

元件 儲存空間需求
OCR 前端 0.1 GB
OCR 後端 5 GB
OCR 擷取器 0.1 GB
Speech-to-Text 前端 0.1 GB
Speech-to-Text 後端 1.5 GB
Vertex AI Translation 前端 0.7 GB
Vertex AI Translation 後端 61.4 GB

確認設備有足夠的儲存空間,可容納您打算使用的 Vertex AI 服務。

優點

在 GDC 實體隔離裝置上使用 Vertex AI 的優點如下:

  • 流暢的開發體驗:在 Google Cloud上使用與 Vertex AI 相同的工具、API 和工作流程,讓開發和管理作業直覺又有效率。
  • 提升安全性和隱私權:全面控管您的資料,並遵守法規要求。
  • 加快價值實現速度:使用預先訓練模型執行常見的機器學習工作。
  • 簡化 MLOps:運用強大的機器學習運作功能,在與網際網路隔離的環境中順暢整合 AI。

開始使用

如要在 GDC 氣密式裝置上開始使用 Vertex AI,請完成下列步驟: