使用 Hugging Face 模型

Hugging Face 提供預先訓練模型、微調指令碼和開發用 API,讓您更輕鬆地建立及探索 LLM。模型園地可以提供 Hugging Face 的文字嵌入文字轉圖像文字生成圖像文字轉文字模型。

Hugging Face 模型部署選項

您可以在 Vertex AI 或 Google Kubernetes Engine (GKE) 中部署支援的 Hugging Face 模型。選擇的部署選項取決於您使用的模型,以及您希望對工作負載的控管程度。

在 Vertex AI 中部署

Vertex AI 提供代管平台,可建構及擴展機器學習專案,不必具備內部機器學習運作專業知識。您可以將 Vertex AI 做為下游應用程式,提供 Hugging Face 模型。如果您需要端對端 MLOps 功能、加值機器學習功能,以及簡化開發作業的無伺服器體驗,建議使用 Vertex AI。

  1. 如要在 Vertex AI 中部署支援的 Hugging Face 模型,請前往 Model Garden。

    前往 Model Garden

  2. 前往「Hugging Face 中的開放原始碼模型」部分,然後按一下「顯示更多」

  3. 找出並選取要部署的模型。

  4. 選用:在「部署環境」部分,選取「Vertex AI」

  5. 選用:指定部署作業詳細資料。

  6. 按一下 [Deploy] (部署)

如要開始使用,請參閱下列範例:

在 GKE 中部署

Google Kubernetes Engine (GKE) 是代管 Kubernetes 的 Google Cloud 解決方案 ,可提供擴充性、安全性、復原能力和成本效益。如果您已投資 Kubernetes、貴機構擁有內部 MLOps 專業知識,或是需要精細控管複雜的 AI/ML 工作負載,且這些工作負載有獨特的安全性、資料管道和資源管理需求,建議採用這個選項。

  1. 如要在 GKE 中部署支援的 Hugging Face 模型,請前往 Model Garden。

    前往 Model Garden

  2. 前往「Hugging Face 中的開放原始碼模型」部分,然後按一下「顯示更多」

  3. 找出並選取要部署的模型。

  4. 在「部署環境」部分,選取「GKE」

  5. 按照部署指示操作。

如要開始使用,請參閱下列範例:

「由 Vertex AI 支援」是什麼意思?

我們會自動將最新、最熱門的 Hugging Face 模型新增至 Model Garden。 這個程序包括自動為每個模型產生部署設定。

為解決有關漏洞和惡意程式碼的疑慮,我們每天都會使用 Hugging Face 惡意軟體掃描器,評估每個 Hugging Face 模型存放區中檔案的安全性。如果模型存放區遭檢舉含有惡意軟體,我們會立即從 Hugging Face 資源庫頁面移除該模型。

模型標示為「Vertex AI 支援」表示該模型已通過測試,可在 Vertex AI 上部署,但我們無法保證模型沒有安全漏洞或惡意程式碼。建議您先自行進行安全驗證,再將模型部署到正式版環境。

針對特定用途調整部署設定

一鍵部署選項提供的預設部署設定無法滿足所有需求,因為用途廣泛,且延遲時間、輸送量、成本和準確度等方面的優先順序各不相同。

因此,您可以先透過一鍵部署功能進行實驗,建立基準,然後使用 Colab 筆記本 (vLLMTGITEIHF pytorch 推論) 或 Python SDK,微調部署設定。這種疊代方法可讓您根據確切需求調整部署作業,為特定應用程式爭取最佳效能。

如果 Model Garden 未列出您想要的模型,該怎麼辦?

如果想尋找特定模型,但 Model Garden 中未列出該模型,表示 Vertex AI 不支援該模型。以下各節說明原因和解決方法。

為什麼沒有列出型號?

模型可能未出現在 Model Garden 的原因如下:

  • 並非熱門趨勢模型:我們通常會優先處理廣受歡迎且社群興趣濃厚的大型語言模型。
  • 不相容:模型可能無法搭配支援的服務容器運作。例如 text-generationimage-text-to-text 模型的 vLLM 容器
  • 不支援的管道工作:模型含有目前尚未完全支援的工作。我們支援下列工作:text-generationtext2text-generationtext-to-imagefeature-extractionsentence-similarityimage-text-to-text

有哪些選項?

您仍可使用 Model Garden 中的模型:

  • 使用 Colab 筆記本自行部署:我們提供下列 Colab 筆記本:(vLLMTGITEIHF pytorch 推論),可彈性部署模型並自訂設定。這樣一來,您就能完全掌控整個流程。
  • 提交功能要求:與支援工程師合作,透過 Model Garden 提交功能要求,或參閱 Vertex Generative AI 支援,取得其他協助。
  • 留意最新消息:我們會定期在 Model Garden 中新增模型。 你需要的模型可能在未來推出,請定期回來查看!