Hugging Face-Modelle verwenden

HuggingFace bietet vortrainierte Modelle, Scripts zur Feinabstimmung und Entwicklungs-APIs, die das Erstellen und Entdecken von LLMs erleichtern. Model Garden kann Modelle in Hugging Face ausliefern, die von der Texteinbettung-, der regulären Pytorch-Inferenz und der Textgenerierung-Inferenz unterstützt werden.

Bereitstellungsoptionen für Hugging Face-Modelle

Sie können unterstützte Hugging Face-Modelle in Vertex AI oder in der Google Kubernetes Engine (GKE) bereitstellen. Die von Ihnen gewählte Bereitstellungsoption kann vom verwendeten Modell und von der gewünschten Kontrolle über Ihre Arbeitslasten abhängen.

In Vertex AI bereitstellen

Vertex AI bietet eine verwaltete Plattform zum Erstellen und Skalieren von ML-Projekten, ohne dass interne MLOps-Kenntnisse erforderlich sind. Sie können Vertex AI als nachgelagerte Anwendung verwenden, die Hugging Face-Modelle bereitstellt. Wir empfehlen die Verwendung von Vertex AI, wenn Sie End-to-End-MLOps-Funktionen, Mehrwert-ML-Features und eine serverlose Umgebung für eine optimierte Entwicklung wünschen.

  1. Wenn Sie ein unterstütztes Hugging Face-Modell in Vertex AI bereitstellen möchten, rufen Sie Model Garden auf.

    Zu Model Garden

  2. Klicken Sie im Bereich Open-Source-Modelle bei Hugging Face auf Mehr anzeigen.

  3. Suchen Sie nach einem Modell, das Sie bereitstellen möchten, und wählen Sie es aus.

  4. Optional: Wählen Sie für die Bereitstellungsumgebung die Option Vertex AI aus.

  5. Optional: Geben Sie die Bereitstellungsdetails an.

  6. Klicken Sie auf Bereitstellen.

Sehen Sie sich zum Einstieg die folgenden Beispiele an:

In GKE bereitstellen

Google Kubernetes Engine (GKE) ist die Google Cloud-Lösung für verwaltete Kubernetes, die Skalierbarkeit, Sicherheit, Robustheit und Kosteneffizienz bietet. Wir empfehlen diese Option, wenn Sie bereits Kubernetes-Investitionen haben, Ihre Organisation über interne MLOps-Kenntnisse verfügt oder wenn Sie eine detaillierte Kontrolle über komplexe KI/ML-Arbeitslasten mit besonderer Sicherheit, Datenpipeline und Ressourcen benötigen Managementanforderungen.

  1. Wenn Sie ein unterstütztes Hugging Face-Modell in GKE bereitstellen möchten, rufen Sie Model Garden auf.

    Zu Model Garden

  2. Klicken Sie im Bereich Open-Source-Modelle bei Hugging Face auf Mehr anzeigen.

  3. Suchen Sie nach einem Modell, das Sie bereitstellen möchten, und wählen Sie es aus.

  4. Wählen Sie als Bereitstellungsumgebung GKE aus.

  5. Folgen Sie der Anleitung zur Bereitstellung.

Sehen Sie sich zum Einstieg die folgenden Beispiele an: