Verbindung zu generativen KI-Modellen von Vertex AI herstellen

Vertex AI ist eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen können. Wenn Sie einem vorhandenen Cloud Run-Dienst generative KI-Funktionen hinzufügen möchten, können Sie mit Vertex AI auf generative KI-Modelle wie Gemini, PaLM, Imagen, Codey und mehr zugreifen.

In diesem Leitfaden wird beschrieben, wie Sie Cloud Run-Integrationen verwenden, um den Zugriff auf Vertex AI für Ihren Cloud Run-Dienst schnell einzurichten.

Hinweise

  • Achten Sie darauf, dass der Cloud Run-Dienst, in den Sie einbinden, bereits bereitgestellt ist.
  • Preisübersicht für Vertex AI Ihnen werden einzelne Ressourcen in Rechnung gestellt, die von der Einbindung verwendet werden.

Erforderliche Rollen

Damit Sie die Cloud Run-Integrationen verwenden können, müssen Sie oder Ihr Administrator zwei verschiedenen Hauptkonten IAM-Rollen zuweisen.

Klicken, um die erforderlichen Rollen für Ihr Google-Konto anzuzeigen

Bitten Sie Ihren Administrator, Ihrem Google-Konto die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie für die Verwendung von Cloud Run-Einbindungen benötigen:

Klicken Sie, um die erforderlichen Rollen für das Dienstkonto aufzurufen

Zum Bereitstellen des Cloud Run-Dienstes können Sie entweder das automatisch erstellte Compute Engine-Standarddienstkonto verwenden oder ein nutzerverwaltetes Dienstkonto angeben. Das Dienstkonto muss die folgenden Rollen haben:

Dienst mit Vertex AI verbinden

Wenn Sie Cloud Run-Integrationen verwenden, um eine Verbindung zu Vertex AI herzustellen, führt die Integration Folgendes aus:

  • Aktiviert die Vertex AI API für den Cloud Run-Dienst, um auf die generativen KI-Modelle von Vertex AI zuzugreifen.
  • Gewährt der Dienstidentität die erforderlichen Rollen.

Sie können die Integration mithilfe der Console oder der Befehlszeile erstellen.

Console

  1. Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

    Öffnen Sie Cloud Run.

  2. Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.

  3. Klicken Sie auf den Tab Integrations (Integrationen).

  4. Klicken Sie auf Integration hinzufügen.

  5. Klicken Sie auf Vertex AI.

  6. Verwenden Sie den Standardnamen oder ändern Sie den Namen in den gewünschten Wert.

  7. Wenn Sie aufgefordert werden, eine Liste von APIs zu aktivieren, klicken Sie auf Aktivieren und warten Sie, bis die APIs aktiviert sind.

  8. Klicken Sie auf Senden und warten Sie, bis die Integration abgeschlossen ist. Die Aktivierung kann bis zu einer Minute dauern.

Befehlszeile

  1. Aktualisieren Sie die Google Cloud CLI:

    gcloud components update
  2. Integration erstellen:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    Ersetzen Sie:

    • SERVICE durch den Namen Ihres Cloud Run-Dienstes.

    Fügen Sie optional das Flag --service-account=SERVICE_ACCOUNT_EMAIL hinzu.

    • Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos (PROJECT_NUMBER-compute@developer.gserviceaccount.com), das zum Bereitstellen des Dienstes verwendet wird. Lassen Sie dieses Flag weg, wenn Sie das Compute-Standarddienstkonto (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com) verwenden möchten.

      Führen Sie den folgenden Befehl aus, um beim Bereitstellen von Cloud Run-Integrationen das angegebene Dienstkonto weiterhin zu verwenden:

      gcloud config set runapps/deployment-service-account
  3. Warten Sie bis zu eine Minute. In dieser Zeit erhält Ihr Cloud Run-Dienst die Berechtigung, die Vertex AI API aufzurufen.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    Sie können den Status mit gcloud beta run integrations describe prüfen.

Vertex AI-Integrationen ansehen

So rufen Sie den aktuellen Status von Vertex AI-Integrationen für Ihren Cloud Run-Dienst auf:

Console

  1. Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

    Öffnen Sie Cloud Run.

  2. Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.

  3. Klicken Sie auf den Tab Integrations (Integrationen).

  4. Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie auf Details ansehen.

Befehlszeile

  1. Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:

    gcloud beta run integrations list
  2. Zeigen Sie die Details dafür mit einem Namen aus der zurückgegebenen Liste an:

    gcloud beta run integrations describe INTEGRATION_NAME

    Ersetzen Sie INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Einbindung.

Vertex AI-Integrationen löschen

Beim Löschen einer Einbindung werden auch alle mit dieser Einbindung verknüpften Google Cloud-Ressourcen gelöscht. Der Cloud Run-Dienst wird jedoch nicht gelöscht.

So löschen Sie eine Vertex AI-Integration aus Ihrem Cloud Run-Dienst:

Console

  1. Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

    Öffnen Sie Cloud Run.

  2. Klicken Sie auf den Dienst, für den Sie eine Einbindung löschen möchten.

  3. Klicken Sie auf den Tab Integrations (Integrationen).

  4. Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie rechts neben der Integration auf Dreipunkt-Symbol und dann auf Löschen.

Befehlszeile

  1. Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:

    gcloud beta run integrations list
  2. Löschen Sie die Integration mithilfe eines Namens aus der zurückgegebenen Liste:

    gcloud beta run integrations delete INTEGRATION_NAME

    Ersetzen Sie:

    • INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Integration.

    Optional können Sie die folgenden Flag-Optionen verwenden:

    Wahltaste Beschreibung
    --service-account Die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos, um den Löschvorgang auszuführen.

Auf Vertex AI Generative AI-Modelle in Ihrem Code zugreifen

Nachdem Sie die Integration abgeschlossen haben, können Sie Anfragen an die Vertex AI Model APIs senden und Vertex AI Studio nutzen, um generative KI-Modelle in deiner Anwendung schnell zu testen und anzupassen.

Beschränkungen

Die Cloud Run-Integrationen werden nur in bestimmten Regionen unterstützt. Falls Sie eine Region verwenden müssen, die nicht von den Cloud Run-Integrationen unterstützt wird, lesen Sie die Informationen unter Vertex AI-Standorte.