Vertex AI ist eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen können. Wenn Sie einem vorhandenen Cloud Run-Dienst generative KI-Funktionen hinzufügen möchten, können Sie mit Vertex AI auf generative KI-Modelle wie Gemini, PaLM, Imagen, Codey und mehr zugreifen.
In diesem Leitfaden wird beschrieben, wie Sie Cloud Run-Integrationen verwenden, um den Zugriff auf Vertex AI für Ihren Cloud Run-Dienst schnell einzurichten.
Hinweise
- Achten Sie darauf, dass der Cloud Run-Dienst, in den Sie einbinden, bereits bereitgestellt ist.
- Preisübersicht für Vertex AI Ihnen werden einzelne Ressourcen in Rechnung gestellt, die von der Einbindung verwendet werden.
Erforderliche Rollen
Damit Sie die Cloud Run-Integrationen verwenden können, müssen Sie oder Ihr Administrator zwei verschiedenen Hauptkonten IAM-Rollen zuweisen.
Klicken, um die erforderlichen Rollen für Ihr Google-Konto anzuzeigen
Bitten Sie Ihren Administrator, Ihrem Google-Konto die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie für die Verwendung von Cloud Run-Einbindungen benötigen:
- Cloud Run Developer (
roles/run.developer
) - Compute-Betrachter (
roles/compute.viewer
) - Entwickler von serverlosen EInbindungen (
roles/runapps.developer
) - Operator für serverlose Einbindungen (
roles/runapps.operator
) - Dienstkontonutzer (
roles/iam.serviceAccountUser
)
Klicken Sie, um die erforderlichen Rollen für das Dienstkonto aufzurufen
Zum Bereitstellen des Cloud Run-Dienstes können Sie entweder das automatisch erstellte Compute Engine-Standarddienstkonto verwenden oder ein nutzerverwaltetes Dienstkonto angeben. Das Dienstkonto muss die folgenden Rollen haben:
- Cloud Run Developer (
roles/run.developer
) - Log-Bucket-Autor (
roles/logging.bucketWriter
) - Dienstkontonutzer (
roles/iam.serviceAccountUser
) - Storage-Administrator (
roles/storage.admin
) - Project IAM Admin (
roles/project.iamAdmin
)
Dienst mit Vertex AI verbinden
Wenn Sie Cloud Run-Integrationen verwenden, um eine Verbindung zu Vertex AI herzustellen, führt die Integration Folgendes aus:
- Aktiviert die Vertex AI API für den Cloud Run-Dienst, um auf die generativen KI-Modelle von Vertex AI zuzugreifen.
- Gewährt der Dienstidentität die erforderlichen Rollen.
Sie können die Integration mithilfe der Console oder der Befehlszeile erstellen.
Console
Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.
Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.
Klicken Sie auf den Tab Integrations (Integrationen).
Klicken Sie auf Integration hinzufügen.
Klicken Sie auf Vertex AI.
Verwenden Sie den Standardnamen oder ändern Sie den Namen in den gewünschten Wert.
Wenn Sie aufgefordert werden, eine Liste von APIs zu aktivieren, klicken Sie auf Aktivieren und warten Sie, bis die APIs aktiviert sind.
Klicken Sie auf Senden und warten Sie, bis die Integration abgeschlossen ist. Die Aktivierung kann bis zu einer Minute dauern.
Befehlszeile
Aktualisieren Sie die Google Cloud CLI:
gcloud components update
Integration erstellen:
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
Ersetzen Sie:
- SERVICE durch den Namen Ihres Cloud Run-Dienstes.
Fügen Sie optional das Flag
--service-account=SERVICE_ACCOUNT_EMAIL
hinzu.Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
), das zum Bereitstellen des Dienstes verwendet wird. Lassen Sie dieses Flag weg, wenn Sie das Compute-Standarddienstkonto (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
) verwenden möchten.Führen Sie den folgenden Befehl aus, um beim Bereitstellen von Cloud Run-Integrationen das angegebene Dienstkonto weiterhin zu verwenden:
gcloud config set runapps/deployment-service-account
Warten Sie bis zu eine Minute. In dieser Zeit erhält Ihr Cloud Run-Dienst die Berechtigung, die Vertex AI API aufzurufen.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
Sie können den Status mit
gcloud beta run integrations describe
prüfen.
Vertex AI-Integrationen ansehen
So rufen Sie den aktuellen Status von Vertex AI-Integrationen für Ihren Cloud Run-Dienst auf:
Console
Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.
Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.
Klicken Sie auf den Tab Integrations (Integrationen).
Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie auf Details ansehen.
Befehlszeile
Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:
gcloud beta run integrations list
Zeigen Sie die Details dafür mit einem Namen aus der zurückgegebenen Liste an:
gcloud beta run integrations describe INTEGRATION_NAME
Ersetzen Sie INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Einbindung.
Vertex AI-Integrationen löschen
Beim Löschen einer Einbindung werden auch alle mit dieser Einbindung verknüpften Google Cloud-Ressourcen gelöscht. Der Cloud Run-Dienst wird jedoch nicht gelöscht.
So löschen Sie eine Vertex AI-Integration aus Ihrem Cloud Run-Dienst:
Console
Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.
Klicken Sie auf den Dienst, für den Sie eine Einbindung löschen möchten.
Klicken Sie auf den Tab Integrations (Integrationen).
Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie rechts neben der Integration auf Dreipunkt-Symbol und dann auf Löschen.
Befehlszeile
Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:
gcloud beta run integrations list
Löschen Sie die Integration mithilfe eines Namens aus der zurückgegebenen Liste:
gcloud beta run integrations delete INTEGRATION_NAME
Ersetzen Sie:
- INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Integration.
Optional können Sie die folgenden Flag-Optionen verwenden:
Wahltaste Beschreibung --service-account
Die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos, um den Löschvorgang auszuführen.
Auf Vertex AI Generative AI-Modelle in Ihrem Code zugreifen
Nachdem Sie die Integration abgeschlossen haben, können Sie Anfragen an die Vertex AI Model APIs senden und Vertex AI Studio nutzen, um generative KI-Modelle in deiner Anwendung schnell zu testen und anzupassen.
Beschränkungen
Die Cloud Run-Integrationen werden nur in bestimmten Regionen unterstützt. Falls Sie eine Region verwenden müssen, die nicht von den Cloud Run-Integrationen unterstützt wird, lesen Sie die Informationen unter Vertex AI-Standorte.