Verbindung zu generativen KI-Modellen von Vertex AI herstellen

Vertex AI ist eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen können. Wenn Sie einem vorhandenen Cloud Run-Dienst generative KI-Funktionen hinzufügen möchten, können Sie mit Vertex AI auf generative KI-Modelle wie Gemini, PaLM, Imagen, Codey und mehr zugreifen.

In diesem Leitfaden wird beschrieben, wie Sie Cloud Run-Integrationen verwenden, um den Zugriff auf Vertex AI für Ihren Cloud Run-Dienst schnell einzurichten.

Hinweise

Achten Sie darauf, dass der Cloud Run-Dienst, in den Sie einbinden, bereits bereitgestellt ist.
Preisübersicht für Vertex AI Ihnen werden einzelne Ressourcen in Rechnung gestellt, die von der Einbindung verwendet werden.

Erforderliche Rollen

Damit Sie die Cloud Run-Integrationen verwenden können, müssen Sie oder Ihr Administrator zwei verschiedenen Hauptkonten IAM-Rollen zuweisen.

Klicken, um die erforderlichen Rollen für Ihr Google-Konto anzuzeigen

Bitten Sie Ihren Administrator, Ihrem Google-Konto die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie für die Verwendung von Cloud Run-Einbindungen benötigen:

Cloud Run Developer (roles/run.developer)
Compute-Betrachter (roles/compute.viewer)
Entwickler von serverlosen EInbindungen (roles/runapps.developer)
Operator für serverlose Einbindungen (roles/runapps.operator)
Dienstkontonutzer (roles/iam.serviceAccountUser)

Klicken Sie, um die erforderlichen Rollen für das Dienstkonto aufzurufen

Zum Bereitstellen des Cloud Run-Dienstes können Sie entweder das automatisch erstellte Compute Engine-Standarddienstkonto verwenden oder ein nutzerverwaltetes Dienstkonto angeben. Das Dienstkonto muss die folgenden Rollen haben:

Cloud Run Developer (roles/run.developer)
Log-Bucket-Autor (roles/logging.bucketWriter)
Dienstkontonutzer (roles/iam.serviceAccountUser)
Storage-Administrator (roles/storage.admin)

Project IAM Admin (roles/project.iamAdmin)

Dienst mit Vertex AI verbinden

Wenn Sie Cloud Run-Integrationen verwenden, um eine Verbindung zu Vertex AI herzustellen, führt die Integration Folgendes aus:

Aktiviert die Vertex AI API für den Cloud Run-Dienst, um auf die generativen KI-Modelle von Vertex AI zuzugreifen.
Gewährt der Dienstidentität die erforderlichen Rollen.

Sie können die Integration mithilfe der Console oder der Befehlszeile erstellen.

Console

Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

Öffnen Sie Cloud Run.
Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.
Klicken Sie auf den Tab Integrations (Integrationen).
Klicken Sie auf Integration hinzufügen.
Klicken Sie auf Vertex AI.
Verwenden Sie den Standardnamen oder ändern Sie den Namen in den gewünschten Wert.
Wenn Sie aufgefordert werden, eine Liste von APIs zu aktivieren, klicken Sie auf Aktivieren und warten Sie, bis die APIs aktiviert sind.
Klicken Sie auf Senden und warten Sie, bis die Integration abgeschlossen ist. Die Aktivierung kann bis zu einer Minute dauern.

gcloud

Aktualisieren Sie die Google Cloud CLI:
```
gcloud components update
```
Integration erstellen:
```
gcloud beta run integrations create \
--type=vertex-genai \
--service=SERVICE \
```
Ersetzen Sie:
- SERVICE durch den Namen Ihres Cloud Run-Dienstes.
Fügen Sie optional das Flag --service-account=SERVICE_ACCOUNT_EMAIL hinzu.
- Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos (PROJECT_NUMBER-compute@developer.gserviceaccount.com), das zum Bereitstellen des Dienstes verwendet wird. Lassen Sie dieses Flag weg, wenn Sie das Compute-Standarddienstkonto (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com) verwenden möchten.
  
  Führen Sie den folgenden Befehl aus, um beim Bereitstellen von Cloud Run-Integrationen das angegebene Dienstkonto weiterhin zu verwenden:
```
gcloud config set runapps/deployment-service-account
```
Warten Sie bis zu eine Minute. In dieser Zeit erhält Ihr Cloud Run-Dienst die Berechtigung, die Vertex AI API aufzurufen.
```
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
```
Sie können den Status mit gcloud beta run integrations describe prüfen.

Vertex AI-Integrationen ansehen

So rufen Sie den aktuellen Status von Vertex AI-Integrationen für Ihren Cloud Run-Dienst auf:

Console

Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

Öffnen Sie Cloud Run.
Klicken Sie in der Liste der Dienste, die Sie in dieser Einbindung verwenden möchten, auf den Dienst.
Klicken Sie auf den Tab Integrations (Integrationen).
Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie auf Details ansehen.

gcloud

Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:
```
gcloud beta run integrations list
```
Zeigen Sie die Details dafür mit einem Namen aus der zurückgegebenen Liste an:
```
gcloud beta run integrations describe INTEGRATION_NAME
```
Ersetzen Sie INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Einbindung.

Vertex AI-Integrationen löschen

Beim Löschen einer Einbindung werden auch alle mit dieser Einbindung verknüpften Google Cloud-Ressourcen gelöscht. Der Cloud Run-Dienst wird jedoch nicht gelöscht.

So löschen Sie eine Vertex AI-Integration aus Ihrem Cloud Run-Dienst:

Console

Wechseln Sie in der Google Cloud Console zur Seite Cloud Run.

Öffnen Sie Cloud Run.
Klicken Sie auf den Dienst, für den Sie eine Einbindung löschen möchten.
Klicken Sie auf den Tab Integrations (Integrationen).
Suchen Sie die Vertex AI-Integration, die Sie interessiert, und klicken Sie rechts neben der Integration auf Dreipunkt-Symbol und dann auf Löschen.

gcloud

Verwenden Sie den folgenden Befehl, um eine Liste der verfügbaren Integrationen abzurufen:
```
gcloud beta run integrations list
```
Löschen Sie die Integration mithilfe eines Namens aus der zurückgegebenen Liste:
```
gcloud beta run integrations delete INTEGRATION_NAME
```
Ersetzen Sie:
- INTEGRATION_NAME durch den Namen Ihrer Vertex AI-Integration.
Optional können Sie die folgenden Flag-Optionen verwenden:

Wahltaste Beschreibung

--service-account Die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos, um den Löschvorgang auszuführen.

Wahltaste	Beschreibung
`--service-account`	Die E-Mail-Adresse des vom Nutzer verwalteten Dienstkontos, um den Löschvorgang auszuführen.

Auf Vertex AI Generative AI-Modelle in Ihrem Code zugreifen

Nachdem Sie die Integration abgeschlossen haben, können Sie Anfragen an die Vertex AI Model APIs senden und Vertex AI Studio nutzen, um generative KI-Modelle in deiner Anwendung schnell zu testen und anzupassen.

Beschränkungen

Die Cloud Run-Integrationen werden nur in bestimmten Regionen unterstützt. Falls Sie eine Region verwenden müssen, die nicht von den Cloud Run-Integrationen unterstützt wird, lesen Sie die Informationen unter Vertex AI-Standorte.