Auf dieser Seite wird beschrieben, wie Sie API-Endpunkte für Gemini auf Google Distributed Cloud Connected erstellen und verwalten.
Es wird davon ausgegangen, dass Sie die von Google zertifizierte Hardware wie unter Installationsanforderungen beschrieben erfolgreich bereitgestellt haben.
Vorbereitung
In diesem Abschnitt werden die einmaligen Schritte beschrieben, die Sie ausführen müssen, bevor Sie Gemini in GDC-verbundenen API-Endpunkten bereitstellen können.
Erforderliche APIs aktivieren
Sie müssen die folgenden APIs in Ihrem Google Cloud -Zielprojekt aktivieren:
aiplatform.googleapis.com
anthos.googleapis.com
anthosaudit.googleapis.com
anthosgke.googleapis.com
cloudresourcemanager.googleapis.com
connectgateway.googleapis.com
compute.googleapis.com
container.googleapis.com
edgecontainer.googleapis.com
gdchardwaremanagement.googleapis.com
gkeconnect.googleapis.com
gkehub.googleapis.com
gkeonprem.googleapis.com
iam.googleapis.com
iamcredentials.googleapis.com
kubernetesmetadata.googleapis.com
logging.googleapis.com
monitoring.googleapis.com
multiclustermetering.googleapis.com
opsconfigmonitoring.googleapis.com
oslogin.googleapis.com
serviceusage.googleapis.com
stackdriver.googleapis.com
storage.googleapis.com
sts.googleapis.com
Informationen zum Aktivieren von APIs finden Sie unter Dienste aktivieren.
Erforderliche Rollen gewähren
Sie müssen die folgenden erforderlichen Rollen konfigurieren:
Gewähren Sie für Konten, die zum Verwalten Ihrer Gemini on GDC-Bereitstellung mit verbundener API verwendet werden, die in Rollen und Berechtigungen für die Distributed Cloud Edge Container API aufgeführten Rollen.
Weisen Sie Konten, die für die Interaktion mit Gemini an GDC-verbundenen API-Endpunkten verwendet werden, die in Vertex AI API-Rollen und -Berechtigungen aufgeführten Rollen zu.
Informationen zur Zielzone für Distributed Cloud Edge abrufen
So rufen Sie den Namen Ihrer Zielzone ab, die mit Distributed Cloud verbunden ist:
Listen Sie die mit Distributed Cloud verbundenen Zonen in Ihrem Google Cloud Projekt auf, wie unter Zonen auflisten beschrieben.
Rufen Sie detaillierte Informationen zur Zielzone ab, wie unter Informationen zu einer Zone abrufen beschrieben.
Informationen zu den zertifizierten Maschinen in Ihrer mit Distributed Cloud verbundenen Zone abrufen
So rufen Sie die Namen der zertifizierten Zielmaschinen in Ihrer mit Distributed Cloud verbundenen Zone ab:
Listen Sie die mit Distributed Cloud verbundenen Maschinen in der Zielzone auf, wie unter Maschinen in einer Zone auflisten beschrieben.
Rufen Sie detaillierte Informationen zum Zielcomputer ab, wie unter Informationen zu einem Computer abrufen beschrieben.
Lokale AI Platform API- und Vertex AI API-Dienste aktivieren
Aktivieren Sie das Zielprojekt Google Cloud in Ihrer verbundenen Zielzone für Distributed Cloud:
gcloud zone-management projects enable PROJECT_ID \ --organization ORGANIZATION_ID \ --location REGION \ --zones ZONE
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID des Zielprojekts Google Cloud .ORGANIZATION_ID
: die ID der Zielorganisation Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Aktivieren Sie den AI Platform-Dienst im Zielprojekt Google Cloud :
gcloud services enable aiplatform.googleapis.com --project PROJECT_ID
Ersetzen Sie
PROJECT_ID
durch die ID des Zielprojekts Google Cloud .Aktivieren Sie den Vertex AI API-Dienst in der verbundenen Zone von Distributed Cloud:
gcloud zone-management services enable vertex --project PROJECT_ID \ --location REGION \ --zones ZONE
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Endpunkt für die DNS-Auflösung konfigurieren
Rufen Sie die verwaltete DNS-Adresse, die Top-Level-Domain (TLD) und das Zertifizierungsstellenzertifikat (CA-Zertifikat) für die verbundene Zielzone von Distributed Cloud ab:
gcloud alpha zone-management zones describe ZONE \ --organization ORGANIZATION_ID \ --location REGION
Ersetzen Sie Folgendes:
ORGANIZATION_ID
: die ID der Zielorganisation Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Das folgende Beispiel veranschaulicht die Ausgabe dieses Befehls:
-----BEGIN CERTIFICATE----- MIIDATCCAemgAwIBAgIRAOsIG15loHwPBpjQe9FZYUAwDQYJKoZIhvcNAQELBQAw GjEYMBYGA1UEAxMPZ2RjZS1jbHVzdGVyLWNhMB4XDTI1MDcyOTEyMTAwNloXDTQ5 MDcyMzEyMTAwNlowGjEYMBYGA1UEAxMPZ2RjZS1jbHVzdGVyLWNhMIIBIjANBgkq hkiG9w0BAQEFAAOCAQ8AMIIBCgKCAQEA3YdoASubyzHdgZ0vIU5g1dxdFRT1T4wc o9FaRXftSTDfiNVNKj/vC+De9EZokpyLZkdZNep6p0TLJAsPZYq+yiTCiaJ6Ihwy 3LBn8j2PessSIte2LUhkft1yCQqfkgpYfKcjM3IauIXETS961m0uJb4sntgLJ4nM Scb5vpW1f70D1V27bqnEsE7+rbxzeFTosHC+DGBcLqIE0ptdionm/4xoltH7yv2O qKfcc/46TyPwGRzxifEdNzjKZ1kRdTThESfW+L7TQNv6VF5TC4FPksYX/ID/X7Fz G9BRey0mikvc4J7qQIeyMRlpIKqRh/1FCdRDC9vVEQipT2Ls0MwwTwIDAQABo0Iw QDAOBgNVHQ8BAf8EBAMCAYYwDwYDVR0TAQH/BAUwAwEB/zAdBgNVHQ4EFgQUmES2 pyMLOnnsKug8amFmenOaTr8wDQYJKoZIhvcNAQELBQADggEBADn71zo7cNFZ0kQE C2lS6b0DLz4Nd1yCz5fGDvxzcTRdOT60wyq/TAx1YlYse33cGk/cQ7RkVsM56UX1 T8RMvi09UcEQG3wFrYuU62ZjXF1a3RrOnHxyvVdyvbUYAO5gvzBQrj4tMZYX9kL3 6H/9FwXuHVyqWAm0xpWvZfszwJjY4C1VxoDwmRiZPYzTrWI6/rY0QmORgcZXLnPL OVufbAX30aRGdTRnVXxE0fKmXwzbtbSHilU5hJT7EQWMvV5hJfyNqdXG0gbrhrsk sB0yRjk5PHQd9pOMcXcYIgfNnUEcQl4qeSll3g5cZ+cRrcTO1USFLRo8dcbQpJ6Y 6ykzvKs= -----END CERTIFICATE----- createTime: '2025-08-25T20:46:50.269384028Z' dnsServers: - ipAddress: 10.200.1.10 tld: my-tld.google.private.goog name: organizations/my-organization/locations/my-region/zones/my-zone state: STATE_RUNNING
Speichern Sie das Zertifikat in einer Datei. Sie benötigen diese Datei für die nächsten Schritte.
So erstellen Sie die DNS-Konfiguration für den Endpunkt:
mkdir /etc/systemd/resolved.conf.d echo '[Resolve] DNS=DNS_SERVER_ADDRESS Domains=~TOP_LEVEL_DOMAIN' > /etc/systemd/resolved.conf.d/dns.conf sudo systemctl restart systemd-resolved
Ersetzen Sie Folgendes:
DNS_SERVER_ADDRESS
: die IP-Adresse Ihres DNS-Servers.TOP_LEVEL_DOMAIN
: die Top-Level-Domain für den Endpunkt.
Gemini-API-Endpunkt bereitstellen, der mit GDC verbunden ist
So stellen Sie einen mit Gemini on GDC verbundenen API-Endpunkt bereit:
Endpunkt erstellen:
gcloud ai endpoints create \ --project=PROJECT_ID \ --region=REGION \ --gdc-zone=ZONE \ --display_name=ENDPOINT_NAME
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.ENDPOINT_NAME
: Ein aussagekräftiger Name, der diesen Endpunkt eindeutig identifiziert.
Modell bereitstellen:
gcloud ai endpoints deploy-model ENDPOINT_NAME \ --region=REGION \ --gdc-zone=ZONE \ --model=MODEL_PUBLIC_ID
Ersetzen Sie Folgendes:
ENDPOINT_NAME
: der Name des Zielendpunkts.REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.MODEL_PUBLIC_ID
: die öffentliche ID des Modells. Eine Liste der unterstützten Modelle finden Sie unter Unterstützte Modelle.
Rufen Sie die Endpunktadresse ab:
gcloud ai endpoints describe ENDPOINT_NAME \ --project=PROJECT_ID \ --region=REGION
Ersetzen Sie Folgendes:
ENDPOINT_NAME
: der Name des Zielendpunkts.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.
Erstellen Sie das Dienstkonto für den Endpunkt in der Zielzone mit Verbindung zu Distributed Cloud:
gcloud alpha zone-management service-accounts create SERVICE_ACCOUNT \ --project PROJECT_ID \ --location REGION \ --zone ZONE
Ersetzen Sie Folgendes:
SERVICE_ACCOUNT
: ein aussagekräftiger Name, der dieses Dienstkonto eindeutig identifiziert.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Rufen Sie die IAM-Richtlinie (Identity and Access Management) für die verbundene Zielzone von Distributed Cloud ab:
gcloud alpha zone-management zones get-iam-policy ZONE \ --project PROJECT_ID \ --location REGION
Ersetzen Sie Folgendes:
ZONE
: die Zielzone für Distributed Cloud Connected.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.
Weisen Sie dem Dienstkonto die Rolle AI Platform Developer zu:
gcloud alpha zone-management zones set-iam-policy
\ --project PROJECT_ID \ --location REGION \ --zone ZONE Ersetzen Sie Folgendes:
POLICY_FILE
: JSON- oder YAML-Datei mit der Richtlinie zur Rollenzuweisung.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Im Folgenden finden Sie ein Beispiel für eine Richtlinie im JSON-Format:
"bindings": [ { "role": "roles/aiplatform.geminiDeveloper", "members": [ "serviceAccount": "projects/my-project/locations/my-region/serviceAccounts/my-service-account" ] } ], "etag": ""
Nachfolgend finden Sie ein Beispiel für eine Richtlinie im YAML-Format:
bindings: - role: roles/aiplatform.geminiDeveloper members: - serviceAccount: projects/my-project/locations/my-region/serviceAccounts/my-service-account etag: ""
Erstellen Sie einen Schlüssel für das Dienstkonto:
gcloud alpha zone-management service-accounts keys create
\ --service-account \ --project \ --location \ --ca-cert-path Ersetzen Sie Folgendes:
SA_KEY_FILE
: Datei, in der der generierte Dienstkontoschlüssel gespeichert werden soll.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.CA_CERTIFICATE_FILE
: die CA-Zertifikatsdatei, die Sie zuvor erstellt haben.
Geben Sie das Identitätstoken für das Dienstkonto aus:
gcloud alpha zone-management auth print-identity-token \ --cred-file=SA_CREDENTIAL_FILE \ --audience=ENDPOINT_URL
Ersetzen Sie Folgendes:
SA_KEY_FILE
: die Dienstkonto-Schlüsseldatei, die Sie zuvor erstellt haben.ENDPOINT_URL
: die vollständig qualifizierte URL des Endpunkts, einschließlich des TLD-Suffixes.
Bereitgestellte API-Endpunkte für Gemini on GDC auflisten
So listen Sie Ihre bereitgestellten API-Endpunkte für Gemini auf GDC auf:
gcloud ai endpoints list \ --project=PROJECT_ID \ --region=REGION \ --gdc-zone=ZONE
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.
Informationen zu einem Gemini on GDC Connected API-Endpunkt abrufen
So rufen Sie Informationen zu einem bereitgestellten API-Endpunkt ab, der mit Gemini auf GDC verbunden ist:
gcloud ai endpoints describe ENDPOINT_NAME \ --project=PROJECT_ID \ --region=REGION
Ersetzen Sie Folgendes:
ENDPOINT_NAME
: der Name des Zielendpunkts.PROJECT_ID
: die ID des Zielprojekts Google Cloud .REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.
Mit einem Gemini on Google Distributed Cloud Connected API-Endpunkt interagieren
Ihr Gemini on GDC-API-Endpunkt unterstützt die Interaktion über die ChatCompletions
API und die ListAvailableModels
API. Mit diesen APIs können Sie programmatisch mit Ihrem Endpunkt interagieren.
Hier sehen Sie ein Beispiel für eine Anfrage über die Chat Completions API:
API_ENDPOINT="https://${IG_FQDN}/v1/projects/${PROJECT}/locations/${LOCATION}/chat/completions"
FLOW_ID="gemini-2.0-flash-001"
REQUEST_BODY='{
> "model": "'${FLOW_ID}'",
> "messages": [
> {
> "role": "system",
> "content": "You are a helpful assistant."
> },
> {
> "role": "user",
> "content": "Hello!"
> }
> ],
}'
curl -X POST -vv -k \
"${API_ENDPOINT}" \
-d "${REQUEST_BODY}" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${BEARER_TOKEN}" \
-H "x-goog-user-project: projects/${PROJECT}"
Das folgende Beispiel zeigt eine multimodale Chat Completions API-Anfrage mit einem Dokument als Eingabe:
BASE64_IMAGE=$(base64 -w 0 sample-image.jpg)
{
"model": "gemini-1.5-flash-002",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What is this image?"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,'"${BASE64_IMAGE}"'"
}
}
]
}
]
}
Hier sehen Sie ein Beispiel für eine ListAllAvailableModels API-Anfrage:
# The request body -d parameter is intentionally omitted.
grpcurl -insecure \
-H "Authorization: Bearer ${BEARER_TOKEN}" \
-H "x-goog-user-project: projects/${PROJECT}" \
"${IG_FQDN}:443" \
cloud.gdc.ai.inference.inferencegateway.GeminiMetadataService.ListAvailableModels
Weitere Informationen zu den Arbeitslasten, die für die Gemini on Google Distributed Cloud Connected API geeignet sind, finden Sie unter Gemini – Übersicht.
Gemini on Google Distributed Cloud Connected-API-Endpunkt löschen
So löschen Sie einen API-Endpunkt, der mit Gemini auf GDC verbunden ist:
Heben Sie die Bereitstellung des Modells auf:
gcloud ai endpoints undeploy-model ENDPOINT_NAME \ --region=REGION \ --gdc-zone=ZONE \ --model=MODEL_PUBLIC_ID
Ersetzen Sie Folgendes:
ENDPOINT_NAME
: der Name des Zielendpunkts.REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.ZONE
: die Zielzone für Distributed Cloud Connected.MODEL_PUBLIC_ID
: die öffentliche ID des Modells. Eine Liste der unterstützten Modelle finden Sie unter Unterstützte Modelle.
Löschen Sie den Endpunkt:
gcloud ai endpoints delete ENDPOINT_NAME \ --project=PROJECT_ID \ --region=REGION
Ersetzen Sie Folgendes:
PROJECT_ID
: der Name des Zielendpunkts.REGION
: die Google Cloud Region, in der die Zielzone für Distributed Cloud Connected erstellt wurde.
Fehlerbehebung bei Endpunkten
Wenn ein API-Endpunkt, der mit Gemini auf GDC verbunden ist, nicht mehr funktioniert, wenden Sie sich zur Fehlerbehebung an Ihren Google-Ansprechpartner.