Cloud TPU-Fehlerglossar
Dieses Dokument enthält ein Glossar häufig auftretender Fehler mit Lösungen aus dem Cloud TPU-Dienst.
Ungültiger Beschleunigertyp
Fehlermeldung
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
Lösung
Für den Befehl „create“ wurde ein ungültiger Parameter angegeben. Die Verfügbarkeit
eines Beschleunigers in einer Zone hängt von folgenden Parametern ab: Typ,
Die Flags preemptible
, spot
und reserved
. preemptible
, spot
und reserved
können geändert werden, indem sie in der Erstellung
.
Eine TPU, die mit dem Flag reserved
erstellt wurde, verwendet reservierte
Kapazität. Wenn Sie die Flags spot
oder preemptible
angeben, kann die TPU von TPUs mit höherer Priorität vorzeitig beendet werden. Wenn keines dieser Flags angegeben wird, wird die TPU auf Abruf bereitgestellt. Es ist keine gültige Konfiguration, mehr als eines dieser Flags zu aktivieren. Weitere Informationen finden Sie in der Dokumentation zum Befehl „create“.
Die in den einzelnen Zonen verfügbaren Beschleunigertypen finden Sie in der Dokumentation zu TPU-Regionen und -Zonen. Alternativ können sie Sie wird mit dem Befehl „Beschleunigertypen auflisten“ abgefragt. Ändern Sie den Befehl „create“, um einen dieser Accelerator-Typen zu verwenden, und versuchen Sie es noch einmal. Wenden Sie sich an den Support, wenn das Problem weiterhin besteht.
Netzwerk nicht gefunden
Fehlermeldung
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
Lösung
Netzwerk xxxx wurde nicht gefunden. Prüfen Sie, ob das Netzwerk erstellt und richtig eingerichtet wurde. Weitere Informationen finden Sie unter VPC-Netzwerke erstellen und verwalten.
Dienstkontoberechtigung verweigert
Fehlermeldung
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
Lösung
Dieser Fehler tritt auf, wenn ein Nutzer versucht, Knoten in einem Projekt zu erstellen oder aufzulisten.
ohne IAM-Autorisierung. Eine wahrscheinliche Ursache für dieses Problem ist, dass der Cloud TPU API-Dienst
Konto hat nicht die erforderliche Rolle für das Projekt. Die Dokumentation zum Verwalten von Zugriffskonten
gibt einen Überblick über die Zugriffsverwaltung. Führen Sie die Schritte unter Einzelne Rolle zuweisen oder widerrufen aus.
und geben Sie dem Konto „service-PROJECT_NUMBER
@cloud-tpu.iam.gserviceaccount.com“ an. die Rolle „Cloud TPU API-Dienst-Agent“ (Ersetzen Sie PROJECT_NUMBER
durch Ihre Projektnummer. Diese finden Sie in den Projekteinstellungen in der Google Cloud Console. Weitere Informationen zu Dienst-Agents finden Sie in der Dokumentation zu Dienst-Agents.
Kontingent überschritten
Fehlermeldung
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.
Lösung
Ihr Projekt hat ein Kontingentlimit erreicht. Weitere Informationen zum Arbeiten mit Kontingenten finden Sie in der Dokumentation zu Cloud-Kontingenten. Dies sollte nicht mit dem TPU-Kontingent verwechselt werden, das die Nutzung von TPU-Pods regelt.
Sie können eine Erhöhung des entsprechenden Limits beantragen. Folgen Sie dazu der Anleitung unter Höheres Kontingent anfordern. Auf der Seite „Kontingente“ können Sie nach dem Kontingent suchen, das durch das Präfix „JJJJ“ angegeben wird. Teil dieser Nachricht. Einige Kontingente sind auf verschiedene Regionen oder Dienste aufgeteilt. In der Fehlermeldung wird angegeben, welche davon erhöht werden muss.
Der XXXX und 'JJJJ' Teile der Nachricht können einer der folgenden sein:
- HEALTH_CHECKS – Kontingent für „Systemdiagnosen“
- FIREWALLS – "Firewallregeln" Kontingent
- NETWORK_ENDPOINT_GROUPS – "Netzwerk-Endpunktgruppen" Kontingent für diese Region
- READ_REQUESTS – "Leseanfragen pro Minute" Kontingent für den Compute Engine API-Dienst
- OPERATION_READ_REQUESTS – Kontingent für „Leseanfragen pro Minute“
Dieser Antrag wird in der Regel innerhalb von zwei bis drei Arbeitstagen bearbeitet. Wenn die Anfrage dringend ist, wenden Sie sich an einen Customer Engineer oder Technical Account Manager.