Cloud TPU-Fehlerglossar

In diesem Dokument finden Sie ein Glossar mit häufigen Fehlern und Lösungen aus dem Cloud TPU-Dienst.


Ungültiger Beschleunigertyp

Fehlermeldung

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Lösung

Für den Befehl „create“ wurde ein ungültiger Parameter angegeben. Die Verfügbarkeit eines Beschleunigers in einer Zone hängt von den folgenden Parametern ab: dem Typ, dem preemptible-Flag, dem spot-Flag und dem reserved-Flag. Die Flags preemptible, spot und reserved können geändert werden, indem sie in den Befehl „create“ ein- oder ausgeschlossen werden.

Eine TPU, die mit dem Flag reserved erstellt wurde, nutzt die reservierte Kapazität. Wenn Sie die Flags spot oder preemptible angeben, kann die TPU von TPUs mit höherer Priorität vorzeitig beendet werden. Wenn keines dieser Flags angegeben wird, wird die TPU auf Abruf bereitgestellt. Es ist keine gültige Konfiguration, mehr als eines dieser Flags zu aktivieren. Weitere Informationen finden Sie in der Dokumentation zum Befehl „create“.

Die in den einzelnen Zonen verfügbaren Beschleunigertypen finden Sie in der Dokumentation zu TPU-Regionen und ‑Zonen oder können mit dem Befehl accelerator-types list abgefragt werden. Ändern Sie den Befehl „create“, um einen dieser Accelerator-Typen zu verwenden, und versuchen Sie es noch einmal. Wenden Sie sich an den Support, wenn das Problem weiterhin besteht.

Netzwerk nicht gefunden

Fehlermeldung

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Lösung

Das Netzwerk „xxxx“ wurde nicht gefunden. Prüfen Sie, ob das Netzwerk erstellt und richtig eingerichtet wurde. Weitere Informationen finden Sie unter VPC-Netzwerke erstellen und verwalten.

Dienstkontoberechtigung verweigert

Fehlermeldung

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Lösung

Dieser Fehler tritt auf, wenn ein Nutzer versucht, ohne IAM-Autorisierung Knoten in einem Projekt zu erstellen oder aufzulisten. Eine wahrscheinliche Ursache für dieses Problem ist, dass dem Cloud TPU API-Dienstkonto nicht die erforderliche Rolle für das Projekt zugewiesen ist. In der Dokumentation zum Verwalten von Zugriffskonten finden Sie eine Übersicht dazu, wie Sie den Zugriff verwalten. Folgen Sie der Anleitung unter Eine einzelne Rolle gewähren oder widerrufen und weisen Sie dem Konto „service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com“ die Rolle „Cloud TPU API Service Agent“ zu. Ersetzen Sie dabei PROJECT_NUMBER durch Ihre Projektnummer, die Sie in den Projekteinstellungen in der Google Cloud Console Google Cloud finden. Weitere Informationen zu Dienst-Agents finden Sie in der Dokumentation zu Dienst-Agents.

Kontingent überschritten

Fehlermeldung

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Lösung

Ihr Projekt hat ein Kontingentlimit erreicht. Weitere Informationen zum Arbeiten mit Kontingenten finden Sie in der Dokumentation zu Cloud-Kontingenten. Dies ist nicht mit dem TPU-Kontingent zu verwechseln, das die Nutzung von TPU-Pods regelt.

Sie können eine Erhöhung des entsprechenden Limits beantragen. Folgen Sie dazu der Anleitung unter Höheres Kontingent anfordern. Auf der Seite „Kontingente“ können Sie nach dem Kontingent suchen, das durch den Teil „JJJJ“ dieser Nachricht angegeben ist. Einige Kontingente werden auf verschiedene Regionen oder Dienste aufgeteilt. In der Fehlermeldung wird angegeben, welches Limit erhöht werden muss.

Die Teile „XXXX“ und „YYYY“ der Nachricht können einen der folgenden Werte haben:

  • HEALTH_CHECKS – Kontingent für „Systemdiagnosen“
  • FIREWALLS – Kontingent für „Firewallregeln“
  • NETWORK_ENDPOINT_GROUPS – Kontingent für „Netzwerk-Endpunktgruppen“ für diese Region
  • READ_REQUESTS – Kontingent „Leseanfragen pro Minute“ für den Compute Engine API-Dienst
  • OPERATION_READ_REQUESTS – Kontingent für „Leseanfragen pro Minute“

Dieser Antrag wird in der Regel innerhalb von zwei bis drei Arbeitstagen bearbeitet. Wenn die Anfrage dringend ist, wenden Sie sich an einen Customer Engineer oder Technical Account Manager.