Fehlerbehebung

Auf dieser Seite erfahren Sie, wie Sie Probleme mit Batch beheben.

Wenn Sie versuchen, einen Job zu beheben, für den Sie keine Fehlermeldung erhalten haben, prüfen Sie, ob der Jobverlauf Fehlermeldungen enthält. Rufen Sie dazu die Statusereignisse auf, bevor Sie dieses Dokument durchgehen.

Weitere Informationen zur Fehlerbehebung bei Jobs finden Sie auch in den folgenden Dokumenten:

Fehler bei der Joberstellung

Wenn Sie einen Job nicht erstellen können, kann dies an einem der Fehler in diesem Abschnitt liegen.

Unzureichendes Kontingent

Problem

Eines der folgenden Probleme tritt auf, wenn Sie versuchen, einen Job zu erstellen:

  • Wenn der Job den Status QUEUED hat, wird das folgende Problem im Feld statusEvents angezeigt:

    Quota checking process decides to delay scheduling for the job JOB_UID due to inadequate quotas [Quota: QUOTA_NAME, limit: QUOTA_LIMIT, usage: QUOTA_CURRENT_USAGE, wanted: WANTED_QUOTA.].
    

    Dieses Problem weist darauf hin, dass sich der Job verzögert hat, da die aktuelle Nutzung (QUOTA_USAGE) und das Limit (QUOTA_LIMIT) des Kontingents QUOTA_NAME die angeforderte Nutzung des Jobs (WANT_QUOTA) verhindert haben.

  • Wenn sich der Job im Status QUEUED, SCHEDULED oder FAILED befindet, wird im Feld statusEvents eines der folgenden Probleme angezeigt:

    RESOURCE_NAME creation failed:
    Quota QUOTA_NAME exceeded. Limit: QUOTA_LIMIT in region REGION
    
    RESOURCE_NAME creation failed:
    Quota QUOTA_NAME exceeded. Limit: QUOTA_LIMIT in zone ZONE
    

    Dieses Problem weist darauf hin, dass das Erstellen einer Ressource fehlgeschlagen ist, weil die Anfrage Ihr Kontingent von QUOTA_NAME überschritten hat, das am angegebenen Standort auf QUOTA_LIMIT beschränkt ist.

Lösung

So beheben Sie das Problem:

  • Wenn sich der Job verzögert hat, warten Sie, bis ein größeres Kontingent freigegeben ist.

  • Wenn der Job aufgrund eines unzureichenden Kontingents fehlgeschlagen ist oder diese Verzögerungen bestehen bleiben, können Sie so versuchen, das unzureichende Kontingent zu verhindern:

    • Erstellen Sie Jobs, die dieses Kontingent weniger oder ein anderes Kontingent verbrauchen. Sie können beispielsweise einen anderen zulässigen Standort oder Ressourcentyp für den Job angeben oder Ihre Kontingentnutzung auf weitere Projekte aufteilen.

    • Fordern Sie bei Google Cloud ein höheres Kontingentlimit für Ihr Projekt an.

Weitere Informationen finden Sie unter Batchkontingente und -limits und Mit Kontingenten arbeiten.

Unzureichende Berechtigungen, um als Dienstkonto zu fungieren

Problem

Das folgende Problem tritt auf, wenn Sie versuchen, einen Job zu erstellen:

  • Wenn für den Job keine Instanzvorlage verwendet wird, tritt das Problem so auf:

    caller does not have access to act as the specified service account: SERVICE_ACCOUNT_NAME
    
  • Wenn für den Job eine Instanzvorlage verwendet wird, tritt das Problem so auf:

    Error: code - CODE_SERVICE_ACCOUNT_MISMATCH, description - The service account specified in the instance template INSTANCE_TEMPLATE_SERVICE_ACCOUNT doesn't match the service account specified in the job JOB_SERVICE_ACCOUNT for JOB_UID, project PROJECT_NUMBER
    

Dieses Problem tritt normalerweise auf, wenn der Nutzer, der den Job erstellt, nicht die erforderlichen Berechtigungen hat, um als das vom Job verwendete Dienstkonto zu fungieren. Dies wird durch die Berechtigung iam.serviceAccounts.actAs gesteuert.

Lösung

So beheben Sie das Problem:

  1. Wenn der Job eine Instanzvorlage verwendet, prüfen Sie, ob das in der Instanzvorlage angegebene Dienstkonto mit dem in der Jobdefinition angegebenen Dienstkonto übereinstimmt.
  2. Dem Nutzer, der den Job erstellt, muss die Rolle „Dienstkontonutzer“ (roles/iam.serviceAccountUser) für das für den Job angegebene Dienstkonto zugewiesen sein. Weitere Informationen finden Sie unter Zugriff verwalten.
  3. Erstellen Sie den Job neu.

Wiederholte Netzwerke

Problem

Das folgende Problem tritt auf, wenn Sie versuchen, einen Job zu erstellen:

Networks must be distinct for NICs in the same InstanceTemplate

Dieses Problem tritt auf, weil Sie das Netzwerk für einen Job mehr als einmal angegeben haben.

Lösung

Erstellen Sie den Job neu und geben Sie das Netzwerk mit einer der folgenden Optionen an, um das Problem zu beheben:

Weitere Informationen finden Sie unter Netzwerk für einen Job angeben.

Ungültiges Netzwerk für VPC Service Controls

Problem

Das folgende Problem tritt auf, wenn Sie versuchen, einen Job zu erstellen:

no_external_ip_address field is invalid. VPC Service Controls is enabled for the project, so external ip address must be disabled for the job. Please set no_external_ip_address field to be true

Lösung

Dieses Problem tritt auf, weil Sie versuchen, einen Job mit VMs zu erstellen und auszuführen, die externe IP-Adressen in einem VPC Service Controls-Dienstperimeter haben.

Zum Beheben des Problems erstellen Sie einen Job, der den externen Zugriff für alle VMs blockiert.

Weitere Informationen zum Konfigurieren des Netzwerks für einen Job in einem VPC Service Controls-Dienstperimeter finden Sie unter VPC Service Controls mit Batch verwenden.

Jobprobleme und Fehlerfehler

Wenn Probleme mit einem Job auftreten, der nicht korrekt ausgeführt wird oder aus unklaren Gründen fehlgeschlagen ist, kann dies an einem der Fehler in diesem Abschnitt oder an einem der Exit-Codes im folgenden Abschnitt Exit-Codes für Aufgabenfehler liegen.

Keine Logs in Cloud Logging

Problem

Sie müssen einen Job debuggen, aber für den Job werden in Cloud Logging keine Logs angezeigt.

Dieses Problem tritt häufig aus folgenden Gründen auf:

  • Die Cloud Logging API ist für Ihr Projekt nicht aktiviert. Selbst wenn Sie alles andere für die Logs eines Jobs richtig konfigurieren, werden keine Logs erstellt, wenn der Dienst nicht für Ihr Projekt aktiviert ist.
  • Das Dienstkonto des Jobs ist nicht berechtigt, Logs zu schreiben. Ein Job kann ohne ausreichende Berechtigungen keine Logs erstellen.
  • Der Job wurde nicht zum Erstellen von Logs konfiguriert. Damit Logs in Cloud Logging erstellt werden können, muss Cloud Logging für einen Job aktiviert sein. Die Runnables des Jobs sollten außerdem so konfiguriert sein, dass alle Informationen, die in Logs enthalten sein sollen, in die Standardausgabestreams (stdout) und Standardfehlerstreams (stderr) geschrieben werden. Weitere Informationen finden Sie unter Job mithilfe von Logs analysieren.
  • Aufgaben wurden nicht ausgeführt. Logs können erst erstellt werden, wenn Aufgaben Ressourcen zugewiesen wurden und ausgeführt werden.
  • Cloud Logging wurde so konfiguriert, dass die Logs des Jobs automatisch ausgeschlossen werden. Logs von Batchjobs können nicht angezeigt werden, wenn Sie Ausschlussfilter für Cloud Logging konfiguriert haben, die dazu führen, dass Logs von Batchjobs ausgeschlossen werden.

Lösung

So beheben Sie das Problem:

  1. Achten Sie darauf, dass die Logs nicht automatisch aus Cloud Logging ausgeschlossen wurden. Deaktivieren Sie dazu alle aktuellen Ausschlussfilter für Cloud Logging.
  2. Achten Sie darauf, dass die Cloud Logging API für Ihr Projekt aktiviert ist.
  3. Prüfen Sie, ob das Dienstkonto für den Job die IAM-Rolle Logautor (roles/logging.logWriter) hat. Weitere Informationen finden Sie unter Batch für ein Projekt aktivieren.
  4. Rufen Sie die Details des Jobs mit der gcloud CLI oder Batch API auf. Anhand der Jobdetails können Sie nachvollziehen, warum der Job keine Logs generiert hat, und Sie können Informationen bereitstellen, die Sie aus den Logs zu erhalten erhofft haben. Gehen Sie beispielsweise so vor:
    1. Prüfen Sie im Feld logsPolicy des Jobs, ob Logging aktiviert ist.
    2. Ob der Job erfolgreich ausgeführt wurde, können Sie im Feld status des Jobs prüfen.

Erstellen Sie den Job neu, nachdem Sie Änderungen vorgenommen haben, und warten Sie, bis er ausgeführt wurde, bevor Sie nach Logs suchen.

Keine Dienst-Agent-Berichterstellung

Problem

Das folgende Problem tritt im Feld statusEvents für einen Job auf, der nicht ordnungsgemäß ausgeführt wird oder fehlgeschlagen ist, bevor VMs erstellt wurden:

No VM has agent reporting correctly within time window NUMBER_OF_SECONDS seconds, VM state for instance VM_NAME is TIMESTAMP,agent,start

Das Problem weist darauf hin, dass keine der VMs eines Jobs Berichte an den Batch-Dienst-Agent sendet.

Dieses Problem tritt häufig aus folgenden Gründen auf:

  • Die Berechtigungen der VMs des Jobs reichen nicht aus. Die VMs eines Jobs erfordern bestimmte Berechtigungen, um ihren Status an den Batch-Dienst-Agent zu melden. Sie können diese Berechtigungen für die VMs eines Jobs bereitstellen, indem Sie dem Dienstkonto des Jobs die Rolle „Batch Agent Reporter“ (roles/batch.agentReporter) zuweisen.
  • Die VMs des Jobs haben Netzwerkprobleme. Die VMs eines Jobs benötigen Netzwerkzugriff, um mit dem Batch-Dienst-Agent zu kommunizieren.
  • Die VMs des Jobs verwenden ein veraltetes Batch-VM-Betriebssystem-Image oder ein VM-Betriebssystem-Image mit veralteter Batch-Dienst-Agent-Software. Die VMs des Jobs erfordern Software im VM-Betriebssystem-Image, das die aktuellen Abhängigkeiten für die Berichterstellung an den Batch-Dienst-Agent bereitstellt.

Lösung

So beheben Sie das Problem:

  1. Prüfen Sie, ob die VMs des Jobs die erforderlichen Berechtigungen haben, um ihren Status an den Batch-Dienst-Agent zu melden.

    1. Rufen Sie die Details des Jobs über die gcloud CLI oder Batch API auf, um das Dienstkonto des Jobs zu ermitteln. Wenn kein Dienstkonto aufgeführt ist, verwendet der Job standardmäßig das Compute Engine-Standarddienstkonto.
    2. Prüfen Sie, ob das Dienstkonto des Jobs Berechtigungen für die Rolle „Batch Agent Reporter“ (roles/batch.agentReporter) hat. Weitere Informationen finden Sie unter Zugriff verwalten und Dienstkontonutzung einschränken.

      Verwenden Sie beispielsweise den folgenden Befehl, um dem Compute Engine-Standarddienstkonto die erforderlichen Berechtigungen zu gewähren:

      gcloud projects add-iam-policy-binding PROJECT_ID \
        --role roles/batch.agentReporter \
        --member serviceAccount:PROJECT_NUMBER-compute@developer.gserviceaccount.com
      
  2. Prüfen Sie, ob die VMs des Jobs ordnungsgemäßen Netzwerkzugriff haben. Weitere Informationen finden Sie unter Batch-Netzwerkübersicht und Häufige Netzwerkprobleme beheben.

  3. Wenn Sie das VM-Betriebssystem-Image für den Job angegeben haben, prüfen Sie, ob das VM-Betriebssystem-Image derzeit unterstützt wird.

    1. Wenn Sie Cloud Logging für den Job aktiviert haben, können Sie dieses Problem anhand der folgenden Agent-Logs (batch_agent_logs) identifizieren. Weitere Informationen finden Sie unter Job mithilfe von Logs analysieren.

      • Log für veralteten Batch-Dienst-Agent-Softwarefehler:

        rpc error: code = FailedPrecondition, desc = Invalid resource state for BATCH_AGENT_VERSION: outdated Batch agent version used.
        

        BATCH_AGENT_VERSION ist die Softwareversion für die Kommunikation mit dem Batch-Dienst-Agent, die der Job verwendet, z. B. cloud-batch-agent_20221103.00_p00.

      • Log für Fehler bei veraltetem Batch-VM-Betriebssystem-Image:

        rpc error: code = FailedPrecondition, desc = Invalid resource state for BATCH_VM_OS_IMAGE_NAME: outdated Batch image version.
        

        BATCH_VM_OS_IMAGE_NAME ist die spezifische Version eines VM-Betriebssystem-Images aus Batch, die der Job verwendet, z. B. batch-debian-11-20220909-00-p00.

    2. Sie können dieses Problem beheben, indem Sie ein neueres VM-Betriebssystem-Image verwenden. Wenn der Job ein benutzerdefiniertes Image verwendet, erstellen Sie das benutzerdefinierte Image anhand der neuesten Version eines unterstützten öffentlichen Images neu.

      Weitere Informationen finden Sie unter Unterstützte VM-Betriebssystem-Images und VM-Betriebssystem-Images ansehen.

  4. Erstellen Sie den Job neu.

Fehlende Ressourcenmesswerte in Cloud Monitoring

Problem

Sie möchten sich Ressourcenmesswerte für einen Job ansehen, aber einige oder alle erwarteten Messwerte fehlen.

Dieses Problem tritt häufig aus folgenden Gründen auf:

  • Die API wurde für Ihr Projekt nicht aktiviert. Auch wenn Sie alles andere in Ihrem Projekt korrekt konfigurieren, werden Ressourcenmesswerte möglicherweise erst angezeigt, wenn die Cloud Monitoring API aktiviert ist. Für den Ops-Agent müssen Sie auch die Cloud Logging API aktivieren.
  • Sie sind nicht berechtigt, die Messwerte anzusehen. Ohne ausreichende Berechtigungen können Sie keine Messwerte aufrufen.
  • Die VMs des Jobs wurden nicht ausgeführt. Messwerte für einen Job können erst erstellt werden, wenn mindestens eine der VMs des Jobs ausgeführt wird.
  • Die Konfiguration oder Berechtigungen des Jobs unterstützen keine Ops-Agent-Messwerte. Einige Ressourcenmesswerte können nur vom Ops-Agent bereitgestellt werden. Zur Unterstützung von Ops-Agent-Messwerten muss ein Job die Anforderungen für den Ops-Agent erfüllen, den Ops-Agent installieren und ein Dienstkonto verwenden, das Messwerte in Monitoring schreiben kann.
  • Sie müssen eine andere Methode oder einen anderen Filter verwenden, um die Messwerte anzusehen. Einige Methoden zum Anzeigen von Messwerten zeigen keine Messwerte für VMs an, nachdem die VMs gelöscht wurden. Außerdem werden Messwerte nicht angezeigt, wenn sie durch Filter oder den angezeigten Zeitraum weggelassen werden. Darüber hinaus haben Messwertgrafiken anpassbare Auflösungen, die dazu führen können, dass kleine Datenmengen zu dünn für die Anzeige sind.
  • Die Messwerte wurden gelöscht. Sie können Messwerte nach dem Löschen nicht mehr aufrufen. Dies geschieht automatisch nach der Monitoring-Aufbewahrungsdauer.

Lösung

Wenn nur Ops-Agent-Messwerte fehlen, versuchen Sie zuerst, das Problem so zu beheben:

  1. So prüfen Sie die Konfiguration des Jobs:
    1. Die vollständigen Konfigurationsinformationen des Jobs finden Sie unter Rufen Sie die Details des Jobs über die gcloud CLI oder Batch API auf. Verwenden Sie die Ausgabe für die verbleibenden Schritte.
    2. Prüfen Sie, ob das Dienstkonto des Jobs die Berechtigungen zum Schreiben von Ops-Agent-Messwerten hat.
    3. Prüfen Sie, ob der Job alle Anforderungen an den Ops-Agent erfüllt.
    4. Prüfen Sie, ob der Ops-Agent durch den Job korrekt installiert wird. Es ist zwar möglich, den Ops-Agent manuell in einer ausführbaren Datei zu installieren, aber wir empfehlen, den Ops-Agent automatisch zu installieren. Dazu setzen Sie das Feld installOpsAgent auf true.
  2. Wenn das Problem weiterhin besteht, lesen Sie die Informationen unter Fehlerbehebung beim Ops-Agent in der Dokumentation zur Google Cloud-Beobachtbarkeit.

Andernfalls können Sie das Problem so beheben:

  1. Achten Sie darauf, dass die Monitoring API für Ihr Projekt aktiviert ist:

    Aktivieren Sie die API

  2. Prüfen Sie, ob die VMs des Jobs gestartet wurden und die Ausführungszeit noch innerhalb der Monitoring-Aufbewahrungsdauer liegt. Die Laufzeit des Jobs finden Sie in den Details des Jobs.
  3. Prüfen Sie, ob mit den Methoden, die Sie zum Aufrufen von Messwerten verwenden, Probleme vorliegen. Gehen Sie dazu so vor:
    1. Wenn Sie keine Messwerte nur für laufende Ressourcen sehen möchten, müssen Sie dafür sorgen, dass die Messwerte mit dem Metrics Explorer oder einem benutzerdefinierten Dashboard aus Metrics Explorer-Diagrammen angezeigt werden. Andere Methoden wie Compute Engine-Dashboards zeigen keine Messwerte für Ressourcen an, die gelöscht wurden.
    2. Achten Sie darauf, dass der Anzeigezeitraum die Ausführungszeit des Jobs enthält. Achten Sie bei Grafiken darauf, dass die Grafikauflösung für Ihre Daten geeignet ist.
    3. Achten Sie darauf, dass Sie keine Filter verwenden, die die Daten ausblenden.
  4. Wenn das Problem weiterhin besteht, lesen Sie die Informationen zur Fehlerbehebung bei Cloud Monitoring in der Dokumentation zur Beobachtbarkeit von Google Cloud.

Verstoß gegen Einschränkung für externe IP-Adressen der VM

Problem

Das folgende Problem wird bei einem fehlgeschlagenen Job im Feld statusEvents angezeigt:

Instance VM_NAME creation failed: Constraint constraints/compute.vmExternalIpAccess violated for project PROJECT_NUMBER.
Add instance VM_NAME to the constraint to use external IP with it.

Dieses Problem tritt auf, weil Ihr Projekt, Ordner oder Ihre Organisation die Einschränkung der Organisationsrichtlinie compute.vmExternalIpAccess so festgelegt hat, dass nur VMs auf der Zulassungsliste externe IP-Adressen verwenden können.

Lösung

Erstellen Sie den Job neu und führen Sie einen der folgenden Schritte aus, um das Problem zu beheben:

Verstoß gegen Einschränkung für vertrauenswürdige Images

Problem

Das folgende Problem wird bei einem fehlgeschlagenen Job im Feld statusEvents angezeigt:

Instance VM_NAME creation failed: Constraint constraints/compute.trustedImageProjects violated for project PROJECT_ID. Use of images from project batch-custom-image is prohibited.

Lösung

Dieses Problem tritt auf, weil Ihr Projekt die Richtlinieneinschränkung für vertrauenswürdige Images (compute.trustedImageProjects) so festgelegt hat, dass Images aus Batch, die sich im Image-Projekt batch-custom-image befinden, nicht zulässig sind.

Führen Sie mindestens einen der folgenden Schritte aus, um das Problem zu beheben:

  • Erstellen Sie den Job neu, um ein VM-Betriebssystem-Image anzugeben, das durch die Richtlinieneinschränkung für vertrauenswürdige Images bereits zugelassen ist.
  • Bitten Sie Ihren Administrator, das Ändern der Einschränkung der Richtlinie für vertrauenswürdige Images zuzulassen, um VM-Betriebssystem-Images aus dem Image-Projekt batch-custom-image zuzulassen. Eine Anleitung dazu finden Sie unter Zugriff auf VM-Betriebssystem-Images für Batch steuern.

Job bei Verwendung einer Instanzvorlage fehlgeschlagen

Problem

Das folgende Problem tritt im Feld statusEvents bei einem fehlgeschlagenen Job auf, der eine Instanzvorlage verwendet:

INVALID_FIELD_VALUE,BACKEND_ERROR

Dieses Problem tritt aufgrund unklarer Probleme mit der Instanzvorlage des Jobs auf.

Lösung

So beheben Sie das Problem:

  1. Erstellen Sie eine MIG mit der Instanzvorlage und beobachten Sie, ob Fehler mit mehr Details auftreten.
  2. Optional: Weitere Informationen finden Sie im Vorgang mit langer Ausführungszeit, mit dem die MIG in der Google Cloud Console erstellt wird.

    Zu Compute Engine Operations

Exit-Codes für Aufgabenfehler

Wenn eine bestimmte Aufgabe in einem Job fehlschlägt, gibt die Aufgabe einen Exit-Code ungleich null zurück. Je nachdem, wie Sie das Feld ignoreExitStatus konfigurieren, kann eine fehlgeschlagene Aufgabe dazu führen, dass ein Job fehlschlägt.

Neben den Exit-Codes, die Sie in einem ausführbaren Code definieren, verfügt ein Batch über mehrere reservierte Exit-Codes, einschließlich der folgenden Exit-Codes.

VM-Präemption (50001)

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to Spot Preemption with exit code 50001.

Dieses Problem tritt auf, wenn eine Spot-VM für den Job während der Laufzeit vorzeitig beendet wird.

Lösung

Führen Sie einen der folgenden Schritte aus, um das Problem zu beheben:

  • Wiederholen Sie die Aufgabe mithilfe von automatisierten Aufgabenwiederholungen oder führen Sie den Job manuell noch einmal aus.
  • Verwenden Sie stattdessen VMs mit dem Standardbereitstellungsmodell, um sicherzustellen, dass es nicht vorzeitig beendet wird.

Zeitlimit für VM-Berichterstellung (50002)

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to Batch no longer receives VM updates with exit code 50002.

Dieses Problem tritt auf, wenn eine VM im Back-End aufgrund einer Zeitüberschreitung keine Updates mehr erhält.

Lösung

Zum Beheben dieses Problems wiederholen Sie die Aufgabe entweder mithilfe von automatisierten Aufgabenwiederholungen oder führen Sie den Job manuell noch einmal aus.

VM wurde während der Ausführung neu gestartet (50003)

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to VM is rebooted during task execution with exit code 50003.

Dieses Problem tritt auf, wenn eine VM für einen Job während der Laufzeit unerwartet neu startet.

Lösung

Zum Beheben dieses Problems wiederholen Sie die Aufgabe entweder mithilfe von automatisierten Aufgabenwiederholungen oder führen Sie den Job manuell noch einmal aus.

VM und Aufgabe reagieren nicht (50004)

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to tasks cannot be canceled with exit code 50004.

Dieses Problem tritt auf, wenn eine Aufgabe das Zeitlimit erreicht, die nicht reagiert, und nicht abgebrochen werden kann.

Lösung

Zum Beheben dieses Problems wiederholen Sie die Aufgabe entweder mithilfe von automatisierten Aufgabenwiederholungen oder führen Sie den Job manuell noch einmal aus.

Aufgabe wird über die maximale Laufzeit (50.005) ausgeführt

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to task runs over the maximum runtime with exit code 50005.

Dieses Problem tritt in den folgenden Fällen auf:

  • Die Ausführungszeit einer Aufgabe überschreitet das im Feld maxRunDuration angegebene Zeitlimit
  • Die Laufzeit eines ausführbaren Objekts überschreitet das im Feld timeout angegebene Zeitlimit

Um herauszufinden, welches Zeitlimit überschritten wurde, rufen Sie die Logs für den Job auf und suchen Sie nach einem Log, in dem der Exit-Code 50005 erwähnt wird. Das Feld textPayload dieses Logs gibt an, wo und wann das Zeitlimit überschritten wurde.

Lösung

Versuchen Sie, das Problem zu beheben, indem Sie die Gesamtlaufzeit prüfen, die für die Aufgabe oder das ausführbare Tool erforderlich ist und das Zeitlimit überschritten hat. Führen Sie anschließend einen der folgenden Schritte aus:

  • Wenn Sie diesen Fehler nur gelegentlich erwarten, z. B. bei einer Aufgabe oder bei einer Ausführung mit einer inkonsistenten Laufzeit, können Sie versuchen, den Job neu zu erstellen und ihn so zu konfigurieren, dass Aufgabenwiederholungen automatisiert werden, um die Erfolgsquote zu erhöhen.

  • Wenn die Ausführung oder das Ausführen einer Aufgabe konsistent und absichtlich mehr Zeit benötigt, als das aktuelle Zeitlimit zulässt, können Sie ein längeres Zeitlimit festlegen.

VM, die während der Ausführung neu erstellt wurde (50006)

Problem

Das folgende Problem wird im Feld statusEvents eines Jobs angezeigt:

Task state is updated from PRE-STATE to FAILED on zones/ZONE/instances/INSTANCE_ID due to VM is recreated during task execution with exit code 50006.

Dieses Problem tritt auf, wenn eine VM für einen Job während der Laufzeit unerwartet neu erstellt wird.

Lösung

Zum Beheben dieses Problems wiederholen Sie die Aufgabe entweder mithilfe von automatisierten Aufgabenwiederholungen oder führen Sie den Job manuell noch einmal aus.

Nächste Schritte