Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Linux
In diesem Dokument wird beschrieben, wie Sie Probleme mit Soft Lockups von vCPUs beheben. Ein Soft Lockup tritt auf, wenn die vCPU einer VM-Instanz mehr als 20 Sekunden lang keine neue Aufgabe ausführen kann. Die meisten Soft Lockups werden durch Fehler in der Anwendungssoftware verursacht.
Soft Lockups können dazu führen, dass VMs für kurze Zeit nicht mehr reagieren, den SSH-Zugriff auf VMs unterbrechen und Anwendungszeitüberschreitungen oder Failover auslösen. Bei VMs, die einen Soft Lockup aufweisen, kann die CPU-Auslastung je nach genauer Ursache des Soft Lockups auch ungewöhnlich hoch oder ungewöhnlich niedrig sein.
Temporäre Sperrungen identifizieren
Führen Sie einen der folgenden Schritte aus, um festzustellen, ob auf Ihrer VM ein Soft Lockup auftritt:
Nachdem Sie festgestellt haben, dass ein Soft Lockup auftritt, versuchen Sie, das Problem mit den folgenden Schritten zur Fehlerbehebung zu beheben:
Suchen Sie auf der Website Ihres Betriebssystemanbieters nach bekannten Fehlern in Ihrer Betriebssystemversion. Manchmal finden Sie im Stacktrace einen Verweis auf bestimmte Kernelmodule, der auf eine bestimmte Funktion oder einen bestimmten Vorgang hinweist.
Stellen Sie fest, ob das Soft Lockup mit einer bestimmten Häufigkeit auftritt, z. B. bei hoher Last oder bei bestimmten Aktivitäten. Wenn die Soft Lockups mit einer hohen Last zusammenhängen, müssen Sie möglicherweise Ihre Arbeitslast neu konfigurieren, z. B. indem Sie eine größere VM verwenden oder die Last auf mehrere VMs aufteilen.
Prüfen Sie, ob die Soft Lockups mit Änderungen an Ihrer Laufzeitumgebung zusammenhängen, z. B. mit neuen Softwarebereitstellungen oder Updates des Betriebssystem-Images.
Prüfen Sie, ob um den Zeitpunkt des Soft Lockup Wartungsereignisse stattgefunden haben. Sehen Sie dazu in den Audit-Logs nach Audit-Logs zu Systemereignissen.
Wenn das Problem durch die vorherigen Schritte zur Fehlerbehebung nicht behoben wurde, stellen Sie eine Supportanfrage und geben Sie alle Informationen an, die Sie bei der Fehlerbehebung gesammelt haben.
Best Practices zur Vermeidung von Soft Lockups
Um Soft Lockups auf Ihren VMs zu vermeiden, empfehlen wir Ihnen, die folgenden Best Practices zu implementieren:
Achten Sie darauf, dass für Ihr System geeignete redundante Komponenten wie Hochverfügbarkeitscluster konfiguriert sind, um eine Failover-Funktion bereitzustellen, wenn bei einer bestimmten VM ein längerer Soft Lockup auftritt. Weitere Informationen finden Sie unter Resiliente Systeme konzipieren.
Testen Sie Ihre Arbeitslast mit simulierten Wartungsereignissen, um zu sehen, wie sie sich bei der Live-Migration (falls aktiviert) verhält, insbesondere bei Lasttests.
Wenn Sie einen benutzerdefinierten Linux-Kernel oder benutzerdefinierte Module auf Ihrer VM ausführen, testen Sie neue Änderungen unter Last, bevor Sie sie in Ihrer Produktionsumgebung bereitstellen.
Prüfen Sie, ob Sie aufgrund Ihrer benutzerdefinierten Änderungen keinen Support von Ihrem Betriebssystemanbieter erhalten.
Halten Sie Ihr Betriebssystem auf dem neuesten Stand. Weitere Informationen finden Sie unter Details zu Betriebssystemen.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eSoft lockups occur when a VM's vCPU cannot run a new task for over 20 seconds, often due to application software bugs.\u003c/p\u003e\n"],["\u003cp\u003eSoft lockups can cause VMs to become unresponsive, disrupt SSH access, and trigger application timeouts or failovers.\u003c/p\u003e\n"],["\u003cp\u003eSoft lockups can be identified by reviewing serial port output or operating system logs for a soft lockup stack trace, such as \u003ccode\u003ewatchdog: BUG: soft lockup - CPU#3 stuck for 22s!\u003c/code\u003e.\u003c/p\u003e\n"],["\u003cp\u003eTroubleshooting soft lockups involves checking for OS vendor known issues, identifying patterns with high load or environment changes, and evaluating maintenance events.\u003c/p\u003e\n"],["\u003cp\u003ePreventive measures include using redundant components, compute-optimized machine families for intense workloads, testing with simulated maintenance events, and keeping the OS up to date.\u003c/p\u003e\n"]]],[],null,["# Troubleshooting vCPU soft lockups\n\nLinux\n\n*** ** * ** ***\n\nThis document describes how to troubleshoot vCPU soft lockups. A *soft lockup*\noccurs when a virtual machine (VM) instance's vCPU is unable to run a new task\nfor more than 20 seconds. Most soft lockups are caused by bugs in application\nsoftware.\n\nSoft lockups can cause VMs to become unresponsive for short periods of time,\ndisrupt SSH access to VMs, and trigger application timeouts or failover. VMs\nthat are experiencing a soft lockup might also have unusually high or\nunusually low CPU utilization, depending on the exact cause of the soft lockup.\n\nIdentify soft lockups\n---------------------\n\nTo identify whether your VM is experiencing a soft lockup, do one of the\nfollowing:\n\n- If you previously enabled [serial port output logging](/compute/docs/troubleshooting/viewing-serial-port-output#enable-stackdriver) for your VM, [review serial port output](/compute/docs/troubleshooting/viewing-serial-port-output#viewing_serial_port_output) for a soft lockup stack trace.\n- Review your VM's operating system logs (`/var/log/messages`) for a soft lockup stack trace.\n\n**Example soft lockup stack trace** \n\n```\nwatchdog: BUG: soft lockup - CPU#3 stuck for 22s!\n```\n\nTo detect future soft lockups, you can do the following:\n\n1. [Enable serial port output logging](/compute/docs/troubleshooting/viewing-serial-port-output#enable-stackdriver).\n\n2. [Create a log-based alerting policy](/logging/docs/alerting/log-based-alerts#lba-definition)\n for the following log:\n\n ```\n resource.type=\"gce_instance\" log_id(\"serialconsole.googleapis.com/serial_port_1_output\") textPayload=~\"watchdog.*lockup\"\n ```\n | **Note:** When you test the query, it is likely that no logs appear. This is expected behavior.\n\nTroubleshoot soft lockups\n-------------------------\n\nAfter you've identified that a soft lockup is occurring, try the following\ntroubleshooting steps to resolve the issue:\n\n1. Check your OS vendor's site for known errors with your OS version. Sometimes you might find reference to specific kernel modules in the stack trace that suggests a particular function or operation that is involved.\n2. Identify whether the soft lockup repeats with any frequency, such as coinciding with high load or certain activities. If the soft lockups correlate with high load, you might need to reconfigure your workload, for example by using a larger VM or splitting the load across more VMs.\n3. Check if the soft lockups correlate with any changes to your runtime environment such as new software deployments or OS image updates.\n4. Evaluate whether any [maintenance events](/compute/docs/instances/host-maintenance-overview#maintenanceevents) have taken place around the time of the soft lockup, by reviewing [audit logs](/compute/docs/logging/audit-logging#viewing_logs) for system event audit logs.\n\nIf the proceeding troubleshooting steps didn't resolve the issue,\n[file a support case](/support/docs/customer-care-procedures#create_a_support_case)\nand include all of the information you gathered from troubleshooting.\n\nBest practices to avoid soft lockups\n------------------------------------\n\nTo help prevent your VMs from experiencing soft lockups, we recommend\nimplementing the following best practices:\n\n- Ensure that you have appropriate redundant components configured for your system, such as high availability clusters, to provide a failover capability if a particular VM experiences a prolonged soft lockup. For more information, see [Designing resilient systems](/compute/docs/tutorials/robustsystems).\n- For compute-intensive workloads, consider using [compute-optimized machine families](/compute/docs/compute-optimized-machines).\n- Test your workload with simulated [maintenance events](/compute/docs/instances/host-maintenance-overview#maintenanceevents) to learn how your workload performs during live migration (if enabled), particularly under load testing.\n- If you're running a custom Linux Kernel or custom modules in your VM, test new changes under load before deploying them to your production environment. Confirm that your custom changes don't disqualify you from receiving support from your OS vendor.\n- Keep your operating system up to date. For more information, see [Operating system details](/compute/docs/images/os-details)."]]