Oracle RAC-Probleme beheben

Auf dieser Seite finden Sie Tipps zur Fehlerbehebung bei Problemen mit Oracle RAC in der Bare-Metal-Lösung.

Prüfen Sie, ob Ihre Frage oder das Problem bereits auf der Seite Bekannte Probleme und Einschränkungen beantwortet wurde.

SSH-Bestätigung schlägt mit OpenSSH-Fehler fehl

Die SSH-Bestätigung kann mit dem folgenden OpenSSH-Fehler fehlschlagen:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

So beheben Sie das Problem:

  1. Fügen Sie in der Datei /etc/ssh/sshd_config die folgende Zeile hinzu:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Starten Sie den Dienst sshd neu, damit die Änderungen übernommen werden.

    /etc/init.d/sshd restart
    

SCP-Dateikopieren dauert zu lange

Das Kopieren von SCP-Dateien mit Neuverschlüsselung kann aufgrund eines SSH-Daemon-Konfigurationsproblems der Bare-Metal-Lösung zu lange dauern.

So beheben Sie das Problem:

  1. Öffnen Sie auf Ihrem Bare-Metal-Lösungsserver die Datei sshd_config im Bearbeitungsmodus.

    vi /etc/ssh/sshd_config
    
  2. Fügen Sie in der Datei sshd_config die folgende Zeile hinzu. Wenn die Zeile bereits in der Datei vorhanden ist, ändern Sie sie so:

    ClientAliveInterval 420
    
  3. Starten Sie den Dienst sshd neu, damit die Änderungen übernommen werden.

    /etc/init.d/sshd restart
    

CRS root.sh oder OCSSD schlägt mit dem Fehler No Network HB fehl

Wenn der Knoten die IP-Adresse 169.254.169.254 anpingt, schlägt das CRS-root.sh-Script mit dem folgenden Fehler fehl:

has a disk HB, but no network HB

Die IP-Adresse 169.254.169.254 ist der Google Cloud -Metadatendienst, der die Instanz in Google Cloudregistriert. Wenn Sie diese IP-Adresse blockieren, kann die Google Cloud VM nicht gestartet werden. Dies kann wiederum die HAIP-Kommunikationsroute unterbrechen und zu HAIP-Kommunikationsproblemen auf den Bare-Metal-Lösungs-RAC-Servern führen.

Um dieses Problem zu beheben, müssen Sie die IP-Adresse blockieren oder HAIP deaktivieren. Im folgenden Beispiel wird gezeigt, wie IP-Adressen mit route-Befehlen blockiert werden. Die Änderungen, die durch die route-Anweisung vorgenommen wurden, sind nicht dauerhaft. Daher müssen Sie die Systemstartscripts ändern.

So beheben Sie das Problem:

  1. Führen Sie auf allen Knoten den folgenden Befehl aus, bevor Sie das root.sh-Script noch einmal ausführen.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Machen Sie das rc-Script ausführbar.

    chmod +x /etc/rc.d/rc.local
    
  3. Fügen Sie in der Datei /etc/rc.d/rc.local die folgenden Zeilen hinzu:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

Neustartvorgang reagiert nicht

Wenn auf Ihrem Server Red Hat Linux, OVM oder SUSE Linux ausgeführt wird und viele LUNs angehängt sind, reagiert der Neustart möglicherweise nicht mehr.

Erhöhen Sie den Standardwert für die Watchdog-Zeitüberschreitung, um dieses Problem zu beheben:

  1. Erstellen Sie unter /etc/systemd einen Ordner mit dem Namen system.conf.d.

  2. Erstellen Sie im Ordner eine *.conf-Datei. Beispiel: /etc/systemd/system.conf.d/kernel-reboot-workaround.conf

  3. Fügen Sie in der Datei *.conf den folgenden Code hinzu:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Eine alternative Problemumgehung ist folgende:

  1. Öffnen Sie die Datei grub.cfg im Bearbeitungsmodus.

    vi /etc/default/grub
    
  2. Entfernen Sie den Parameter quiet aus den Einstellungen.

  3. Fügen Sie nach dem Parameter GRUB_CMDLINE_LINUX Folgendes hinzu:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Erstellen Sie die Datei grub.cfg neu.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Oracle Grid Infrastructure 12c schlägt mit dem Fehler Rejecting connection fehl

Die Installation von Oracle Grid Infrastructure 12c kann mit dem folgenden Fehler fehlschlagen:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Dieser Fehler tritt auf, weil die IP-Adresse 169.254.169.254 an den lokalen Metadatendienst einer Compute Engine-VM weitergeleitet wird, sodass es so aussieht, als wäre der Bare-Metal-Lösungshost eine Compute Engine-VM. Eine solche Konfiguration führt außerdem möglicherweise dazu, dass die privaten Dienstkontoschlüssel der Compute Engine-VM nicht bekannt sind.

Berücksichtigen Sie die Sicherheitsauswirkungen Ihrer NAT-Konfiguration und begrenzen Sie den externen Netzwerkzugriff so weit wie möglich, um dieses Problem zu beheben. Gehen Sie so vor:

  • Blockieren Sie den Zugriff auf den Metadatendienst auf der Cloud-VM:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Blockieren Sie den Zugriff auf den Metadatendienst auf dem Bare-Metal-Lösungs-Host:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr