Oracle RAC-Probleme beheben

Diese Seite enthält Tipps zur Fehlerbehebung für Probleme im Zusammenhang mit Oracle RAC auf Bare-Metal-Lösung.

Prüfen Sie, ob Ihre Frage oder das Problem bereits auf der Seite Bekannte Probleme und Einschränkungen beantwortet wurde.

SSH-Bestätigung schlägt aufgrund eines OpenSSH-Fehlers fehl

Die SSH-Bestätigung schlägt möglicherweise mit dem folgenden OpenSSH-Fehler fehl:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

So beheben Sie das Problem:

  1. Fügen Sie in der Datei /etc/ssh/sshd_config die folgende Zeile hinzu:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Starten Sie den Dienst sshd neu, damit die Änderungen übernommen werden.

    /etc/init.d/sshd restart
    

Kopieren der SCP-Datei dauert zu lange

Das Kopieren von SCP-Dateien mit Neuverschlüsselung kann aufgrund eines SSH-Daemon-Konfigurationsproblems der Bare-Metal-Lösung zu lange dauern.

So beheben Sie das Problem:

  1. Öffnen Sie auf Ihrem Bare-Metal-Lösungsserver die Datei sshd_config im Bearbeitungsmodus.

    vi /etc/ssh/sshd_config
    
  2. Fügen Sie in der Datei sshd_config die folgende Zeile hinzu. Wenn die Zeile bereits in der Datei vorhanden ist, ändern Sie sie so:

    ClientAliveInterval 420
    
  3. Starten Sie den Dienst sshd neu, damit die Änderungen übernommen werden.

    /etc/init.d/sshd restart
    

CRS root.sh oder OCSSD schlägt mit dem Fehler No Network HB fehl

Wenn der Knoten die IP-Adresse 169.254.169.254 anpingt, schlägt das CRS-root.sh-Script mit dem folgenden Fehler fehl:

has a disk HB, but no network HB

Die IP-Adresse 169.254.169.254 ist der Google Cloud-Metadatendienst die die Instanz in Google Cloud registriert. Wenn Sie diese IP-Adresse blockieren kann die Google Cloud-VM nicht gestartet werden. Dies kann wiederum die HAIP-Kommunikationsroute unterbrechen und zu HAIP-Kommunikationsproblemen auf den Bare-Metal-Lösungs-RAC-Servern führen.

Um dieses Problem zu beheben, müssen Sie die IP-Adresse blockieren oder HAIP deaktivieren. Die Das folgende Beispiel zeigt, wie IP-Adressen mit route-Befehlen blockiert werden. Die durch die route-Anweisung vorgenommenen Änderungen sind nicht dauerhaft. Daher müssen Sie die Systemstartscripts ändern.

So beheben Sie das Problem:

  1. Führen Sie auf allen Knoten den folgenden Befehl aus, bevor Sie root.sh noch einmal ausführen .

    /sbin/route add -host 169.254.169.254 reject
    
  2. Machen Sie das rc-Script ausführbar.

    chmod +x /etc/rc.d/rc.local
    
  3. Fügen Sie in der Datei /etc/rc.d/rc.local die folgenden Zeilen hinzu:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

Neustart reagiert nicht

Wenn auf Ihrem Server Red Hat Linux, OVM oder SUSE Linux ausgeführt wird und viele LUNs angeschlossen sind, reagiert der Neustart möglicherweise nicht mehr.

Erhöhen Sie den Standardwert für das Zeitlimit von Watchdog, um dieses Problem zu beheben:

  1. Erstellen Sie unter /etc/systemd einen Ordner mit dem Namen system.conf.d.

  2. Erstellen Sie in dem Ordner eine *.conf-Datei. Beispiel: /etc/systemd/system.conf.d/kernel-reboot-workaround.conf

  3. Fügen Sie in der Datei *.conf den folgenden Code hinzu:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Eine alternative Problemumgehung ist folgende:

  1. Öffnen Sie die Datei grub.cfg im Bearbeitungsmodus.

    vi /etc/default/grub
    
  2. Entfernen Sie den Parameter quiet aus den Einstellungen.

  3. Fügen Sie nach dem Parameter GRUB_CMDLINE_LINUX Folgendes ein:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Erstellen Sie die Datei grub.cfg neu.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Oracle Grid Infrastructure 12c schlägt mit dem Fehler Rejecting connection fehl

Die Installation von Oracle Grid Infrastructure 12c kann mit dem folgenden Fehler fehlschlagen:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Dieser Fehler tritt auf, weil die IP-Adresse 169.254.169.254 an den lokalen Metadatendienst einer Compute Engine-VM, sodass er wie die Bare-Metal-Lösung aussieht. ist eine Compute Engine-VM. Bei einer solchen Konfiguration kann auch der Private Compute Engine-VM Dienstkontoschlüssel.

Berücksichtigen Sie die Sicherheitsauswirkungen Ihrer NAT-Konfiguration und begrenzen Sie den externen Netzwerkzugriff so weit wie möglich, um dieses Problem zu beheben. Gehen Sie so vor:

  • Blockieren Sie den Zugriff auf den Metadatendienst auf Ihrer Cloud-VM:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Blockieren Sie den Zugriff auf den Metadatendienst auf dem Host der Bare-Metal-Lösung:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr