Memecahkan masalah Oracle RAC

Halaman ini memberikan tips pemecahan masalah untuk masalah yang terkait dengan Oracle RAC pada Solusi Bare Metal.

Periksa apakah pertanyaan atau masalah Anda telah ditangani di halaman Masalah dan batasan umum.

Verifikasi SSH gagal dengan error OpenSSH

Verifikasi SSH mungkin gagal dengan error OpenSSH berikut:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

Untuk mengatasi masalah ini, lakukan langkah berikut:

  1. Dalam file /etc/ssh/sshd_config, tambahkan baris berikut:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Mulai ulang layanan sshd untuk menerapkan perubahan.

    /etc/init.d/sshd restart
    

Proses penyalinan file SCP terlalu lama

Proses penyalinan file SCP dengan operasi kunci ulang mungkin memerlukan waktu terlalu lama untuk diselesaikan karena adanya masalah konfigurasi daemon SSH Solusi Bare Metal.

Untuk mengatasi masalah ini, lakukan langkah berikut:

  1. Di server Solusi Bare Metal, buka file sshd_config dalam mode edit.

    vi /etc/ssh/sshd_config
    
  2. Di file sshd_config, tambahkan baris berikut. Jika baris tersebut sudah ada dalam file, ubah sebagai berikut:

    ClientAliveInterval 420
    
  3. Mulai ulang layanan sshd untuk menerapkan perubahan.

    /etc/init.d/sshd restart
    

CRS root.sh atau OCSSD gagal dengan No Network HB error

Skrip root.sh CRS gagal dengan error berikut jika node mengirim ping ke alamat IP 169.254.169.254:

has a disk HB, but no network HB

Alamat IP 169.254.169.254 adalah layanan metadata Google Cloud yang mendaftarkan instance tersebut di Google Cloud. Jika Anda memblokir alamat IP ini, VM Google Cloud tidak dapat melakukan booting. Hal ini kemudian dapat mengganggu rute komunikasi HAIP, yang menyebabkan server RAC Solusi Bare Metal mengalami masalah komunikasi HAIP.

Untuk mengatasi masalah ini, Anda perlu memblokir alamat IP atau menonaktifkan HAIP. Contoh berikut menunjukkan cara memblokir alamat IP dengan perintah route. Perubahan yang dibuat oleh pernyataan route tidak akan persisten. Oleh karena itu, Anda perlu mengubah skrip startup sistem.

Untuk mengatasi masalah ini, lakukan langkah berikut:

  1. Di semua node, jalankan perintah berikut sebelum menjalankan kembali skrip root.sh.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Jadikan skrip rc dapat dieksekusi.

    chmod +x /etc/rc.d/rc.local
    
  3. Dalam file /etc/rc.d/rc.local, tambahkan baris berikut:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

Proses mulai ulang tidak merespons

Jika server Anda menjalankan Red Hat Linux, OVM, atau SUSE Linux, dan ada banyak LUN yang terpasang padanya, proses mulai ulang mungkin berhenti merespons.

Untuk mengatasi masalah ini, tingkatkan nilai waktu tunggu watchdog default:

  1. Di bagian /etc/systemd, buat folder bernama system.conf.d.

  2. Dalam folder, buat file *.conf. Misalnya, /etc/systemd/system.conf.d/kernel-reboot-workaround.conf.

  3. Di file *.conf, tambahkan kode berikut:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Solusi alternatifnya adalah sebagai berikut:

  1. Buka file grub.cfg dalam mode edit.

    vi /etc/default/grub
    
  2. Hapus parameter quiet dari setelan.

  3. Tambahkan kode berikut setelah parameter GRUB_CMDLINE_LINUX:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Buat ulang file grub.cfg.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Infrastruktur Oracle Grid 12c gagal dengan error Rejecting connection

Instalasi Oracle Grid 12c mungkin gagal dengan error berikut:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Error ini terjadi karena alamat IP 169.254.169.254 diteruskan ke layanan metadata lokal VM Compute Engine, sehingga host Solusi Bare Metal tampak seperti VM Compute Engine. Konfigurasi tersebut juga dapat membocorkan kunci akun layanan pribadi VM Compute Engine.

Untuk mengatasi masalah ini, pertimbangkan implikasi keamanan konfigurasi NAT Anda dan batasi akses jaringan eksternal sebanyak mungkin. Lakukan hal berikut:

  • Blokir akses ke layanan metadata di Cloud VM Anda:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Blokir akses ke layanan metadata di host Solusi Bare Metal:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr