Praktik Terbaik untuk penginstalan RAC di Solusi Bare Metal

Halaman ini berisi praktik terbaik yang perlu ditinjau sebelum menginstal Oracle RAC di Solusi Bare Metal.

1. Bug Panjang Nama Cluster GI Oracle 18c.

Oracle GI 18C memiliki bug panjang nama cluster yang memengaruhi Solusi Bare Metal.

Tindakan yang disarankan:

Nama cluster harus kurang dari 15 karakter. Jika tidak, skrip root.sh akan gagal pada langkah pertama dengan error host name is too long. Nama cluster default lebih panjang dari 15 karakter, jadi Anda harus mengubahnya sebelum menjalankan skrip.

2. SSH

Verifikasi SSH dapat gagal karena masalah OPEN ssh.

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install (Doc ID 2111092.1)

Tindakan yang disarankan:

Edit the `/etc/ssh/sshd_config` file to contain the following line:

KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1

Mulai ulang layanan sshd agar perubahan dapat diterapkan.

/etc/init.d/sshd restart

3. Server VNC

Server arbitrer seperti VNC akan diblokir oleh konfigurasi firewall OS default. Sebagai gantinya, buat tunnel Xwindows atau VNC melalui SSH:

ssh -L 5901:localhost:5901 bms-host
vncviewer localhost:1

4. Sistem File Root

Pastikan sistem file / root memiliki ruang kosong yang cukup.

Anda memerlukan minimal 20 GB ruang penyimpanan untuk host agar dapat membuat sistem file root-nya.

5. DNS

Jika Anda tidak menggunakan Cloud DNS, instal server nama Anda sendiri di Solusi Bare Metal yang me-resolve alamat IP host. Oracle Grid Infrastructure menggunakan perintah nslookup untuk mendapatkan nama DNS. nslookup tidak menggunakan /etc/hosts.

# install these files:
yum makecache
yum install dnsmasq

## Edit /etc/dnsmasq.conf and add these lines:
port=53
domain-needed
bogus-priv
strict-order
expand-hosts
domain=localdomain
address=/.localdomain/127.0.0.1
address=//127.0.0.1
listen-address=127.0.0.1
resolv-file=/etc/dnsmasq-resolv.conf
# Save the file.

# The files /etc/dnsmasq-resolv.conf and /etc/resolv.conf should contain only
# the following one line. Edit them if this is not the case.
nameserver 127.0.0.1

# Start the dnsmasq service:
systemctl restart dnsmasq
systemctl status dnsmasq

# verify the host names are resolved:
nslookup <host name 1>
Server:         127.0.0.1
Address:        127.0.0.1#53

Name:   <host name 1>
Address: 192.168.1.10

nslookup <host name 2>
Server:         127.0.0.1
Address:        127.0.0.1#53

Name:   <host name 2>
Address: 192.168.1.11

6. Instal NTP.

Instal Network Time Protocol (NTP) dan pastikan semua node RAC menyinkronkan waktu denganjumpshot atau server NTP internal.

# install and start the NTP service
yum install ntp
systemctl start ntpd
# Add the following line to the /etc/ntp.conf file. In this case we are syncing
# with our bastion which is 10.x.x.x in this case. This can be your internal NTP
server. 192.x.x.x is your host.

restrict 192.x.x.x mask 255.255.255.0 nomodify notrap
server 10.x.x.x prefer

ntpdate -qu {your host name}

7. root.sh

Saat Anda menjalankan root.sh, jalankan satu node pada satu waktu.

8. Localhost.

Pastikan localhost me-resolve ke 127.0.0.1. Host tidak memasukkan localhost ke dalam file /etc/hosts.

9. Ulimit

Pastikan ulimit untuk pengguna root dan Oracle memiliki batas yang memadai.

10. Penyalinan file SCP memerlukan waktu lama dengan operasi rekey.

Hal ini disebabkan oleh masalah konfigurasi daemon ssh Solusi Bare Metal.

Tindakan yang disarankan:

# Modify your ssh config on the host server side.
vi /etc/ssh/sshd_config

# Add this line or modify it if you already set.
ClientAliveInterval 420

# Restart SSH
service sshd restart

11. OracleASM

Jika Anda menggunakan Oracle ASMLIB, pastikan untuk menetapkan variabel lingkungan ORACLEASM_SCANORDER sehingga perangkat ASM jalur tunggal Anda tidak dipilih terlebih dahulu oleh Oracle Automatic Storage Management.

Tindakan yang direkomendasikan: Tetapkan urutan pemindaian seperti di bawah.

ORACLEASM_SCANORDER="multipath sd"

12. CRS root.sh atau OCSSD gagal dengan Error No Network HB.

Dengan menggunakan Oracle Cluster Ready Services (CRS), skrip root.sh dapat gagal jika node dapat melakukan ping ke alamat IP 169.254.169.254. 169.254.169.254 adalah Google Cloud layanan metadata yang mendaftarkan instance di Google Cloud. Google Cloud VM tidak dapat melakukan booting jika Anda memblokir alamat IP ini. Namun, server RAC Solusi Bare Metal akan mengalami masalah komunikasi HAIP karena dapat mengganggu rute komunikasi HAIP. Jika demikian, Anda mungkin perlu memblokir alamat IP atau menonaktifkan HAIP. Contoh berikut menunjukkan cara memblokir IP dengan pernyataan rute. Pernyataan rute Linux tidak persisten, jadi Anda perlu menambahkan ke skrip jaringan atau rc.

Tindakan yang disarankan: Jalankan ini di semua node sebelum menjalankan kembali root.sh:

/sbin/route add -host 169.254.169.254 reject

# To make a permanent change, add the route statement to rc script.
chmod +x /etc/rc.d/rc.local

# Edit /etc/rc.d/rc.local and add this line:
/sbin/route add -host 169.254.169.254 reject

# Enable rc-local service
systemctl status rc-local.service
systemctl enable rc-local.service
systemctl start rc-local.service

13. Bug kernel Linux

Mulai ulang macet saat mesin memiliki banyak LUN yang terpasang untuk Redhat, OVM, SUSIE LINUX.

Tindakan yang direkomendasikan: tingkatkan nilai waktu tunggu watchdog default:

# Under /etc/systemd create a folder named: system.conf.d
# In this folder, create a *.conf file, example:
/etc/systemd/system.conf.d/kernel-reboot-workaround.conf

# The file needs to contain the following information:

[Manager]

RuntimeWatchdogSec=5min

ShutdownWatchdogSec=5min

Atau

gunakan solusi alternatif berikut:

# Edit the /etc/default/grub file.

# remove quote from settings, then add the following after this parameter
# GRUB_CMDLINE_LINUX :
acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s

2-3. Rebuild the grub
grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg

14. Masalah Max_sector_kb.

Penginstalan Oracle Grid Infrastructure(GI) dapat gagal dengan error exceed Max_sector_size dalam log penginstalan CRS dan /var/log/messages.

Tindakan yang disarankan:

# Add max_sectors_kb 1024 under the multipath entry for all the devices (WWIDs)
# that need the setting modified (under multipaths). All of them should look 
# similar to the following: multipath
{ wwid xxxxxyyyyyzzzz1111222
alias asm-data1
max_sectors_kb 1024 }

# Delete the map (multipath -f ). This needs to be done for all devices that
# need the setting modified Ex: multipath -f casm-dat001

# Reload the map: multipath -r

# In order to make this setting persistent across reboots, `initramfs` needs to
# be regenerated (the following command will regenerate all kernel versions):

KERNELS=$(rpm -q kernel --qf '%{version}-%{release}.%{arch}\n')
 for kernel_version in $KERNELS
 do
 dracut -v -f -a multipath /boot/initramfs-$kernel_version.img
 done

15. Masalah Infrastruktur Petak 12C.

Infrastruktur Grid 12C mungkin gagal dengan Rejecting connection from node 2 as MultiNode RAC isn't supported or certified in this configuration.

Penyebab:

IP 169.254.169.254 diteruskan ke layanan metadata lokal VM cloud, sehingga terlihat seperti host Solusi Bare Metal adalah VM cloud. Konfigurasi tersebut juga membocorkan kunci akun layanan pribadi VM cloud.

Tindakan yang disarankan:

Pertimbangkan implikasi keamanan konfigurasi NAT Anda, dan batasi akses jaringan eksternal sebanyak mungkin.

Blokir akses ke layanan metadata di VM cloud Anda:

firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable

Blokir akses ke layanan metadata di host BMS:

firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable