Solucionar problemas de Oracle RAC
En esta página se ofrecen consejos para solucionar problemas relacionados con Oracle RAC en la solución Bare Metal.
Comprueba si tu pregunta o problema ya se ha tratado en la página Problemas conocidos y limitaciones.
La verificación de SSH falla con un error de OpenSSH
La verificación SSH puede fallar y mostrar el siguiente error de OpenSSH:
OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install
Para solucionar este problema, sigue estos pasos:
En el archivo
/etc/ssh/sshd_config
, añade la siguiente línea:KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
Reinicia el servicio
sshd
para aplicar los cambios./etc/init.d/sshd restart
La copia de archivos SCP tarda demasiado
La copia de archivos SCP con la operación de cambio de clave puede tardar demasiado en completarse debido a un problema de configuración del daemon SSH de Solución Bare Metal.
Para solucionar este problema, sigue estos pasos:
En tu servidor de Bare Metal Solution, abre el archivo
sshd_config
en modo de edición.vi /etc/ssh/sshd_config
En el archivo
sshd_config
, añade la siguiente línea. Si la línea ya existe en el archivo, modifícala de la siguiente manera:ClientAliveInterval 420
Reinicia el servicio
sshd
para aplicar los cambios./etc/init.d/sshd restart
Se produce un error No Network HB
en CRS root.sh
o OCSSD
La secuencia de comandos CRS root.sh
falla con el siguiente error si el nodo hace ping a la dirección IP 169.254.169.254:
has a disk HB, but no network HB
La dirección IP 169.254.169.254 es el Google Cloud servicio de metadatos que registra la instancia en Google Cloud. Si bloqueas esta dirección IP, la VM no podrá iniciarse. Google Cloud Esto, a su vez, puede interrumpir la ruta de comunicación de HAIP, lo que provoca que los servidores RAC de Solución Bare Metal tengan problemas de comunicación de HAIP.
Para solucionar este problema, debes bloquear la dirección IP o inhabilitar HAIP. En el siguiente ejemplo se muestra cómo bloquear una dirección IP con comandos route
. Los cambios realizados por la instrucción route
no son permanentes. Por lo tanto, debes modificar las secuencias de comandos de inicio del sistema.
Para solucionar este problema, sigue estos pasos:
En todos los nodos, ejecuta el siguiente comando antes de volver a ejecutar la secuencia de comandos
root.sh
./sbin/route add -host 169.254.169.254 reject
Haz que la secuencia de comandos
rc
sea ejecutable.chmod +x /etc/rc.d/rc.local
En el archivo
/etc/rc.d/rc.local
, añade las siguientes líneas:/sbin/route add -host 169.254.169.254 reject Enable rc-local service systemctl status rc-local.service systemctl enable rc-local.service systemctl start rc-local.service
El proceso de reinicio no responde
Si tu servidor ejecuta Red Hat Linux, OVM o SUSE Linux y tiene muchas LUNs conectadas, es posible que el proceso de reinicio deje de responder.
Para solucionar este problema, aumenta el valor de tiempo de espera predeterminado del watchdog:
En
/etc/systemd
, crea una carpeta llamadasystem.conf.d
.En la carpeta, crea un archivo
*.conf
. Por ejemplo,/etc/systemd/system.conf.d/kernel-reboot-workaround.conf
.En el archivo
*.conf
, añade el siguiente código:[Manager] RuntimeWatchdogSec=5min ShutdownWatchdogSec=5min
Una solución alternativa es la siguiente:
Abre el archivo
grub.cfg
en el modo de edición.vi /etc/default/grub
Quita el parámetro
quiet
de los ajustes.Añade lo siguiente después del parámetro
GRUB_CMDLINE_LINUX
:acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
Vuelve a crear el archivo
grub.cfg
.grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
Oracle Grid Infrastructure 12c falla y devuelve el error Rejecting connection
Es posible que la instalación de la infraestructura de Oracle Grid 12c falle y se muestre el siguiente error:
Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.
Este error se produce porque la dirección IP 169.254.169.254 se reenvía al servicio de metadatos local de una VM de Compute Engine, lo que hace que parezca que el host de Bare Metal Solution es una VM de Compute Engine. Esta configuración también podría filtrar las claves privadas de la cuenta de servicio de la VM de Compute Engine.
Para solucionar este problema, tenga en cuenta las implicaciones de seguridad de su configuración de NAT y limite el acceso a la red externa tanto como sea posible. Haz lo siguiente:
Bloquea el acceso al servicio de metadatos en tu VM de nube:
firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
Bloquea el acceso al servicio de metadatos en el host de Bare Metal Solution:
firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr