Solucionar problemas de Oracle RAC
En esta página, se proporcionan sugerencias para la solución de problemas relacionados con Oracle RAC en la solución Bare Metal.
Comprueba si tu pregunta o problema ya se abordó en la página Problemas y limitaciones conocidos.
La verificación de SSH falla con el error de OpenSSH
Es posible que la verificación de SSH falle con el siguiente error de OpenSSH:
OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install
Para solucionar este problema, haz lo siguiente:
En el archivo
/etc/ssh/sshd_config
, agrega la siguiente línea:KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
Reinicia el servicio
sshd
para aplicar los cambios./etc/init.d/sshd restart
La copia del archivo SCP tarda demasiado
Es posible que la copia del archivo SCP con operación de cambio de clave tarde demasiado en completarse debido a un problema de configuración del daemon SSH de la solución Bare Metal.
Para solucionar este problema, haz lo siguiente:
En el servidor de la solución Bare Metal, abre el archivo
sshd_config
en modo de edición.vi /etc/ssh/sshd_config
En el archivo
sshd_config
, agrega la siguiente línea. Si la línea ya existe en el archivo, modifícalo de la siguiente manera:ClientAliveInterval 420
Reinicia el servicio de
sshd
para aplicar los cambios./etc/init.d/sshd restart
Falla de CRS root.sh
o OCSSD con el error No Network HB
La secuencia de comandos root.sh
de CRS falla con el siguiente error si el nodo hace ping a la dirección IP 169.254.169.254:
has a disk HB, but no network HB
La dirección IP 169.254.169.254 es el servicio de metadatos de Google Cloud que registra la instancia en Google Cloud. Si bloqueas esta dirección IP, la VM de Google Cloud no se puede iniciar. Esto, a su vez, puede interrumpir la ruta de comunicación de HAIP, lo que hace que los servidores de RAC de la solución Bare Metal experimenten problemas de comunicación de HAIP.
Para resolver este problema, debes bloquear la dirección IP o inhabilitar HAIP. El
El siguiente ejemplo muestra cómo bloquear la dirección IP con comandos route
. El
los cambios realizados por la sentencia route
no son persistentes. Por lo tanto, debes
modificar las secuencias de comandos de inicio del sistema.
Para solucionar este problema, haz lo siguiente:
En todos los nodos, ejecuta el siguiente comando antes de volver a ejecutar
root.sh
. secuencia de comandos./sbin/route add -host 169.254.169.254 reject
Haz que la secuencia de comandos
rc
sea ejecutable.chmod +x /etc/rc.d/rc.local
En el archivo
/etc/rc.d/rc.local
, agrega las siguientes líneas:/sbin/route add -host 169.254.169.254 reject Enable rc-local service systemctl status rc-local.service systemctl enable rc-local.service systemctl start rc-local.service
El proceso de reinicio no responde
Si tu servidor ejecuta Red Hat Linux, OVM o SUSE Linux, y hay muchos Si tienes LUN conectados, es posible que el proceso de reinicio deje de responder.
Para resolver este problema, aumenta el valor de tiempo de espera del perro guardián predeterminado:
En
/etc/systemd
, crea una carpeta llamadasystem.conf.d
.En la carpeta, crea un archivo
*.conf
. Por ejemplo,/etc/systemd/system.conf.d/kernel-reboot-workaround.conf
En el archivo
*.conf
, agrega el siguiente código:[Manager] RuntimeWatchdogSec=5min ShutdownWatchdogSec=5min
Esta es una solución alternativa:
Abre el archivo
grub.cfg
en modo de edición.vi /etc/default/grub
Se quitó el parámetro
quiet
de la configuración.Agrega lo siguiente después del parámetro
GRUB_CMDLINE_LINUX
:acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
Vuelve a compilar el archivo
grub.cfg
.grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
La infraestructura de Oracle Grid 12c falla con el error Rejecting connection
.
La instalación de Oracle Grid Infrastructure 12c puede fallar con el siguiente error:
Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.
Este error ocurre porque la dirección IP 169.254.169.254 se reenvía al servicio de metadatos local de una VM de Compute Engine, lo que hace que se vea como la solución Bare Metal host es una VM de Compute Engine. Esta configuración también podría filtrar VMs de Compute Engine privadas claves de cuenta de servicio.
Para resolver este problema, considera las implicaciones de seguridad de tu configuración de NAT y limita el acceso a la red externa tanto como sea posible. Haz lo siguiente:
Bloquea el acceso al servicio de metadatos en la VM de nube:
firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
Bloquea el acceso al servicio de metadatos en el host de la solución Bare Metal:
firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr