Solucionar problemas de Oracle RAC

En esta página se ofrecen consejos para solucionar problemas relacionados con Oracle RAC en la solución Bare Metal.

Comprueba si tu pregunta o problema ya se ha tratado en la página Problemas conocidos y limitaciones.

La verificación de SSH falla con un error de OpenSSH

La verificación SSH puede fallar y mostrar el siguiente error de OpenSSH:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

Para solucionar este problema, sigue estos pasos:

  1. En el archivo /etc/ssh/sshd_config, añade la siguiente línea:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Reinicia el servicio sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

La copia de archivos SCP tarda demasiado

La copia de archivos SCP con la operación de cambio de clave puede tardar demasiado en completarse debido a un problema de configuración del daemon SSH de Solución Bare Metal.

Para solucionar este problema, sigue estos pasos:

  1. En tu servidor de Bare Metal Solution, abre el archivo sshd_config en modo de edición.

    vi /etc/ssh/sshd_config
    
  2. En el archivo sshd_config, añade la siguiente línea. Si la línea ya existe en el archivo, modifícala de la siguiente manera:

    ClientAliveInterval 420
    
  3. Reinicia el servicio sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

Se produce un error No Network HB en CRS root.sh o OCSSD

La secuencia de comandos CRS root.sh falla con el siguiente error si el nodo hace ping a la dirección IP 169.254.169.254:

has a disk HB, but no network HB

La dirección IP 169.254.169.254 es el Google Cloud servicio de metadatos que registra la instancia en Google Cloud. Si bloqueas esta dirección IP, la VM no podrá iniciarse. Google Cloud Esto, a su vez, puede interrumpir la ruta de comunicación de HAIP, lo que provoca que los servidores RAC de Solución Bare Metal tengan problemas de comunicación de HAIP.

Para solucionar este problema, debes bloquear la dirección IP o inhabilitar HAIP. En el siguiente ejemplo se muestra cómo bloquear una dirección IP con comandos route. Los cambios realizados por la instrucción route no son permanentes. Por lo tanto, debes modificar las secuencias de comandos de inicio del sistema.

Para solucionar este problema, sigue estos pasos:

  1. En todos los nodos, ejecuta el siguiente comando antes de volver a ejecutar la secuencia de comandos root.sh.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Haz que la secuencia de comandos rc sea ejecutable.

    chmod +x /etc/rc.d/rc.local
    
  3. En el archivo /etc/rc.d/rc.local, añade las siguientes líneas:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

El proceso de reinicio no responde

Si tu servidor ejecuta Red Hat Linux, OVM o SUSE Linux y tiene muchas LUNs conectadas, es posible que el proceso de reinicio deje de responder.

Para solucionar este problema, aumenta el valor de tiempo de espera predeterminado del watchdog:

  1. En /etc/systemd, crea una carpeta llamada system.conf.d.

  2. En la carpeta, crea un archivo *.conf. Por ejemplo, /etc/systemd/system.conf.d/kernel-reboot-workaround.conf.

  3. En el archivo *.conf, añade el siguiente código:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Una solución alternativa es la siguiente:

  1. Abre el archivo grub.cfg en el modo de edición.

    vi /etc/default/grub
    
  2. Quita el parámetro quiet de los ajustes.

  3. Añade lo siguiente después del parámetro GRUB_CMDLINE_LINUX:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Vuelve a crear el archivo grub.cfg.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Oracle Grid Infrastructure 12c falla y devuelve el error Rejecting connection

Es posible que la instalación de la infraestructura de Oracle Grid 12c falle y se muestre el siguiente error:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Este error se produce porque la dirección IP 169.254.169.254 se reenvía al servicio de metadatos local de una VM de Compute Engine, lo que hace que parezca que el host de Bare Metal Solution es una VM de Compute Engine. Esta configuración también podría filtrar las claves privadas de la cuenta de servicio de la VM de Compute Engine.

Para solucionar este problema, tenga en cuenta las implicaciones de seguridad de su configuración de NAT y limite el acceso a la red externa tanto como sea posible. Haz lo siguiente:

  • Bloquea el acceso al servicio de metadatos en tu VM de nube:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Bloquea el acceso al servicio de metadatos en el host de Bare Metal Solution:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr