Soluciona problemas de Oracle RAC

En esta página, se proporcionan sugerencias para solucionar problemas relacionados con Oracle RAC en la solución Bare Metal.

Verifica si ya se resolvió tu pregunta o problema en la página Problemas y limitaciones conocidos.

La verificación SSH falla, ya que muestra el error de OpenSSH

La verificación de SSH podría fallar con el siguiente error de OpenSSH:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

Para solucionar este problema, haz lo siguiente:

  1. En el archivo /etc/ssh/sshd_config, agrega la siguiente línea:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Reinicia el servicio sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

La copia del archivo SCP está tardando demasiado

La copia del archivo SCP con operación de cambio de clave puede tardar demasiado en completarse debido a un problema de configuración del daemon SSH de la solución Bare Metal.

Para solucionar este problema, haz lo siguiente:

  1. En el servidor de la solución Bare Metal, abre el archivo sshd_config en modo de edición.

    vi /etc/ssh/sshd_config
    
  2. En el archivo sshd_config, agrega la siguiente línea. Si la línea ya existe en el archivo, modifícala de la siguiente manera:

    ClientAliveInterval 420
    
  3. Reinicia el servicio sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

CRS root.sh o OCSSD falla con el error No Network HB

La secuencia de comandos root.sh de CRS falla con el siguiente error si el nodo hace ping a la dirección IP 169.254.169.254:

has a disk HB, but no network HB

La dirección IP 169.254.169.254 es el servicio de metadatos de Google Cloud que registra la instancia en Google Cloud. Si bloqueas esta dirección IP, la VM de Google Cloud no se podrá iniciar. Esto, a su vez, puede interrumpir la ruta de comunicación de HAIP, lo que causa que los servidores RAC de la solución Bare Metal experimenten problemas de comunicación de HAIP.

Para resolver este problema, debes bloquear la dirección IP o inhabilitar HAIP. En el siguiente ejemplo, se muestra cómo bloquear la dirección IP con los comandos route. Los cambios que realiza la instrucción route no son persistentes. Por lo tanto, debes modificar las secuencias de comandos de inicio del sistema.

Para solucionar este problema, haz lo siguiente:

  1. En todos los nodos, ejecuta el siguiente comando antes de volver a ejecutar la secuencia de comandos root.sh.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Haz que la secuencia de comandos rc sea ejecutable.

    chmod +x /etc/rc.d/rc.local
    
  3. En el archivo /etc/rc.d/rc.local, agrega las siguientes líneas:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

El proceso de reinicio no responde

Si tu servidor ejecuta Red Hat Linux, OVM o SUSE Linux, y hay muchos LUN conectados, es posible que el proceso de reinicio deje de responder.

Para resolver este problema, aumenta el valor predeterminado del tiempo de espera del perro guardián:

  1. En /etc/systemd, crea una carpeta llamada system.conf.d.

  2. En la carpeta, crea un archivo *.conf. Por ejemplo, /etc/systemd/system.conf.d/kernel-reboot-workaround.conf

  3. En el archivo *.conf, agrega el siguiente código:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Una solución alternativa es la siguiente:

  1. Abre el archivo grub.cfg en modo de edición.

    vi /etc/default/grub
    
  2. Quita el parámetro quiet de la configuración.

  3. Agrega lo siguiente después del parámetro GRUB_CMDLINE_LINUX:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Vuelve a compilar el archivo grub.cfg.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

La infraestructura de Oracle Grid 12c falla con el error Rejecting connection.

La instalación de la infraestructura de Oracle Grid 12c puede fallar con el siguiente error:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Este error ocurre porque la dirección IP 169.254.169.254 se reenvía al servicio de metadatos local de una VM de Compute Engine, lo que hace que parezca que el host de la solución Bare Metal es una VM de Compute Engine. Esta configuración también puede filtrar las claves de la cuenta de servicio privada de la VM de Compute Engine.

Para resolver este problema, ten en cuenta las implicaciones de seguridad de tu configuración de NAT y limita el acceso a la red externa tanto como sea posible. Haz lo siguiente:

  • Bloquea el acceso al servicio de metadatos en la VM de la nube:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Bloquea el acceso al servicio de metadatos en el host de la solución Bare Metal:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr