Solucionar problemas de Oracle RAC

En esta página, se proporcionan sugerencias para la solución de problemas relacionados con Oracle RAC en la solución Bare Metal.

Comprueba si tu pregunta o problema ya se abordó en la página Problemas y limitaciones conocidos.

La verificación de SSH falla con el error de OpenSSH

Es posible que la verificación de SSH falle con el siguiente error de OpenSSH:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

Para solucionar este problema, haz lo siguiente:

  1. En el archivo /etc/ssh/sshd_config, agrega la siguiente línea:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Reinicia el servicio sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

La copia del archivo SCP tarda demasiado

Es posible que la copia del archivo SCP con operación de cambio de clave tarde demasiado en completarse debido a un problema de configuración del daemon SSH de la solución Bare Metal.

Para solucionar este problema, haz lo siguiente:

  1. En el servidor de la solución Bare Metal, abre el archivo sshd_config en modo de edición.

    vi /etc/ssh/sshd_config
    
  2. En el archivo sshd_config, agrega la siguiente línea. Si la línea ya existe en el archivo, modifícalo de la siguiente manera:

    ClientAliveInterval 420
    
  3. Reinicia el servicio de sshd para aplicar los cambios.

    /etc/init.d/sshd restart
    

Falla de CRS root.sh o OCSSD con el error No Network HB

La secuencia de comandos root.sh de CRS falla con el siguiente error si el nodo hace ping a la dirección IP 169.254.169.254:

has a disk HB, but no network HB

La dirección IP 169.254.169.254 es el servicio de metadatos de Google Cloud que registra la instancia en Google Cloud. Si bloqueas esta dirección IP, la VM de Google Cloud no se puede iniciar. Esto, a su vez, puede interrumpir la ruta de comunicación de HAIP, lo que hace que los servidores de RAC de la solución Bare Metal experimenten problemas de comunicación de HAIP.

Para resolver este problema, debes bloquear la dirección IP o inhabilitar HAIP. El El siguiente ejemplo muestra cómo bloquear la dirección IP con comandos route. El los cambios realizados por la sentencia route no son persistentes. Por lo tanto, debes modificar las secuencias de comandos de inicio del sistema.

Para solucionar este problema, haz lo siguiente:

  1. En todos los nodos, ejecuta el siguiente comando antes de volver a ejecutar root.sh. secuencia de comandos.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Haz que la secuencia de comandos rc sea ejecutable.

    chmod +x /etc/rc.d/rc.local
    
  3. En el archivo /etc/rc.d/rc.local, agrega las siguientes líneas:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

El proceso de reinicio no responde

Si tu servidor ejecuta Red Hat Linux, OVM o SUSE Linux, y hay muchos Si tienes LUN conectados, es posible que el proceso de reinicio deje de responder.

Para resolver este problema, aumenta el valor de tiempo de espera del perro guardián predeterminado:

  1. En /etc/systemd, crea una carpeta llamada system.conf.d.

  2. En la carpeta, crea un archivo *.conf. Por ejemplo, /etc/systemd/system.conf.d/kernel-reboot-workaround.conf

  3. En el archivo *.conf, agrega el siguiente código:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Esta es una solución alternativa:

  1. Abre el archivo grub.cfg en modo de edición.

    vi /etc/default/grub
    
  2. Se quitó el parámetro quiet de la configuración.

  3. Agrega lo siguiente después del parámetro GRUB_CMDLINE_LINUX:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Vuelve a compilar el archivo grub.cfg.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

La infraestructura de Oracle Grid 12c falla con el error Rejecting connection.

La instalación de Oracle Grid Infrastructure 12c puede fallar con el siguiente error:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Este error ocurre porque la dirección IP 169.254.169.254 se reenvía al servicio de metadatos local de una VM de Compute Engine, lo que hace que se vea como la solución Bare Metal host es una VM de Compute Engine. Esta configuración también podría filtrar VMs de Compute Engine privadas claves de cuenta de servicio.

Para resolver este problema, considera las implicaciones de seguridad de tu configuración de NAT y limita el acceso a la red externa tanto como sea posible. Haz lo siguiente:

  • Bloquea el acceso al servicio de metadatos en la VM de nube:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Bloquea el acceso al servicio de metadatos en el host de la solución Bare Metal:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr