Resolver problemas do Oracle RAC

Esta página fornece dicas de solução de problemas relacionados ao Oracle RAC na Solução Bare Metal.

Verifique se sua dúvida ou problema já foi abordado na página Limitações e problemas conhecidos.

A verificação SSH falha com um erro do OpenSSH

A verificação de SSH pode falhar com o seguinte erro do OpenSSH:

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

Para resolver esse problema, faça o seguinte:

  1. No arquivo /etc/ssh/sshd_config, adicione esta linha:

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. Reinicie o serviço sshd para aplicar as mudanças.

    /etc/init.d/sshd restart
    

A cópia de arquivos SCP está demorando muito

A cópia do arquivo SCP com a operação de rechaveamento pode levar muito tempo para ser concluída devido a um problema de configuração do daemon SSH da Solução Bare Metal.

Para resolver esse problema, faça o seguinte:

  1. No servidor da Solução Bare Metal, abra o arquivo sshd_config no modo de edição.

    vi /etc/ssh/sshd_config
    
  2. No arquivo sshd_config, adicione a seguinte linha. Se a linha já existir no arquivo, modifique-a da seguinte maneira:

    ClientAliveInterval 420
    
  3. Reinicie o serviço sshd para aplicar as mudanças.

    /etc/init.d/sshd restart
    

O CRS root.sh ou o OCSSD falha com o erro No Network HB.

O script root.sh do CRS falha com o seguinte erro se o nó faz ping no endereço IP 169.254.169.254:

has a disk HB, but no network HB

O endereço IP 169.254.169.254 é o serviço de metadados Google Cloud , que registra a instância em Google Cloud. Se você bloquear esse endereço IP, a VM Google Cloud não será inicializada. Isso pode interromper a rota de comunicação HAIP, fazendo com que os servidores RAC da Solução Bare Metal apresentem problemas de comunicação HAIP.

Para resolver esse problema, bloqueie o endereço IP ou desative o HAIP. O exemplo abaixo mostra como bloquear o endereço IP com comandos route. As mudanças feitas pela instrução route não são persistentes. Portanto, você precisa modificar os scripts de inicialização do sistema.

Para resolver esse problema, faça o seguinte:

  1. Em todos os nós, execute o comando abaixo antes de executar o script root.sh novamente.

    /sbin/route add -host 169.254.169.254 reject
    
  2. Torne o script rc executável.

    chmod +x /etc/rc.d/rc.local
    
  3. No arquivo /etc/rc.d/rc.local, adicione estas linhas:

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

O processo de reinicialização não está respondendo

Se o servidor estiver executando Red Hat Linux, OVM ou SUSE Linux e houver muitos LUNs conectados a ele, o processo de reinicialização poderá parar de responder.

Para resolver esse problema, aumente o valor de tempo limite padrão do watchdog:

  1. Em /etc/systemd, crie uma pasta chamada system.conf.d.

  2. Na pasta, crie um arquivo *.conf. Por exemplo, /etc/systemd/system.conf.d/kernel-reboot-workaround.conf.

  3. No arquivo *.conf, adicione o seguinte código:

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

Uma solução alternativa é a seguinte:

  1. Abra o arquivo grub.cfg no modo de edição.

    vi /etc/default/grub
    
  2. Remova o parâmetro quiet das configurações.

  3. Adicione o seguinte após o parâmetro GRUB_CMDLINE_LINUX:

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. Crie o arquivo grub.cfg novamente.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

A infraestrutura de grade do Oracle 12c falha com o erro Rejecting connection

A instalação da Oracle Grid Infrastructure 12c pode falhar com o seguinte erro:

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

Esse erro ocorre porque o endereço IP 169.254.169.254 é encaminhado para o serviço de metadados local de uma VM do Compute Engine, fazendo com que pareça que o host da Solução Bare Metal é uma VM do Compute Engine. Essa configuração também pode vazar as chaves de conta de serviço particulares da VM do Compute Engine.

Para resolver esse problema, considere as implicações de segurança da configuração NAT e limite o acesso à rede externa o máximo possível. Faça o seguinte:

  • Bloqueie o acesso ao serviço de metadados na VM na nuvem:

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Bloqueie o acesso ao serviço de metadados no host da Solução Bare Metal:

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr