Oracle RAC に関する問題のトラブルシューティング

このページでは、Bare Metal Solution 上の Oracle RAC に関連する問題のトラブルシューティングに関するヒントを示します。

既知の問題と制限事項のページで、質問や問題がすでに解決されていないかを確認してください。

SSH 検証が OpenSSH エラーで失敗する

SSH 検証が次の OpenSSH エラーで失敗する場合があります。

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

この問題を解決するには、次の操作を行います。

  1. /etc/ssh/sshd_config ファイルに次の行を追加します。

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. sshd サービスを再起動して変更を適用します。

    /etc/init.d/sshd restart
    

SCP ファイルのコピーに過剰に長い時間を要する

Bare Metal Solution SSH デーモンの構成の問題により、鍵交換オペレーションを含む SCP ファイルのコピーが完了するまでに過剰に長い時間を要する場合があります。

この問題を解決するには、次の操作を行います。

  1. Bare Metal Solution サーバーで、sshd_config ファイルを編集モードで開きます。

    vi /etc/ssh/sshd_config
    
  2. sshd_config ファイルに次の行を追加します。ファイルにこの行がすでに存在する場合は、次のように変更します。

    ClientAliveInterval 420
    
  3. sshd サービスを再起動して変更を適用します。

    /etc/init.d/sshd restart
    

CRS の root.sh または OCSSD が No Network HB エラーで失敗する

ノードが IP アドレス 169.254.169.254 に ping すると、CRS root.sh スクリプトが次のエラーで失敗します。

has a disk HB, but no network HB

IP アドレス 169.254.169.254 は、Google Cloud にインスタンスを登録する Google Cloud メタデータ サービスです。この IP アドレスをブロックすると、Google Cloud VM は起動できません。これにより、HAIP 通信ルートが中断され、Bare Metal Solution RAC サーバーで HAIP 通信の問題が発生する可能性があります。

この問題を解決するには、IP アドレスをブロックするか、HAIP を無効にする必要があります。次の例は、route コマンドを使用して IP アドレスをブロックする方法を示しています。route ステートメントによる変更は永続的ではありません。そのため、システム起動スクリプトを変更する必要があります。

この問題を解決するには、次の操作を行います。

  1. すべてのノードで、root.sh スクリプトを再実行する前に次のコマンドを実行します。

    /sbin/route add -host 169.254.169.254 reject
    
  2. rc スクリプトを実行可能にします。

    chmod +x /etc/rc.d/rc.local
    
  3. /etc/rc.d/rc.local ファイルに次の行を追加します。

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

再起動プロセスが応答しない

サーバーで Red Hat Linux、OVM、SUSE Linux が実行され、多くの LUN が接続されている場合、再起動プロセスが応答しなくなることがあります。

この問題を解決するには、デフォルトのウォッチドッグ タイムアウト値を引き上げます。

  1. /etc/systemd の下に、system.conf.d という名前のフォルダを作成します。

  2. このフォルダに *.conf ファイルを作成します。例: /etc/systemd/system.conf.d/kernel-reboot-workaround.conf

  3. *.conf ファイルに、次のコードを追加します。

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

別の回避策は次のとおりです。

  1. grub.cfg ファイルを編集モードで開きます。

    vi /etc/default/grub
    
  2. 設定から quiet パラメータを削除します。

  3. パラメータ GRUB_CMDLINE_LINUX の後に次の行を追加します。

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. grub.cfg ファイルを再ビルドします。

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Oracle Grid Infrastructure 12c が Rejecting connection エラーで失敗する

Oracle Grid Infrastructure 12c のインストールが、次のエラーで失敗することがあります。

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

このエラーは、IP アドレス 169.254.169.254 が Compute Engine VM のローカル メタデータ サービスに転送され、Bare Metal Solution ホストが Compute Engine VM のように見えるために発生します。このような構成では、Compute Engine VM のプライベート サービス アカウント キーも漏洩する可能性があります。

この問題を解決するには、NAT 構成のセキュリティへの影響を考慮して、可能な限り外部ネットワーク アクセスを制限します。次の操作を行います。

  • Cloud VM でのメタデータ サービスへのアクセスをブロックします。

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • Bare Metal Solution ホストでのメタデータ サービスへのアクセスをブロックします。

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr