Oracle RAC 문제 해결

이 페이지에서는 베어메탈 솔루션의 Oracle RAC와 관련된 문제의 문제 해결 팁을 제공합니다.

알려진 문제 및 제한사항 페이지에서 질문 또는 문제가 이미 해결되었는지 확인하세요.

OpenSSH 오류로 SSH 인증 실패

SSH 확인에 다음과 같은 OpenSSH 오류가 발생하여 실패할 수 있습니다.

OpenSSH_6.7: ERROR [INS-06003] Failed to setup passwordless SSH connectivity During Grid Infrastructure Install

이 문제를 해결하려면 다음 단계를 따르세요.

  1. /etc/ssh/sshd_config 파일에서 다음 줄을 추가합니다.

    KexAlgorithms curve25519-sha256@libssh.org,ecdh-sha2-nistp256,ecdh-sha2-nistp384,ecdh-sha2-nistp521,diffie-hellman-group-exchange-sha256,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,diffie-hellman-group1-sha1
    
  2. sshd 서비스를 다시 시작하여 변경사항을 적용합니다.

    /etc/init.d/sshd restart
    

SCP 파일 복사에 시간이 너무 오래 걸림

베어메탈 솔루션 SSH 데몬 구성 문제로 인해 키 재지정 작업을 사용하는 SCP 파일 복사를 완료하는 데 너무 오래 걸릴 수 있습니다.

이 문제를 해결하려면 다음 단계를 따르세요.

  1. 베어메탈 솔루션 서버에서 sshd_config 파일을 수정 모드로 엽니다.

    vi /etc/ssh/sshd_config
    
  2. sshd_config 파일에서 다음 줄을 추가합니다. 파일에 해당 줄이 이미 있는 경우 다음과 같이 수정합니다.

    ClientAliveInterval 420
    
  3. sshd 서비스를 다시 시작하여 변경사항을 적용합니다.

    /etc/init.d/sshd restart
    

CRS root.sh 또는 OCSSD가 No Network HB 오류로 함께 실패

노드가 IP 주소 169.254.169.254를 핑하는 경우 CRS root.sh 스크립트가 다음 오류와 함께 실패합니다.

has a disk HB, but no network HB

IP 주소 169.254.169.254는 Google Cloud에 인스턴스를 등록하는 Google Cloud 메타데이터 서비스입니다. 이 IP 주소를 차단하면 Google Cloud VM을 부팅할 수 없습니다. 그러면 HAIP 통신 경로가 중단되어 베어메탈 솔루션 RAC 서버에 HAIP 통신 문제가 발생할 수 있습니다.

이 문제를 해결하려면 IP 주소를 차단하거나 HAIP를 사용 중지해야 합니다. 다음 예는 route 명령어로 IP 주소를 차단하는 방법을 보여줍니다. route 문에 의해 변경된 내용은 지속되지 않습니다. 따라서 시스템 시작 스크립트를 수정해야 합니다.

이 문제를 해결하려면 다음 단계를 따르세요.

  1. root.sh 스크립트를 다시 실행하기 전에 모든 노드에서 다음 명령어를 실행합니다.

    /sbin/route add -host 169.254.169.254 reject
    
  2. rc 스크립트를 실행 가능하게 만듭니다.

    chmod +x /etc/rc.d/rc.local
    
  3. /etc/rc.d/rc.local 파일에 다음 라인을 추가합니다.

    /sbin/route add -host 169.254.169.254 reject
    
    Enable rc-local service
    systemctl status rc-local.service
    systemctl enable rc-local.service
    systemctl start rc-local.service
    

재부팅 프로세스가 응답하지 않음

서버에서 Red Hat Linux, OVM, SUSE Linux를 실행 중이고 여기에 연결된 LUN이 많은 경우, 재부팅 프로세스가 응답하지 않을 수 있습니다.

이 문제를 해결하려면 기본 워치독 제한 시간 값을 늘립니다.

  1. /etc/systemd 아래에 system.conf.d라는 폴더를 만듭니다.

  2. 폴더에서 *.conf 파일을 만듭니다. 예를 들면 /etc/systemd/system.conf.d/kernel-reboot-workaround.conf입니다.

  3. *.conf 파일에서 다음 코드를 추가합니다.

    [Manager]
    
    RuntimeWatchdogSec=5min
    
    ShutdownWatchdogSec=5min
    

다른 해결 방법은 다음과 같습니다.

  1. 수정 모드에서 grub.cfg 파일을 엽니다.

    vi /etc/default/grub
    
  2. 설정에서 quiet 매개변수를 삭제합니다.

  3. GRUB_CMDLINE_LINUX 매개변수 뒤에 다음을 추가합니다.

    acpi_no_watchdog DefaultTimeoutStartSec=900s DefaultTimeoutStopSec=900s
    
  4. grub.cfg 파일을 다시 빌드합니다.

    grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg
    

Oracle Grid 인프라 12c가 Rejecting connection 오류와 함께 실패

다음 오류와 함께 Oracle Grid 인프라 12c 설치가 실패할 수 있습니다.

Rejecting connection from node 2 as MultiNode RAC is not supported or certified in this Configuration.

이 오류는 IP 주소 169.254.169.254가 Compute Engine VM의 로컬 메타데이터 서비스로 전달되어 베어메탈 솔루션 호스트가 Compute Engine VM인 것처럼 보이기 때문에 발생합니다. 이러한 구성은 Compute Engine VM의 비공개 서비스 계정 키를 유출할 수도 있습니다.

이 문제를 해결하려면 NAT 구성이 보안에 미치는 영향을 고려하고 외부 네트워크 액세스를 최대한 제한하세요. 다음 단계를 따르세요.

  • 클라우드 VM에서 메타데이터 서비스에 대한 액세스를 차단하세요.

    firewall-cmd --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter FORWARD 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
  • 베어메탈 솔루션 호스트에서 메타데이터 서비스에 대한 액세스를 차단하세요.

    firewall-cmd --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unreachable
    
    firewall-cmd --permanent --direct --add-rule ipv4 filter OUTPUT 0 -d 169.254.169.254 -j REJECT --reject-with icmp-host-unr