에어 갭이 적용된 Google Distributed Cloud 출시 노트

2024년 3월 5일 [GDC 1.12.1]


  • 이제 Google Distributed Cloud 에어 갭 적용형 1.12.1을 사용할 수 있습니다.
    Google Distributed Cloud(에어 갭 적용형)의 기능에 대해 알아보려면 제품 개요를 참고하세요.


최신 보안 패치와 중요 업데이트를 적용하기 위해 Rocky Linux 이미지 버전을 20240131로 업데이트했습니다. 버그 및 보안 취약점 수정을 활용하려면 각 출시마다 모든 노드를 업그레이드해야 합니다. 다음 보안 취약점이 수정되었습니다.


다음 컨테이너 이미지 보안 취약점이 수정되었습니다.


백업 및 복원:

  • 조직 버킷에 볼륨 백업을 할 수 없는 문제가 있습니다.
  • 조직 백업 경로가 실패합니다.

클러스터 관리:

  • Kubernetes 버전 1.27.x가 적용된 사용자 클러스터에 노드 풀이 초기화되지 않을 수 있습니다.

Istio:

  • Back-off pulling image "auto" 이벤트가 있는 ImagePullBackOff 상태의 포드

파일 및 블록 스토리지:

  • 1.11.1에서 1.12.1로 업그레이드할 때 file-netapp-trident 하위 구성요소 출시가 실패할 수 있습니다.

하드웨어 보안 모듈:

  • 하드웨어 보안 모듈의 순환 가능한 보안 비밀이 알 수 없는 상태입니다.

로깅:

  • 1.11.1에서 1.12.1로 업그레이드할 때 로그 구성요소에서 배포한 ValidatingWebhookConfigurations, MutatingWebhookConfigurations, MonitoringRules가 업그레이드되지 않을 수 있습니다.
  • cortex-ingester 포드에 OOMKilled 상태가 표시됩니다.
  • 외부 SIEM 대상으로 로그 내보내기를 사용 설정한 후 전달된 로그에 Kubernetes API 서버 로그가 포함되지 않습니다.

모니터링:

  • ServiceNow 웹훅을 구성하면 수명 주기 관리 (LCM)가 mon-system 네임스페이스에서 ConfigMap 객체 mon-alertmanager-servicenow-webhook-backendSecret 객체 mon-alertmanager-servicenow-webhook-backend에 적용된 변경사항을 다시 조정하고 되돌립니다.
  • 1.11.x에서 1.12.1로 업그레이드할 때 Cortex 버킷 삭제가 실패할 수 있습니다.
  • 감사 로그와 운영 로그가 수집되지 않습니다.
  • 구성에서 측정항목 스토리지 클래스가 잘못 정의되었습니다.
  • mon-prober-backend-prometheus-config ConfigMap이 프로브 작업을 포함하지 않도록 재설정되고 MON-A0001 알림이 트리거됩니다.

네트워킹:

  • GDC에서 VM 및 컨테이너 업데이트, 종료, 예약에 문제가 발생합니다.
  • 여러 스위치에서 사전 설치 스크립트가 실패합니다.
  • hairpinlink 커스텀 리소스 생성에 실패하여 1.11에서 1.12.1로 업그레이드할 수 없습니다.

노드 플랫폼:

  • 1.11.x에서 1.12.1로 업그레이드할 때 스위치 이미지 다운로드 포드가 ErrImagePull 상태에서 멈출 수 있습니다.
  • 1.11.x에서 1.12.1로 업그레이드하면 호스트 방화벽에서 스위치 이미지 다운로드를 차단합니다.

NTP 서버:

  • 다시 시작한 후 NTP 릴레이 서버 포드가 비정상 종료됩니다.
  • NTP 릴레이 작업 포드가 다시 시작된 후 비정상 종료됩니다.

물리적 서버:

  • 1.11.x에서 1.12.1로 업그레이드할 때 NodeUpgrade에 동일한 하드웨어 모델의 여러 버전이 포함되어 펌웨어 업그레이드 확인이 차단됩니다.
  • 서버를 수동으로 설치할 때 서버 설치가 멈출 수 있습니다.
  • 서버가 프로비저닝 상태에서 멈춰 있습니다.
  • NodePool의 생성 중에 서버가 알 수 없는 상태입니다.

시스템 아티팩트 레지스트리:

  • ABM 업그레이드 후 Harbor 비정상 종료 루프

업그레이드:

  • 1.11.x에서 1.12.1로 업그레이드할 때 노드 업그레이드가 MaintenanceModeHealthCheckReady 드레인되지 않음 오류로 인해 중단됩니다.
  • 1.11.x에서 1.12.1로 업그레이드할 때 registy_mirror의 상태 점검 실패로 인해 클러스터 노드가 유지보수 모드를 종료하지 못할 수 있습니다.
  • OS 인플레이스 노드 업그레이드가 응답하지 않을 수 있습니다.
  • HW2.0 및 Ubuntu에서 업그레이드할 때 노드 업그레이드에 RockyLinux가 잘못 표시됩니다.

Vertex AI:

  • 사용자 클러스터가 생성될 때 MonitoringTargetNot Ready 상태가 표시되어 사전 학습된 API가 사용자 인터페이스에 Enabling 상태를 계속 표시합니다.

VM 관리자:

  • 1.11.x에서 1.12.x로 업그레이드할 때 포드가 너무 많아 VM이 준비되지 않을 수 있습니다.
  • network-controller-manager 설치 실패로 인해 VMRuntime이 준비되지 않았을 수 있습니다.


결제:

  • 업그레이드 확인으로 인해 패치 업그레이드가 실패하는 문제를 수정했습니다.
  • 여러 billing-storage-init-job 객체가 생성되는 문제를 수정했습니다.

방화벽:

  • 포트 8082에 구성된 deny 정책으로 인해 부트스트래퍼에서 객체 스토리지로의 트래픽이 차단되는 문제가 수정되었습니다.

모니터링:

  • 사용자 VM 클러스터에는 영향을 미치지만 시스템 클러스터에는 영향을 미치지 않는 사용자 클러스터에서 측정항목을 수집하지 않는 문제를 수정했습니다.
  • 클러스터 경계를 넘어 Cortex 테넌트로 측정항목을 전송하는 기본 Prometheus 문제가 수정되었습니다.

Operations Suite 인프라 핵심 서비스 (OIC):

  • Desired State Configuration (DSC)이 잘못된 결과를 반환하고 리소스를 업데이트하지 못하는 문제를 해결했습니다.
  • Microsoft System Center Configuration Manager (SCCM) 배포가 성공적으로 완료되지 않아 수동으로 수정해야 하는 문제가 해결되었습니다.

VM 백업 및 복원:

  • VM 관리자의 역할 기반 액세스 제어 (RBAC) 및 스키마 설정으로 인해 사용자가 VM 백업 및 복원 프로세스를 시작할 수 없는 문제가 해결되었습니다.

부가기능 관리자:

  • 최신 보안 패치와 중요 업데이트를 적용하기 위해 Google Distributed Cloud 버전이 1.28.100-gke.150으로 업데이트됩니다.

Operations Suite 인프라 핵심 서비스 (OIC):

  • Google Distributed Cloud 에어 갭 1.12.1에 파트너가 출시에서 제외된 OIC 아티팩트를 준비하는 방법에 관한 안내가 추가되었습니다.

보안 정보 및 이벤트 관리 (SIEM):

  • Splunk Enterprise 및 Splunk Universal Forwarder가 버전 9.1.3으로 업그레이드됩니다.

버전 업데이트:

  • Debian 기반 이미지 버전이 bookworm-v1.0.1-gke.1로 업데이트됩니다.