Note di rilascio di Google Distributed Cloud con air gap

5 marzo 2024 [GDC 1.12.1]


  • Google Distributed Cloud con air gap 1.12.1 è ora disponibile.
    Consulta la panoramica del prodotto per scoprire le funzionalità di Google Distributed Cloud con air gap.

È stata aggiornata la versione dell'immagine del sistema operativo Canonical Ubuntu alla versione 20240214 per applicare le patch di sicurezza più recenti e gli aggiornamenti importanti. Per usufruire delle correzioni di bug e vulnerabilità della sicurezza, devi eseguire l'upgrade di tutti i nodi a ogni release. Sono state corrette le seguenti vulnerabilità di sicurezza:


Versione dell'immagine Rocky Linux aggiornata a 20240131 per applicare le patch di sicurezza più recenti e gli aggiornamenti importanti. Per usufruire delle correzioni di bug e vulnerabilità della sicurezza, devi eseguire l'upgrade di tutti i nodi a ogni release. Sono state corrette le seguenti vulnerabilità di sicurezza:


Sono state corrette le seguenti vulnerabilità di sicurezza delle immagini container:


Backup e ripristino:

  • Un problema impedisce i backup dei volumi nei bucket dell'organizzazione.
  • Il percorso di backup delle organizzazioni non va a buon fine.

Gestione dei cluster:

  • I cluster utente con Kubernetes versione 1.27.x potrebbero avere node pool che non vengono inizializzati.

Istio:

  • Pod nello stato ImagePullBackOff con l'evento Back-off pulling image "auto".

Archiviazione di file e blocchi:

  • Quando esegui l'upgrade dalla versione 1.11.1 alla 1.12.1, l'implementazione del sottocomponente file-netapp-trident potrebbe non riuscire.

Modulo di sicurezza hardware:

  • Un segreto ruotabile per i moduli di sicurezza hardware si trova in uno stato sconosciuto.

Logging:

  • Quando esegui l'upgrade dalla versione 1.11.1 alla 1.12.1, l'upgrade di ValidatingWebhookConfigurations, MutatingWebhookConfigurations e MonitoringRules implementati dal componente Log potrebbe non riuscire.
  • Il pod cortex-ingester mostra lo stato OOMKilled.
  • Dopo aver attivato l'esportazione dei log in una destinazione SIEM esterna, i log inoltrati non contengono log del server API Kubernetes.

Monitoraggio:

  • La configurazione del webhook ServiceNow comporta la riconciliazione e il ripristino delle modifiche apportate all'oggetto ConfigMap mon-alertmanager-servicenow-webhook-backend e all'oggetto Secret mon-alertmanager-servicenow-webhook-backend nello spazio dei nomi mon-system da parte di Lifecycle Management (LCM).
  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.1, l'eliminazione del bucket Cortex potrebbe non riuscire.
  • I log di controllo e operativi non vengono raccolti.
  • La classe di archiviazione delle metriche è definita in modo errato nella configurazione.
  • L'oggetto ConfigMap mon-prober-backend-prometheus-config viene reimpostato in modo da non includere job di probe e viene attivato l'avviso MON-A0001.

Networking:

  • GDC riscontra problemi con gli aggiornamenti, la chiusura e la pianificazione di VM e container.
  • Lo script di preinstallazione non riesce su diversi switch.
  • L'upgrade dalla versione 1.11 alla 1.12.1 non riesce a causa della generazione non riuscita della risorsa personalizzata hairpinlink.

Piattaforma del nodo:

  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.1, un pod di download dell'immagine dello switch potrebbe bloccarsi nello stato ErrImagePull.
  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.1, il firewall host blocca il download dell'immagine di commutazione.

Server NTP:

  • Il pod del server di relay NTP si arresta in modo anomalo dopo il riavvio.
  • Il pod del job di relè NTP si arresta in modo anomalo dopo il riavvio.

Server fisici:

  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.1, NodeUpgrade contiene più versioni per lo stesso modello hardware, bloccando la verifica dell'upgrade del firmware.
  • Quando installi un server manualmente, l'installazione potrebbe bloccarsi.
  • I server sono bloccati nello stato di provisioning.
  • Un NodePool ha un server in stato sconosciuto durante la creazione.

Registro degli artefatti di sistema:

  • Cicli di arresto anomalo di Harbor dopo un upgrade di ABM.

Esegui l'upgrade:

  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.1, l'upgrade del nodo si blocca con l'errore MaintenanceModeHealthCheckReady undrain.
  • Durante l'upgrade dalla versione 1.11.x alla 1.12.1, un nodo del cluster potrebbe non uscire dalla modalità di manutenzione a causa di un errore del controllo di integrità per registy_mirror.
  • L'upgrade in loco dei nodi del sistema operativo potrebbe smettere di rispondere.
  • Quando esegui l'upgrade da HW2.0 e Ubuntu, l'upgrade del nodo mostra in modo errato RockyLinux.

Vertex AI:

  • MonitoringTarget mostra lo stato Not Ready durante la creazione dei cluster di utenti, il che fa sì che le API preaddestrate mostrino continuamente lo stato Enabling nell'interfaccia utente.

VM Manager:

  • Quando esegui l'upgrade dalla versione 1.11.x alla 1.12.x, una VM potrebbe non essere pronta a causa di un numero eccessivo di pod.
  • VMRuntime potrebbe non essere pronto a causa dell'installazione non riuscita di network-controller-manager.


Fatturazione:

  • È stato risolto il problema che causava l'esito negativo dell'upgrade della patch con il controllo dell'upgrade.
  • È stato risolto il problema che causava la creazione di più oggetti billing-storage-init-job.

Firewall:

  • È stato risolto il problema relativo al traffico bloccato verso l'archiviazione di oggetti dal bootstrapper, causato da un criterio deny configurato sulla porta 8082.

Monitoraggio:

  • Risolto il problema della mancata raccolta delle metriche dai cluster utente, che interessava i cluster VM utente, ma non il cluster di sistema.
  • È stato risolto il problema relativo all'invio di metriche dal progetto Prometheus principale al tenant Cortex oltre i limiti del cluster.

Servizi principali dell'infrastruttura di Operations Suite (OIC):

  • Risolto il problema con Desired State Configuration (DSC) che restituiva risultati errati e non riusciva ad aggiornare le risorse.
  • È stato risolto il problema per cui il deployment di Microsoft System Center Configuration Manager (SCCM) non viene completato correttamente e richiede un intervento manuale per la correzione.

Backup e ripristino delle VM:

  • Risolto un problema per cui controllo dell'accesso basato sui ruoli (RBAC) e le impostazioni dello schema in VM Manager impedivano agli utenti di avviare i processi di backup e ripristino delle VM.

Gestione componenti aggiuntivi:

  • La versione di Google Distributed Cloud viene aggiornata alla versione 1.28.100-gke.150 per applicare le patch di sicurezza più recenti e gli aggiornamenti importanti.

Servizi principali dell'infrastruttura di Operations Suite (OIC):

  • Google Distributed Cloud con air gap 1.12.1 ha aggiunto istruzioni per i partner per preparare gli artefatti OIC esclusi dalla release.

Security Information and Event Management (SIEM):

  • Splunk Enterprise e Splunk Universal Forwarder vengono aggiornati alla versione 9.1.3.

Aggiornamento della versione:

  • La versione dell'immagine basata su Debian viene aggiornata a bookworm-v1.0.1-gke.1.