Notas de lançamento do Google Distributed Cloud air-gapped

5 de março de 2024 [GDC 1.12.1]


  • O Google Distributed Cloud air-gapped 1.12.1 já está disponível.
    Consulte a vista geral do produto para saber mais sobre as funcionalidades do Google Distributed Cloud air-gapped.


Atualizou a versão da imagem do Rocky Linux para 20240131 para aplicar os patches de segurança mais recentes e atualizações importantes. Para tirar partido das correções de erros e vulnerabilidades de segurança, tem de atualizar todos os nós com cada lançamento. As seguintes vulnerabilidades de segurança foram corrigidas:


As seguintes vulnerabilidades de segurança de imagens de contentores foram corrigidas:


Cópia de segurança e restauro:

  • Um problema impede as cópias de segurança de volumes para contentores da organização.
  • A rota de cópia de segurança para organizações falha.

Gestão de clusters:

  • Os clusters de utilizadores com a versão 1.27.x do Kubernetes podem ter node pools que não são inicializados.

Istio:

  • Pods no estado ImagePullBackOff com o evento Back-off pulling image "auto".

Armazenamento de ficheiros e blocos:

  • Quando atualiza da versão 1.11.1 para a 1.12.1, a implementação do subcomponente file-netapp-trident pode falhar.

Módulo de segurança de hardware:

  • Um segredo rotativo para módulos de segurança de hardware está num estado desconhecido.

Registo:

  • Quando atualizar da versão 1.11.1 para a 1.12.1, a atualização de ValidatingWebhookConfigurations, MutatingWebhookConfigurations e MonitoringRules implementados pelo componente de registo pode falhar.
  • O agrupamento cortex-ingester mostra um estado OOMKilled.
  • Depois de ativar a exportação de registos para um destino SIEM externo, os registos encaminhados não contêm registos do servidor da API Kubernetes.

Monitorização:

  • Configurar o webhook do ServiceNow faz com que a gestão do ciclo de vida (LCM) reconcilie novamente e reverta as alterações feitas ao objeto ConfigMap mon-alertmanager-servicenow-webhook-backend e ao objeto Secret mon-alertmanager-servicenow-webhook-backend no espaço de nomes mon-system.
  • Quando atualiza da versão 1.11.x para a 1.12.1, a eliminação do contentor do Cortex pode falhar.
  • Não são recolhidos registos de auditoria nem registos operacionais.
  • A classe de armazenamento de métricas está definida incorretamente na configuração.
  • O ConfigMap mon-prober-backend-prometheus-config é reposto para não incluir tarefas de sondagem e o alerta MON-A0001 é acionado.

Redes:

  • O GDC tem problemas com as atualizações, a rescisão e o agendamento de VMs e contentores.
  • O script de pré-instalação falha em vários interruptores.
  • A atualização da versão 1.11 para a 1.12.1 falha devido a uma geração sem êxito do recurso personalizado hairpinlink.

Plataforma de nós:

  • Quando atualiza da versão 1.11.x para a 1.12.1, um pod de transferência de imagens de comutação pode ficar bloqueado no estado ErrImagePull.
  • Quando atualiza de 1.11.x para 1.12.1, a firewall do anfitrião bloqueia a transferência da imagem do comutador.

Servidor NTP:

  • O pod do servidor de retransmissão NTP falha após o reinício.
  • O pod da tarefa de retransmissão NTP falha após o reinício.

Servidores físicos:

  • Quando atualiza da versão 1.11.x para a 1.12.1, o ficheiro NodeUpgrade contém várias versões para o mesmo modelo de hardware, o que bloqueia a validação da atualização de firmware.
  • Quando instala um servidor manualmente, a instalação do servidor pode ficar bloqueada.
  • Os servidores estão bloqueados no estado de aprovisionamento.
  • Um NodePool tem um servidor num estado desconhecido durante a criação.

Registo de artefactos do sistema:

  • O Harbor entra em ciclos de falhas após uma atualização do ABM.

Atualizar:

  • Quando atualiza de 1.11.x para 1.12.1, a atualização do nó fica bloqueada com o erro MaintenanceModeHealthCheckReady undrain.
  • Quando atualiza de 1.11.x para 1.12.1, um nó do cluster pode não sair do modo de manutenção devido a uma falha na verificação de estado de registy_mirror.
  • A atualização do nó no local do SO pode deixar de responder.
  • Quando atualiza a partir do HW2.0 e do Ubuntu, a atualização do nó apresenta incorretamente o RockyLinux.

Vertex AI:

  • O MonitoringTarget mostra um estado Not Ready quando estão a ser criados clusters de utilizadores, o que faz com que as APIs pré-preparadas mostrem continuamente um estado Enabling na interface do utilizador.

Gestor de VMs:

  • Quando atualiza de 1.11.x para 1.12.x, uma VM pode não estar pronta devido ao número excessivo de pods.
  • O VMRuntime pode não estar pronto devido a uma falha de instalação do network-controller-manager.


Faturação:

  • Foi corrigido o problema que fazia com que a atualização do patch falhasse com a verificação de atualização.
  • Foi corrigido o problema que causava a criação de vários objetos billing-storage-init-job.

Firewall:

  • Corrigimos o problema com o tráfego bloqueado para o armazenamento de objetos a partir do programa de arranque, causado por uma política deny configurada na porta 8082.

Monitorização:

  • Foi corrigido o problema de não recolher métricas dos clusters de utilizadores, o que afetava os clusters de VMs de utilizadores, mas não o cluster do sistema.
  • Foi corrigido o problema do Prometheus principal que enviava métricas para o inquilino do Cortex nos limites do cluster.

Serviços Principais da infraestrutura da Operations Suite (OIC):

  • Foi corrigido o problema com a configuração do estado desejado (DSC) que devolvia resultados incorretos e não atualizava os recursos.
  • Foi corrigido o problema em que a implementação do Microsoft System Center Configuration Manager (SCCM) não terminava com êxito e exigia intervenção manual para correção.

Cópia de segurança e restauro de VMs:

  • Foi corrigido um problema em que o controlo de acesso baseado em funções (RBAC) e as definições de esquema no gestor de VMs impediam os utilizadores de iniciar processos de cópia de segurança e restauro de VMs.

Gestor de suplementos:

  • A versão do Google Distributed Cloud é atualizada para 1.28.100-gke.150 para aplicar os patches de segurança mais recentes e atualizações importantes.

Serviços Principais da infraestrutura da Operations Suite (OIC):

  • O Google Distributed Cloud air-gapped 1.12.1 adicionou instruções para os parceiros prepararem artefactos da OIC excluídos da versão.

Informação de segurança e gestão de eventos (SIEM):

  • O Splunk Enterprise e o Splunk Universal Forwarder são atualizados para a versão 9.1.3.

Atualização da versão:

  • A versão da imagem baseada no Debian é atualizada para bookworm-v1.0.1-gke.1.