Notas de la versión de Google Distributed Cloud aislado

5 de marzo de 2024 [GDC 1.12.1]


  • Ya está disponible Google Distributed Cloud aislado 1.12.1.
    Consulta la descripción general del producto para obtener información sobre las funciones de Google Distributed Cloud aislado.

Se actualizó la versión de la imagen de SO Ubuntu de Canonical a 20240214 para aplicar los parches de seguridad y las actualizaciones importantes más recientes. Para aprovechar las correcciones de errores y vulnerabilidades de seguridad, debes actualizar todos los nodos con cada versión. Se corrigieron las siguientes vulnerabilidades de seguridad:


Se actualizó la versión de la imagen de Rocky Linux a 20240131 para aplicar los parches de seguridad y las actualizaciones importantes más recientes. Para aprovechar las correcciones de errores y vulnerabilidades de seguridad, debes actualizar todos los nodos con cada versión. Se corrigieron las siguientes vulnerabilidades de seguridad:


Se corrigieron las siguientes vulnerabilidades de seguridad de la imagen del contenedor:


Copia de seguridad y restablecimiento:

  • Un problema impide que se realicen copias de seguridad de volúmenes en buckets de la organización.
  • Falla la ruta de copia de seguridad a las organizaciones.

Administración de clústeres:

  • Es posible que los clústeres de usuario con la versión 1.27.x de Kubernetes tengan grupos de nodos que no se inicialicen.

Istio:

  • Pods en el estado ImagePullBackOff con el evento Back-off pulling image "auto".

Almacenamiento de archivos y en bloque:

  • Cuando se actualiza de la versión 1.11.1 a la 1.12.1, es posible que falle la implementación del subcomponente file-netapp-trident.

Módulo de seguridad de hardware:

  • Un secreto rotativo para módulos de seguridad de hardware se encuentra en un estado desconocido.

Registro:

  • Cuando se actualiza de la versión 1.11.1 a la 1.12.1, es posible que no se actualicen ValidatingWebhookConfigurations, MutatingWebhookConfigurations y MonitoringRules implementados por el componente Log.
  • El pod cortex-ingester muestra un estado OOMKilled.
  • Después de habilitar la exportación de registros a un destino SIEM externo, los registros reenviados no contienen ningún registro del servidor de la API de Kubernetes.

Supervisión:

  • Configurar el webhook de ServiceNow hace que Lifecycle Management (LCM) vuelva a conciliar y revierta los cambios realizados en el objeto ConfigMap mon-alertmanager-servicenow-webhook-backend y el objeto Secret mon-alertmanager-servicenow-webhook-backend en el espacio de nombres mon-system.
  • Cuando actualices de la versión 1.11.x a la 1.12.1, es posible que falle el borrado del bucket de Cortex.
  • No se recopilan registros de auditoría ni registros operativos.
  • La clase de almacenamiento de métricas se definió de forma incorrecta en la configuración.
  • El ConfigMap mon-prober-backend-prometheus-config se restablece para no incluir trabajos de sondeo, y se activa la alerta MON-A0001.

Redes:

  • El GDC experimenta problemas con las actualizaciones, la finalización y la programación de la VM y el contenedor.
  • La secuencia de comandos previa a la instalación falla en varios modificadores.
  • La actualización de la versión 1.11 a la 1.12.1 falla debido a que no se pudo generar el recurso personalizado hairpinlink.

Plataforma del nodo:

  • Cuando se actualiza de la versión 1.11.x a la 1.12.1, es posible que un pod de descarga de imágenes de conmutación se detenga en el estado ErrImagePull.
  • Cuando se actualiza de la versión 1.11.x a la 1.12.1, el firewall del host bloquea la descarga de la imagen del conmutador.

Servidor NTP:

  • El pod del servidor de retransmisión NTP falla después de reiniciarse.
  • El pod del trabajo de retransmisión de NTP falla después de reiniciarse.

Servidores físicos:

  • Cuando se actualiza de la versión 1.11.x a la 1.12.1, NodeUpgrade contiene varias versiones para el mismo modelo de hardware, lo que bloquea la verificación de la actualización del firmware.
  • Cuando se instala un servidor de forma manual, es posible que la instalación se detenga.
  • Los servidores están atascados en el estado de aprovisionamiento.
  • Un NodePool tiene un servidor en estado desconocido durante la creación.

Registro de artefactos del sistema:

  • Harbor entra en un bucle de fallas después de una actualización de ABM.

Actualizar:

  • Cuando se actualiza de la versión 1.11.x a la 1.12.1, la actualización del nodo se detiene con el error MaintenanceModeHealthCheckReady undrain.
  • Cuando se actualiza de la versión 1.11.x a la 1.12.1, es posible que un nodo del clúster no salga del modo de mantenimiento debido a una falla en la verificación de estado de registy_mirror.
  • Es posible que la actualización local del SO del nodo deje de responder.
  • Cuando se actualiza desde HW2.0 y Ubuntu, la actualización del nodo muestra incorrectamente RockyLinux.

Vertex AI:

  • El MonitoringTarget muestra un estado Not Ready cuando se crean clústeres de usuarios, lo que hace que las APIs previamente entrenadas muestren continuamente un estado Enabling en la interfaz de usuario.

VM Manager:

  • Cuando se actualiza de la versión 1.11.x a la 1.12.x, es posible que una VM no esté lista debido a que hay demasiados Pods.
  • Es posible que VMRuntime no esté listo debido a una falla en la instalación de network-controller-manager.


Facturación:

  • Se corrigió el problema que provocaba que la actualización con parche fallara con la verificación de actualización.
  • Se corrigió el problema que provocaba la creación de varios objetos billing-storage-init-job.

Firewall:

  • Se corrigió el problema del tráfico bloqueado al almacenamiento de objetos desde el programa de arranque, causado por una política de deny configurada en el puerto 8082.

Supervisión:

  • Se solucionó el problema de no recopilación de métricas de los clústeres de usuario, que afectaba a los clústeres de VM de usuario, pero no al clúster del sistema.
  • Se corrigió el problema por el que el Prometheus principal enviaba métricas al inquilino de Cortex a través de los límites del clúster.

Servicios principales de infraestructura de Operations Suite (OIC):

  • Se corrigió el problema por el que la configuración de estado deseado (DSC) devolvía resultados incorrectos y no actualizaba los recursos.
  • Se solucionó el problema por el que la implementación de Microsoft System Center Configuration Manager (SCCM) no finaliza correctamente y requiere intervención manual para solucionarlo.

Copia de seguridad y restablecimiento de VMs:

  • Se solucionó un problema por el que el control de acceso basado en roles (RBAC) y la configuración del esquema en el administrador de VM impedían que los usuarios iniciaran procesos de copia de seguridad y restablecimiento de VM.

Administrador de complementos:

  • La versión de Google Distributed Cloud se actualizó a 1.28.100-gke.150 para aplicar los parches de seguridad y las actualizaciones importantes más recientes.

Servicios principales de infraestructura de Operations Suite (OIC):

  • En Google Distributed Cloud aislado 1.12.1, se agregaron instrucciones para que los socios preparen los artefactos de OIC excluidos de la versión.

Administración de información y eventos de seguridad (SIEM):

  • Splunk Enterprise y Splunk Universal Forwarder se actualizaron a la versión 9.1.3.

Actualización de versión:

  • La versión de imagen basada en Debian se actualizó a bookworm-v1.0.1-gke.1.