Se usó la API de Cloud Translation para traducir esta página.

Actualizar un clúster

En este documento, se explica cómo actualizar clústeres en Google Distributed Cloud (solo software) para VMware. En este documento, se proporcionan los pasos para actualizar tu estación de trabajo de administrador, los clústeres de usuario y los clústeres de administrador. En los pasos para actualizar un clúster de usuario, se muestra cómo actualizar el plano de control y todos los grupos de nodos. Si deseas actualizar el plano de control y los grupos de nodos del clúster de usuario por separado, consulta Actualiza grupos de nodos.

Esta página está destinada a administradores de TI y operadores que administran el ciclo de vida de la infraestructura tecnológica subyacente. Para obtener más información sobre los roles comunes y las tareas de ejemplo a las que hacemos referencia en el contenido de Google Cloud , consulta Roles y tareas comunes de los usuarios de GKE.

Antes de continuar, te recomendamos que revises la siguiente documentación:

Descripción general de la actualización
Entre otras cosas, en este documento se describen el sesgo de versiones compatibles y las reglas de versiones para las actualizaciones, que cambiaron para la versión 1.28 y versiones posteriores.
Prácticas recomendadas para la actualización
En este documento, se proporcionan listas de tareas y prácticas recomendadas para actualizar clústeres.

Diferencias entre los clústeres avanzados

Cuando se habilitan los clústeres avanzados, hay algunas diferencias con las actualizaciones, en particular en la vista previa de los clústeres avanzados en la versión 1.31. Para ver las diferencias de actualización, busca la palabra advanced en este documento. Para ver una tabla con todas las diferencias, consulta Diferencias cuando se ejecutan clústeres avanzados.

Actualización automática a clústeres avanzados en la versión 1.33

Asegúrate de que la versión de gkectl: La versión de gkectl debe ser la misma que la versión de destino. Por ejemplo, si actualizas un clúster no avanzado de la versión 1.32 a un clúster avanzado de la versión 1.33.0-gke.799, la versión de gkectl debe ser 1.33.0-gke.799. Este requisito estricto de versión solo se aplica durante la transición a un clúster avanzado. Para todas las actualizaciones posteriores en tu clúster avanzado, se aplicarán las reglas estándar de sesgo de versión.
No se permite el sesgo de versiones: Cuando actualizas un clúster de no avanzado a avanzado, no puedes actualizar el plano de control y los grupos de nodos por separado. Debes actualizar el plano de control y todos los grupos de nodos a la versión 1.33 al mismo tiempo.

Requisitos

En esta sección, se proporciona información sobre los requisitos relacionados con la versión y los requisitos para usar los clientes de la API de GKE On-Prem (la consola de Google Cloud , Google Cloud CLI y Terraform) para las actualizaciones.

Reglas de versiones

Las reglas para las actualizaciones dependen de la versión secundaria del clúster.

En las versiones 1.30 y anteriores, la versión secundaria del clúster de usuario debe ser mayor o igual que la versión secundaria del clúster de administrador. La versión del parche no importa. Por ejemplo, si un clúster de usuario está en la versión 1.30.1, el clúster de administrador se puede actualizar a una versión de parche superior, como la 1.30.3.
Para las versiones 1.31 y posteriores, la versión del clúster de administrador, incluida la versión del parche, debe ser mayor o igual que la versión del clúster de usuario. Por ejemplo, si un clúster de administrador está en la versión 1.31.1, la versión más alta a la que se puede actualizar el clúster de usuario es la 1.31.1.

Cuando quieras actualizar tus clústeres a la versión 1.31, primero debes llevar todos tus clústeres a la versión 1.30. Después de que todos los clústeres estén en la versión 1.30, actualiza el clúster de administrador a la versión 1.31. Después de eso, puedes actualizar los clústeres de usuario a la misma versión de parche 1.31 que el clúster de administrador.

Reglas de versión para `gkectl`

La versión de gkectl que puedes usar para la actualización depende de la versión del clúster de destino (es decir, la versión del clúster al que se actualizará). Por lo general, se usa la misma versión de gkectl que la versión de destino del clúster. Durante la actualización, se aplican las siguientes reglas:

La versión de gkectl no puede ser una versión secundaria inferior a la versión secundaria del clúster de destino. Por ejemplo, si actualizas un clúster de la versión 1.29 a la 1.30, no puedes usar gkectl 1.29, ya que es inferior a la versión del clúster de destino. Las versiones de parche no son importantes. Por ejemplo, puedes usar la versión gkectl 1.29.0-gke.1456 para actualizar a una versión de parche superior, como 1.29.1000-gke.94.
La versión de gkectl no puede ser más de dos versiones secundarias superior a la versión actual del clúster. Por ejemplo, si actualizas un clúster de la versión 1.28 a la 1.29, la versión de gkectl puede ser 1.29 o 1.30. Sin embargo, no puedes usar la versión 1.31 de gkectl porque es tres versiones secundarias más alta que la versión del clúster.
Si actualizas el clúster a un clúster avanzado, la versión de gkectl debe ser la misma que la versión de destino. Por ejemplo, si actualizas un clúster no avanzado de la versión 1.32 a un clúster avanzado de la versión 1.33.0-gke.799, la versión de gkectl debe ser 1.33.0-gke.799.
- De forma predeterminada, tu clúster se actualizará a un clúster avanzado en la versión 1.33. Esto significa que, para las actualizaciones de 1.32 a 1.33, la versión de gkectl debe ser la misma que la versión actualizada.
- Este requisito estricto de versión solo se aplica durante la transición a un clúster avanzado. Para todas las actualizaciones posteriores en tu clúster avanzado, se aplicarán las reglas estándar de sesgo de versión.

Si es necesario, consulta Descarga gkectl para obtener una versión compatible de gkectl.

Revisa tus reglas de firewall

En la versión 1.29 y versiones posteriores, las verificaciones previas del servidor están habilitadas de forma predeterminada. Las verificaciones previas a la solicitud del servidor requieren reglas de firewall adicionales. En Reglas de firewall para clústeres de administrador, busca "Verificaciones previas al vuelo" y asegúrate de que todas las reglas de firewall necesarias estén configuradas.

Con las comprobaciones previas del servidor, cuando actualizas un clúster de usuario mediante gkectl, las comprobaciones previas se ejecutan en el clúster de administrador en lugar de localmente en la estación de trabajo de administrador. Las verificaciones previas del servidor también se ejecutan en el clúster de administrador cuando usas la consola de Google Cloud , Google Cloud CLI o Terraform para actualizar un clúster.

Cuando actualizas un clúster de administrador, Google Distributed Cloud implementa un clúster de Kubernetes en Docker (tipo) para alojar de forma temporal los controladores de Kubernetes necesarios para actualizar el clúster de administrador. Este clúster transitorio se denomina clúster de arranque. Las verificaciones previas del servidor se ejecutan en el clúster de arranque cuando actualizas un clúster de administrador.

Habilitar `stackdriver`

Si creaste el clúster de usuario con gkectl, antes de actualizarlo, asegúrate de que la sección stackdriver del archivo de configuración del clúster de usuario esté completa, lo que habilita stackdriver (necesario para el registro y la supervisión). Si stackdriver no está habilitado, completa la sección stackdriver en el archivo de configuración del clúster de usuario y actualiza el clúster antes de actualizarlo.

Si creaste el clúster con Terraform, la consola de Google Cloud o gcloud CLI, stackdriver se habilita automáticamente.

Habilitar Dataplane V2

A partir de la versión 1.31, Dataplane V2 debe estar habilitado en todos los clústeres de usuarios. Antes de actualizar un clúster de usuario a la versión 1.31, realiza los siguientes pasos. Si te preocupa quitar temporalmente la especificación de NetworkPolicy, comunícate con el equipo de Atención al cliente de Google.

Configura enableDataplaneV2 como true en el archivo de configuración del clúster de usuario.

Si tu clúster usa un NetworkPolicy, quita temporalmente su especificación del clúster de la siguiente manera:

Verifica si hay algún NetworkPolicy que no sea del sistema aplicado a tu clúster:

kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy -A -o wide | grep -v kube-system

Si el resultado del paso anterior no estaba vacío, guarda cada especificación de NetworkPolicy en un archivo para que puedas volver a aplicar la especificación después de actualizar el clúster.
```
kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE -o yaml > NETWORK_POLICY_NAME.yaml
```
Reemplaza lo siguiente:
- NETWORK_POLICY_NAME: Es el nombre del NetworkPolicy que guardarás.
- NETWORK_POLICY_NAMESPACE: Es el espacio de nombres de NetworkPolicy.

Borra la NetworkPolicy con el siguiente comando:

kubectl --kubeconfig USER_CLUSTER_KUBECONFIG delete networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE

Continúa con la actualización.
Una vez que se complete la actualización, si quitaste alguna especificación de NetworkPolicy que no sea del sistema, vuelve a aplicarla con este comando:
```
kubectl --kubeconfig USER_CLUSTER_KUBECONFIG apply -f NETWORK_POLICY_NAME.yaml
```

Requisitos de la API de Google y de IAM

Para actualizar un clúster a la versión 1.28 y versiones posteriores, debes habilitar kubernetesmetadata.googleapis.com y otorgar el rol de IAM kubernetesmetadata.publisher a la cuenta de servicio de supervisión y registro. Estos cambios son necesarios para usar Cloud Monitoring.

Habilitar kubernetesmetadata.googleapis.com:
```
gcloud services enable --project PROJECT_ID  \
    kubernetesmetadata.googleapis.com
```
Reemplaza PROJECT_ID por el ID del proyecto host de la flota del que el clúster de usuario es miembro. Este es el proyecto que especificaste cuando se creó el clúster. Si creaste el clúster con gkectl, este es el ID del proyecto en el campo gkeConnect.projectID del archivo de configuración del clúster.
Si tu organización configuró una lista de entidades permitidas que permite que el tráfico de las APIs de Google y otras direcciones pasen a través de tu servidor proxy, agrega lo kubernetesmetadata.googleapis.com a la lista de entidades permitidas:
Otorga el rol kubernetesmetadata.publisher a la cuenta de servicio de registro y supervisión:
```
gcloud projects add-iam-policy-binding PROJECT_ID \
    --member "serviceAccount:SERVICE_ACCOUNT_EMAIL" \
    --role "roles/kubernetesmetadata.publisher"
```
Reemplaza SERVICE_ACCOUNT_EMAIL por la dirección de correo electrónico de tu cuenta de servicio de registro y supervisión.

Se bloquearon las funciones heredadas en las actualizaciones

Las siguientes funciones heredadas se bloquean durante la actualización del clúster a la versión 1.32:

Dataplane V1 (Calico)
Configuración del balanceador de cargas F5 Big IP integrado
Clúster de administrador sin alta disponibilidad
Clúster de usuario de Kubeception
Balanceador de cargas de Seesaw

Debes migrar tus clústeres a las funciones recomendadas antes de actualizar a la versión 1.32.

Requisitos de IAM para actualizar clústeres de usuario

Omite esta sección si planeas usar gkectl para actualizar el clúster de usuario.

Si deseas usar la Google Cloud consola, Google Cloud CLI o Terraform para actualizar un clúster de usuario y no eres propietario del proyecto, debes tener el rol de Identity and Access Management roles/gkeonprem.admin en el proyecto Google Cloud en el que se creó el clúster. Para obtener más detalles sobre los permisos incluidos en este rol, consulta Roles de GKE On-Prem en la documentación de IAM.

Para usar la consola y actualizar el clúster, como mínimo, también necesitas lo siguiente:

roles/container.viewer. Este rol permite que los usuarios vean la página de clústeres de GKE y otros recursos de contenedores en la consola. Para obtener más información sobre los permisos incluidos en este rol o sobre cómo otorgar un rol con permisos de lectura y escritura, consulta Roles de Kubernetes Engine en la documentación de IAM.
roles/gkehub.viewer: Este rol permite que los usuarios vean los clústeres en la consola. Si deseas obtener detalles sobre los permisos incluidos en este rol o para otorgar un rol con permisos de lectura y escritura, consulta Roles de GKE Hub en la documentación de IAM.

Limitaciones con los clústeres avanzados

Ten en cuenta las siguientes limitaciones si tienes habilitados los clústeres avanzados:

Debes usar gkectl para actualizar los clústeres. No se admiten los clientes de la API de GKE On-Prem (la consola, gcloud CLI y Terraform).
Solo se admiten las actualizaciones síncronas.

Realiza cambios en la configuración antes o después de una actualización

Si necesitas realizar cambios en la configuración de tus clústeres, realiza la actualización del clúster antes o después de la actualización. El único cambio en la configuración del clúster para una actualización debe ser la versión. Según la versión y el tipo de clúster, otros cambios de configuración se ignoran de forma silenciosa o provocan que la actualización falle. Para obtener más información, consulta Quita cambios no admitidos para desbloquear la actualización.

Verifica las versiones disponibles para las actualizaciones de clústeres

Ejecuta el siguiente comando para ver qué versiones están disponibles para la actualización:

gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Reemplaza ADMIN_CLUSTER_KUBECONFIG por la ruta de acceso al archivo kubeconfig del clúster de administrador.

El resultado muestra la versión actual y las versiones disponibles para actualizar.

Si planeas usar la consola, gcloud CLI o Terraform para la actualización, la versión tardará entre 7 y 14 días después de un lanzamiento en estar disponible en la API de GKE On-Prem en todas las regiones de Google Cloud . La consola solo muestra las versiones disponibles para la actualización del clúster del usuario. Los pasos para actualizar un clúster de usuario con gcloud CLI o Terraform incluyen un paso para ejecutar gcloud container vmware clusters query-version-config y obtener las versiones disponibles para la actualización.

Actualiza tu estación de trabajo de administrador

La forma en que actualizas tu estación de trabajo de administrador depende de cómo la creaste: con gkeadm o administrada por el usuario.

gkeadm

Ubica los archivos necesarios

Antes de crear la estación de trabajo de administrador, completaste un archivo de configuración de la estación de trabajo de administrador que generó gkeadm create config. El nombre predeterminado para este archivo es admin-ws-config.yaml.

Además, tu estación de trabajo tiene un archivo de información. El nombre predeterminado de este archivo es el mismo que el nombre de la estación de trabajo del administrador.

Localiza el archivo de configuración de la estación de trabajo del administrador y el archivo de información. Los necesitas para realizar los pasos de la actualización. Si estos archivos se encuentran en tu directorio actual y tienen sus nombres predeterminados, no tendrás que especificarlos cuando ejecutes los comandos de actualización. Si estos archivos están en otro directorio o si cambiaste los nombres de archivo, debes especificarlos mediante las marcas --config y --info-file.

Si falta tu archivo de información de salida, puedes volver a crearlo. Consulta Vuelve a crear un archivo de información si falta.

Actualizar

Para actualizarla, haz lo siguiente:

Verifica el campo adminWorkstation.diskGB en el archivo de configuración de la estación de trabajo de administrador y asegúrate de que el tamaño especificado sea de al menos 100, por ejemplo:
```
adminWorkstation:
  diskGB: 100
```
Cuando se actualiza a la versión 1.28 y versiones posteriores, se requieren 100 GB, y la actualización del clúster falla si la estación de trabajo de administrador no tiene suficiente espacio en disco.
Desde el servidor de salto, descarga gkeadm:
```
gkeadm upgrade gkeadm --target-version TARGET_VERSION
```
Reemplaza TARGET_VERSION por la versión a la que deseas actualizar. Debes especificar un número de versión completo con el formato X.Y.Z-gke.N.. Para obtener una lista de las versiones de Google Distributed Cloud, consulta Control de versiones.
Actualiza tu estación de trabajo de administrador:
```
gkeadm upgrade admin-workstation --config AW_CONFIG_FILE \
    --info-file INFO_FILE
```
Reemplaza lo siguiente:
- AW_CONFIG_FILE es la ruta del archivo de configuración de la estación de trabajo del administrador. Puedes omitir esta marca si el archivo se encuentra en el directorio actual y tiene el nombre admin-ws-config.yaml.
- INFO_FILE es la ruta del archivo de información. Puedes omitir esta marca si el archivo se encuentra en tu directorio actual. El nombre predeterminado de este archivo es el mismo que el nombre de la estación de trabajo del administrador.

Administrada por el usuario

En tu estación de trabajo de administrador, navega a un directorio en el que desees instalar una nueva versión de gkectl.

Descarga gkectl.
```
gcloud storage cp gs://gke-on-prem-release/gkectl/TARGET_VERSION/gkectl ./
chmod +x gkectl
```
Reemplaza TARGET_VERSION por la versión a la que deseas actualizar. Debes especificar un número de versión completo con el formato X.Y.Z-gke.N.. Para obtener una lista de las versiones de Google Distributed Cloud, consulta Control de versiones.
Descarga el paquete de Google Distributed Cloud. Asegúrate de que la versión coincida con la que usaste para descargar gkectl:
```
gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz ./
```

Actualiza el clúster de administrador

Los pasos para actualizar el clúster de administrador varían ligeramente según la versión secundaria a la que se actualiza (la versión de destino):

1.31 y versiones más altas

Si la versión de destino es la 1.31 o una posterior, antes de actualizar los clústeres de usuario a la siguiente versión secundaria, debes actualizar el clúster de administrador. En la versión 1.31 y posteriores, la versión del clúster de administrador, incluida la versión del parche, debe ser mayor o igual que la versión del clúster de usuario. Por ejemplo, si un clúster de administrador está en la versión 1.31.1, la versión más alta a la que se puede actualizar el clúster de usuario es la 1.31.1.

Ejecuta el siguiente comando en tu estación de trabajo de administrador para importar imágenes de SO a vSphere:

gkectl prepare \
    --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Reemplaza ADMIN_CLUSTER_KUBECONFIG por la ruta de acceso al archivo kubeconfig del clúster de administrador.

1.30 y versiones más bajas

Si la versión de destino es 1.30 o inferior, debes actualizar todos tus clústeres de usuario antes de actualizar tu clúster de administrador. La versión secundaria del clúster de administrador debe ser menor o igual que la versión secundaria del clúster de usuario. La versión de parche no importa. Por ejemplo, si un clúster de usuario está en la versión 1.30.1, el clúster de administrador se puede actualizar a una versión de parche superior, como la 1.30.3.

Antes de comenzar:

Si actualizas a la versión 1.13 o una posterior, primero debes registrar el clúster de administrador completando la sección gkeConnect en el archivo de configuración del clúster de administrador. Ejecuta el comando gkectl update cluster con los cambios en el archivo de configuración.
Asegúrate de que gkectl y los clústeres estén en la versión adecuado para una actualización y de haber descargado el paquete adecuado. La diferencia de versión entre los clústeres de administrador y de usuario depende de la versión de Google Distributed Cloud. Para asegurarte de poder actualizar tu clúster de administrador, consulta Retraso de versiones de clústeres de administrador y de usuario.
Asegúrate de que el campo bundlepath del archivo de configuración del clúster de administrador coincida con la ruta de acceso del paquete al que deseas actualizar.

Si realizas algún otro cambio en los campos del archivo de configuración del clúster de administrador, estos cambios se ignoran durante la actualización. Para que esos cambios se apliquen, primero debes actualizar el clúster y, luego, ejecutar un clúster de actualización con los cambios en el archivo de configuración para realizar otros cambios en el clúster.

Realiza la actualización

Sigue los pasos que se indican en esta sección en la estación de trabajo del administrador. Existen dos variantes del comando gkectl upgrade admin:

Asíncrono:
Con la variación asíncrona, el comando inicia la actualización y, luego, la completa. No es necesario que observes el resultado del comando durante toda la actualización. En su lugar, puedes verificar periódicamente el progreso de la actualización ejecutando gkectl list admin y gkectl describe admin. Para usar la variación asíncrona, incluye la marca --async en el comando.

Requisitos para la actualización asíncrona:
- Solo se admite para clústeres de administrador con alta disponibilidad con la versión 1.29 o posterior.
- Todos los clústeres de usuario deben tener habilitado Controlplane V2.
- Versión 1.31: No se admite en clústeres avanzados.
- Versión 1.32 y posteriores: Disponible en clústeres avanzados.
Síncrona:
Con la variación síncrona, el comando gkectl upgrade admin muestra mensajes de estado en la estación de trabajo del administrador a medida que avanza la actualización.

Actualización asíncrona

En tu estación de trabajo de administrador, inicia una actualización asíncrona:
```
gkectl upgrade admin \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config ADMIN_CLUSTER_CONFIG_FILE \
  --async
```
Reemplaza lo siguiente:
- ADMIN_CLUSTER_KUBECONFIG: Es la ruta de acceso al archivo kubeconfig del clúster de administrador.
- ADMIN_CLUSTER_CONFIG_FILE: la ruta al archivo de configuración del clúster de administrador.
El comando anterior se completa y puedes seguir usando tu estación de trabajo de administrador mientras se realiza la actualización.
Para ver el estado de la actualización, haz lo siguiente:
```
gkectl list admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
El resultado muestra un valor para el clúster STATE. Si el clúster aún se está actualizando, el valor de STATE es UPGRADING. Por ejemplo:
```
NAME              STATE         AGE    VERSION
gke-admin-test    UPGRADING     9h     1.33.100-gke.89
```
Los valores posibles para STATE son RUNNING, UPGRADING, RECONCILING, ERROR y UNKNOWN.

Para obtener más detalles sobre el progreso de la actualización y los eventos del clúster, haz lo siguiente:

gkectl describe admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG

El resultado muestra el recurso personalizado OnPremAdminCluster para el clúster de administrador especificado, que incluye el estado, las condiciones y los eventos del clúster.

Registramos eventos para el inicio y el final de cada fase de actualización crítica.

Resultado de ejemplo:

Events:
Type    Reason                             Age   From                             Message
----       ------                                  ----     ----                                -------
Normal  ControlPlaneUpgradeStarted         40m   onprem-admin-cluster-controller  Creating or updating admin cluster API Controller
Normal  ControlPlaneMachineUpgradeStarted  40m   onprem-admin-cluster-controller  Creating or updating control plane machine
Normal  StatusChanged                      40m   onprem-admin-cluster-controller  OnPremAdminCluster status changed:
- New ClusterState condition: UPGRADING
- New Ready condition: False, CreateOrUpdateControlPlaneMachine, Creating or updating control plane machine
Normal   StatusChanged      2m                onprem-admin-cluster-controller  OnPremAdminCluster status changed:
- New ClusterState condition: RUNNING
- New Ready condition: True, ClusterRunning, Cluster is running

Cuando se complete la actualización, gkectl list admin mostrará un STATUS de RUNNING:
```
NAME              STATE         AGE    VERSION
gke-admin-test    RUNNING       9h     1.33.100-gke.89
```
Además, cuando se completa la actualización, gkectl describe admin muestra un campo Last GKE On Prem Version en Status. Por ejemplo:
```
Status:
  Cluster State:  RUNNING
  Last GKE On Prem Version:  1.33.0-gke.1
```

Soluciona problemas de actualización asíncrona

Para una actualización asíncrona, la duración del tiempo de espera se basa en la cantidad de nodos del clúster. Si la actualización tarda más que la duración del tiempo de espera, el estado del clúster cambia de UPGRADING a ERROR, con un evento que indica que se agotó el tiempo de espera de la operación de actualización. Ten en cuenta que el estado ERROR aquí significa que la actualización está tardando más de lo esperado, pero no se ha detenido. El controlador continúa con la conciliación y vuelve a intentar la operación. Cuando se bloquea o falla una actualización, puedes ejecutar gkectl diagnose para verificar problemas comunes del clúster. Según el resultado, puedes decidir si realizar una corrección manual o comunicarte con el Google Cloud equipo de asistencia para obtener más ayuda.

Actualización síncrona

Ejecuta el siguiente comando:
```
gkectl upgrade admin \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config ADMIN_CLUSTER_CONFIG_FILE
```
Reemplaza lo siguiente:
- ADMIN_CLUSTER_KUBECONFIG es la ruta al archivo kubeconfig del clúster de administrador.
- ADMIN_CLUSTER_CONFIG_FILE: la ruta al archivo de configuración del clúster de administrador.
El comando gkectl upgrade ejecuta comprobaciones preliminares. Si las comprobaciones previas fallan, el comando se bloquea. Debes corregir las fallas o usar la marca --skip-preflight-check-blocking con el comando para desbloquearlo.
Si actualizas a la versión 1.14.0 o posterior, se generará un nuevo archivo kubeconfig para el clúster de administrador que sobrescribirá cualquier archivo existente. Para ver los detalles del clúster en el archivo, ejecuta el siguiente comando:
```
kubectl config view --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```

Actualiza un clúster de usuario

Puedes usar gkectl, la consola, gcloud CLI o Terraform para actualizar un clúster de usuarios. Para obtener información sobre cómo decidir qué herramienta usar, consulta Elige una herramienta para actualizar clústeres de usuario.

gkectl

Prepárate para actualizar un clúster de usuario

Ejecuta los siguientes pasos en tu estación de trabajo de administrador:

Realiza este paso solo si la versión de TARGET_VERSION es 1.30 o inferior, o si actualizas el clúster de usuario a una versión diferente de la del clúster de administrador. Ejecuta gkectl prepare para importar imágenes de SO a vSphere:
```
gkectl prepare \
  --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
Si tu clúster tiene un grupo de nodos de Windows, ejecuta gkectl prepare windows y actualiza el campo osImage para el grupo de nodos. Para obtener instrucciones detalladas, consulta Actualiza el clúster de usuario con los grupos de nodos de Windows.
En el archivo de configuración del clúster de usuario, establece gkeOnPremVersion en la versión de destino de la actualización.

Ejecutar comprobaciones previas

Cuando actualices a la versión 1.29 y versiones posteriores, puedes ejecutar las verificaciones previas antes de actualizar un clúster de usuario:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG \
    --dry-run

Reemplaza USER_CLUSTER_CONFIG por la ruta de acceso al archivo de configuración del clúster de usuario.

Con la marca --dry-run, gkectl upgrade cluster ejecuta las verificaciones previas, pero no inicia el proceso de actualización. Aunque las versiones anteriores de Google Distributed Cloud ejecutan comprobaciones preliminares, no se pueden ejecutar por separado de la actualización. Cuando agregas la marca --dry-run, puedes detectar y corregir cualquier problema que las comprobaciones preliminares encuentren en tu clúster de usuario antes de la actualización.

Ejecuta `gkectl upgrade cluster`

Existen dos variantes del comando gkectl upgrade cluster:

Asíncrono: (recomendado)
Con la variación asíncrona, el comando inicia la actualización y, luego, la completa. No es necesario que observes el resultado del comando durante toda la actualización. En su lugar, puedes verificar periódicamente el progreso de la actualización ejecutando gkectl list clusters y gkectl describe clusters. Para usar la variación asíncrona, incluye la marca --async en el comando.
- Versión 1.31: No está disponible en clústeres avanzados.
- Versión 1.32 y posteriores: Disponible en clústeres avanzados.
Síncrona:
Con la variación síncrona, el comando gkectl upgrade cluster muestra mensajes de estado en la estación de trabajo del administrador a medida que avanza la actualización.

Actualización asíncrona

Omite este paso si actualizas a una versión posterior a la 1.16.

Si usas credenciales preparadas y un registro privado para el clúster de usuario, asegúrate de que la credencial del registro privado esté preparada antes de actualizar el clúster de usuario. Para obtener información sobre cómo preparar la credencial del registro privado, consulta Configura credenciales preparadas para los clústeres de usuario.
En tu estación de trabajo de administrador, inicia una actualización asíncrona:
```
gkectl upgrade cluster \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config USER_CLUSTER_CONFIG \
  --async
```
El comando anterior se completa y puedes seguir usando tu estación de trabajo de administrador mientras se realiza la actualización.
Para ver el estado de la actualización, haz lo siguiente:
```
gkectl list clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
El resultado muestra un valor para el clúster STATE. Si el clúster aún se está actualizando, el valor de STATE es UPGRADING. Por ejemplo:
```
NAMESPACE             NAME    READY   STATE       AGE   VERSION
my-uc-gkeonprem-mgmt  my-uc   False   UPGRADING   9h    1.33.0-gke.1
```
Los valores posibles para STATE son PROVISIONING, UPGRADING, DELETING, UPDATING, RUNNING, RECONCILING, ERROR y UNKNOWN.

Para obtener más detalles sobre el progreso de la actualización y los eventos del clúster, haz lo siguiente:

gkectl describe clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --cluster USER_CLUSTER_NAME -v 5

El resultado muestra el recurso personalizado OnPremUserCluster para el clúster de usuario especificado, que incluye el estado, las condiciones y los eventos del clúster.

Registramos eventos para el inicio y el final de cada fase de actualización crítica, incluidos los siguientes:

ControlPlaneUpgrade
MasterNodeUpgrade
AddonsUpgrade
NodePoolsUpgrade

Resultado de ejemplo:

Events:
Type    Reason                      Age    From                            Message
----     ------                     ----   ----                            -------
Normal  NodePoolsUpgradeStarted     22m    onprem-user-cluster-controller  Creating or updating node pools: pool-2: Creating or updating node pool
Normal  AddonsUpgradeStarted        22m    onprem-user-cluster-controller  Creating or updating addon workloads
Normal  ControlPlaneUpgradeStarted  25m    onprem-user-cluster-controller  Creating or updating cluster control plane workloads: deploying user-kube-apiserver-base, ...: 14/15 pods are ready
Normal  ControlPlaneUpgradeFinished 23m    onprem-user-cluster-controller  Control plane is running

Cuando se complete la actualización, gkectl list clusters mostrará un STATUS de RUNNING:
```
NAMESPACE             NAME    READY   STATE     AGE     VERSION
my-uc-gkeonprem-mgmt  my-uc   True    RUNNING   9h      1.33.0-gke.1
```
Además, cuando se completa la actualización, gkectl describe clusters muestra un campo Last GKE On Prem Version en Status. Por ejemplo:
```
Status:
Cluster State:  RUNNING
Last GKE On Prem Version:  1.33.0-gke.1
```

Soluciona problemas de actualización asíncrona

Por lo general, el tiempo de espera agotado es el resultado de un bloqueo causado por un PodDisruptionBudget (PDB). En ese caso, no se pueden expulsar Pods de los nodos antiguos, y estos no se pueden drenar. Si la expulsión del Pod tarda más de 10 minutos, escribimos un evento en el objeto OnPremUserCluster. Puedes capturar el evento ejecutando gkectl describe clusters. Luego, puedes ajustar el PDB para permitir que se drene el nodo. Después de eso, la actualización puede continuar y, finalmente, completarse.

Ejemplo de evento:

Warning  PodEvictionTooLong  96s (x2 over 4m7s)  onprem-user-cluster-controller
Waiting too long(>10m0.00000003s) for (kube-system/coredns-856d6dbfdf-dl6nz) eviction.

Además, cuando se bloquea o falla una actualización, puedes ejecutar gkectl diagnose para verificar si hay problemas comunes del clúster. Según el resultado, puedes decidir si realizar una corrección manual o comunicarte con el equipo de asistencia de Anthos para obtener más ayuda.

Actualización síncrona

El comando gkectl upgrade ejecuta comprobaciones preliminares. Si las comprobaciones previas fallan, el comando se bloquea. Debes corregir las fallas o usar la marca --skip-preflight-check-blocking. Solo debes omitir las comprobaciones previas si estás seguro de que no hay fallas críticas.

Continúa con estos pasos en la estación de trabajo de administrador:

Omite este paso si actualizas a una versión posterior a la 1.16.

Si usas credenciales preparadas y un registro privado para el clúster de usuario, asegúrate de que la credencial del registro privado esté preparada antes de actualizar el clúster de usuario. Para obtener información sobre cómo preparar la credencial del registro privado, consulta Configura credenciales preparadas para los clústeres de usuario.

Actualiza el clúster:

gkectl upgrade cluster \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config USER_CLUSTER_CONFIG

Si actualizas a la versión 1.14.0 o posterior, se generará un nuevo archivo kubeconfig para el clúster de usuario que sobrescribirá cualquier archivo existente. Para ver los detalles del clúster en el archivo, ejecuta el siguiente comando:
```
kubectl config view --kubeconfig USER_CLUSTER_KUBECONFIG
```

Reanuda una actualización

Si se interrumpe una actualización del clúster de usuario, puedes reanudar la actualización del clúster de usuario si ejecutas el mismo comando de actualización con la marca --skip-validation-all:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG_FILE \
    --skip-validation-all

Console

La actualización de un clúster de usuario requiere algunos cambios en el clúster de administrador. La consola realiza automáticamente las siguientes acciones:

Inscribe el clúster de administrador en la API de GKE On-Prem si aún no está inscrito.
Descarga e implementa un paquete de componentes en el clúster de administrador. La versión de los componentes coincide con la versión que especificas para la actualización. Estos componentes permiten que el clúster de administrador administre clústeres de usuario en esa versión.

Para actualizar un clúster de usuario, haz lo siguiente:

En la consola, ve a la página Descripción general de los clústeres de Google Kubernetes Engine.

Ir a los clústeres de GKE
Selecciona el proyecto Google Cloud y, luego, el clúster que deseas actualizar.
En el panel Detalles, haz clic en Más detalles.
En la sección Conceptos básicos del clúster, haz clic en Actualizar.
En la lista Elige la versión de destino, selecciona la versión a la que deseas actualizar. La lista seleccionada solo contiene las versiones de parche más recientes.
Haz clic en Actualizar.

Antes de actualizar el clúster, se ejecutan verificaciones previas para validar su estado y el de los nodos. Si las comprobaciones previas se superan, se actualiza el clúster de usuario. La actualización tarda alrededor de 30 minutos en completarse.

Para ver el estado de la actualización, haz clic en Mostrar detalles en la pestaña Detalles del clúster.

gcloud CLI

La actualización de un clúster de usuario requiere algunos cambios en el clúster de administrador. El comando gcloud container vmware clusters upgrade realiza automáticamente las siguientes acciones:

Inscribe el clúster de administrador en la API de GKE On-Prem si aún no está inscrito.
Descarga e implementa un paquete de componentes en el clúster de administrador. La versión de los componentes coincide con la versión que especificas para la actualización. Estos componentes permiten que el clúster de administrador administre clústeres de usuario en esa versión.

Para actualizar un clúster de usuario, haz lo siguiente:

Actualiza los componentes de la Google Cloud CLI:
```
gcloud components update
```

Obtén una lista de las versiones disponibles para actualizar:

gcloud container vmware clusters query-version-config \
  --cluster=USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION

El resultado del comando es similar al siguiente:

versions:
- version: 1.16.3-gke.45
- version: 1.16.2-gke.28
- version: 1.16.1-gke.45
- version: 1.16.0-gke.669
- version: 1.15.6-gke.25
- version: 1.15.5-gke.41

An Anthos version must be made available on the admin cluster ahead of the user
cluster creation or upgrade. Versions annotated with isInstalled=true are
installed on the admin cluster for the purpose of user cluster creation or
upgrade whereas other version are released and will be available for upgrade
once dependencies are resolved.

To install the version in the admin cluster, run:
$ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION

Puedes ignorar el mensaje que aparece después de la lista de versiones. No importa si la versión a la que actualizas está instalada en el clúster de administrador. El comando upgrade descarga y, luego, implementa un paquete de los componentes que coincide con la versión que especificas en el comando upgrade.

Actualiza el clúster.
```
gcloud container vmware clusters upgrade USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION \
  --version=VERSION
```
Reemplaza VERSION por la versión de Google Distributed Cloud a la que deseas actualizar. Especifica una versión del resultado del comando anterior. Te recomendamos que actualices a la versión de parche más reciente.

El resultado del comando es similar al siguiente:
```
Waiting for operation [projects/example-project-12345/locations/us-west1/operations/operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179] to complete.
```
En el resultado de ejemplo, la cadena operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179 es el OPERATION_ID de la operación de larga duración. Para averiguar el estado de la operación, ejecuta el siguiente comando en otra ventana de terminal:
```
gcloud container vmware operations describe OPERATION_ID \
  --project=PROJECT_ID \
  --location=REGION
```

Terraform

Actualiza los componentes de la Google Cloud CLI:
```
gcloud components update
```
Si aún no lo has hecho, inscribe el clúster de administrador en la API de GKE On-Prem. Una vez que el clúster esté inscrito en la API de GKE On-Prem, no necesitarás volver a realizar este paso.

Obtén una lista de las versiones disponibles para actualizar:

gcloud container vmware clusters query-version-config \
  --cluster=USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION

Reemplaza lo siguiente:

USER_CLUSTER_NAME: El nombre del clúster de usuario.
PROJECT_ID: ID del proyecto de la flota en el que el clúster de usuario es miembro. Este es el proyecto que especificaste cuando se creó el clúster. Si creaste el clúster con gkectl, este es el ID del proyecto en el campo gkeConnect.projectID del archivo de configuración del clúster.
REGION: Es la región de Google Cloud en la que se ejecuta la API de GKE On-Prem y se almacenan sus metadatos. En el archivo main.tf que usaste para crear el clúster de usuario, la región se encuentra en el campo location del recurso del clúster.

El resultado del comando es similar al siguiente:

versions:
- version: 1.16.3-gke.45
- version: 1.16.2-gke.28
- version: 1.16.1-gke.45
- version: 1.16.0-gke.669
- version: 1.15.6-gke.25
- version: 1.15.5-gke.41

An Anthos version must be made available on the admin cluster ahead of the user
cluster creation or upgrade. Versions annotated with isInstalled=true are
installed on the admin cluster for the purpose of user cluster creation or
upgrade whereas other version are released and will be available for upgrade
once dependencies are resolved.

To install the version in the admin cluster, run:
$ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION

Descarga la versión nueva de los componentes y, luego, impleméntala en el clúster de administrador:
```
gcloud container vmware admin-clusters update ADMIN_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION \
  --required-platform-version=VERSION
```
Este comando descarga la versión de los componentes que especificas en --required-platform-version en el clúster de administrador y, luego, implementa los componentes. Estos componentes permiten que el clúster de administrador administre clústeres de usuario en esa versión.
En el archivo main.tf que usaste para crear el clúster de usuario, cambia on_prem_version en el recurso del clúster a la versión nueva.
Inicializa y crea terraform plan:
```
terraform init
```
Terraform instala las bibliotecas necesarias, como el proveedor de Google Cloud.
Revisa la configuración y realiza cambios si es necesario:
```
terraform plan
```
Aplica el plan de Terraform para crear el clúster de usuario:
```
terraform apply
```

Quita el paquete completo

Si descargaste un paquete completo y ejecutaste gkectl prepare con éxito, y actualizaste el clúster de administrador y todos los clústeres de usuario, deberías borrar el paquete completo para ahorrar espacio en el disco en la estación de trabajo de administrador. Ejecuta el siguiente comando para borrar el paquete completo:

rm /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION-full.tgz

Reanuda la actualización de un clúster de administrador

Si la actualización de un clúster de administrador se interrumpe o falla, la actualización se puede reanudar si el punto de control del clúster de administrador contiene el estado necesario para restablecer el estado antes de la interrupción.

Advertencia: No repares la instancia principal de administrador con gkectl repair admin-master después de un intento de actualización con errores. Esto hará que el clúster de administrador entre en un estado incorrecto.

Lleve a cabo los pasos siguientes:

Verifica si el plano de control del administrador está en buen estado antes de comenzar el intento de actualización inicial. Consulta Diagnostica problemas de clústeres. Como se explica en ese tema, ejecuta el comando gkectl diagnose cluster para el clúster de administrador.
Si el plano de control del administrador está en mal estado antes del intento de actualización inicial, repara el plano de control del administrador con el comando gkectl repair admin-master.
Cuando vuelvas a ejecutar el comando de actualización después de que una actualización se interrumpa o falle, usa el mismo paquete y versión de destino como lo hiciste en el intento de actualización anterior.

Cuando vuelves a ejecutar el comando de actualización, la actualización reanudada recrea el estado del clúster de administrador desde el punto de control y vuelve a ejecutar toda la actualización. A partir de la versión 1.12.0, si el plano de control del administrador está en mal estado, el proceso de actualización se actualizará directamente a la versión de destino sin intentar restablecer el clúster de administrador en la versión de origen antes de continuar con la actualización.

La actualización se reanudará desde el punto en que falló o salió si el punto de control del clúster de administrador está disponible. Si el punto de control no está disponible, la actualización recurrirá al plano de control del administrador y, por lo tanto, este debe estar en buen estado para continuar con la actualización. Después de una actualización exitosa, el punto de control se vuelve a generar.

Si gkectl se cierra de forma inesperada durante una actualización del clúster de administrador, el clúster de tipo no se limpia. Antes de volver a ejecutar el comando de actualización para reanudar la actualización, borra el clúster de tipo:

docker stop gkectl-control-plane && docker rm gkectl-control-plane

Después de borrar el clúster de categoría, vuelve a ejecutar el comando de actualización.

Revierte una estación de trabajo de administrador después de una actualización

Puedes revertir la estación de trabajo de administrador a la versión que se usó antes de la actualización.

Durante la actualización, gkeadm registra la versión antes de que se actualice en el archivo de información de salida. Durante la reversión, gkeadm usa la versión que se muestra para descargar el archivo anterior.

Para revertir la estación de trabajo de administrador a la versión anterior, sigue estos pasos:

gkeadm rollback admin-workstation --config=AW_CONFIG_FILE

Puedes omitir --config=AW_CONFIG_FILE si el archivo de configuración de la estación de trabajo de administrador es admin-ws-config.yaml predeterminado. De lo contrario, reemplaza AW_CONFIG_FILE por la ruta de acceso al archivo de configuración de la estación de trabajo de administrador.

El comando de reversión realiza estos pasos:

Descarga la versión de reversión de gkeadm.
Crea una copia de seguridad del directorio principal de la estación de trabajo de administrador actual.
Crea una estación de trabajo de administrador nueva con la versión de reversión de gkeadm.
Borra la estación de trabajo de administrador original.

Instala el paquete con una versión diferente para la actualización

Si actualizas la estación de trabajo, se instalará un paquete con la versión correspondiente para actualizar los clústeres. Si deseas una versión diferente, sigue estos pasos a fin de instalar un paquete para TARGET_VERSION, que es la versión a la que deseas actualizar.

Para comprobar las versiones actuales de los clústeres y de gkectl, ejecuta este comando. Usa la marca --details/-d para obtener información más detallada.
```
gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details
```
En el resultado, se proporciona información sobre las versiones de tu clúster.
Según los resultados que obtengas, busca los siguientes problemas y corrígelos según sea necesario.
- Si la versión actual del clúster de administrador es más de una versión secundaria inferior a TARGET_VERSION, actualiza todos los clústeres para que sean una versión secundaria anterior a TARGET_VERSION.
- Si la versión gkectl es anterior a la 1.11 y deseas actualizar a la versión 1.12.x, tendrás que realizar varias actualizaciones. Actualiza una versión secundaria a la vez hasta llegar a la versión 1.11.x y, luego, continúa con las instrucciones de este tema.
- Si la versión de gkectl es anterior a TARGET_VERSION, actualiza la estación de trabajo de administrador a TARGET_VERSION.
Una vez que hayas determinado que tus versiones de gkectl y los clústeres son adecuadas para una actualización, descarga el paquete.

Verifica si el paquete comprimido ya existe en la estación de trabajo de administrador.
```
stat /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz
```
Si el paquete no está en la estación de trabajo de administrador, descárgalo.
```
gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz /var/lib/gke/bundles/
```
Instala el paquete.
```
gkectl prepare --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
Reemplaza ADMIN_CLUSTER_KUBECONFIG por la ruta de acceso de tu archivo kubeconfig. Puedes omitir esta marca si el archivo se encuentra en el directorio actual y tiene el nombre kubeconfig.

Nota: De forma predeterminada, se descarga el paquete normal, en lugar del paquete completo. El paquete completo contiene todas las imágenes de contenedor y VM, mientras que el paquete normal descarga las imágenes de contenedor y VM de Google Cloud Platform en la estación de trabajo de administrador durante la instalación. Para usar el paquete completo, establece la ruta de acceso del paquete en el comando de instalación gke-onprem-vsphere-TARGET_VERSION-full.tgz.
Enumera las versiones de clúster disponibles y asegúrate de que la versión de destino esté incluida en las versiones de clúster de usuario disponibles.
```
gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details
```

Ahora puedes crear un clúster de usuario en la versión de destino o actualizar un clúster de usuario a la versión de destino.

Soluciona problemas del proceso de actualización

Si tienes problemas cuando sigues el proceso de actualización recomendado, sigue estas recomendaciones para resolverlos. Estas sugerencias suponen que has comenzado con una configuración de la versión 1.11.x y que estás realizando el proceso de actualización recomendado.

Consulta también: Soluciona problemas de creación y actualización de clústeres

Soluciona un problema de actualización del clúster de usuario

Supongamos que encuentras un problema con la versión de actualización cuando actualizas un clúster de usuario. Determinas a partir de Atención al cliente de Google que el problema se solucionará en una próxima versión de parche. Puedes continuar de la siguiente manera:

Continúa usando la versión actual para la producción.
Prueba la versión del parche en un clúster que no sea de producción cuando se lance
Actualiza todos los clústeres de usuario de producción a la versión de actualización de parche cuando estés seguro.
Actualiza el clúster de administrador a la versión de actualización de parches.

Soluciona problemas de actualización de un clúster de administrador

Si surge algún problema cuando actualizas el clúster de administrador, debes comunicarte con la Atención al cliente de Google para resolverlo.

Mientras tanto, con el nuevo flujo de actualización, todavía puedes beneficiarse de las nuevas funciones del clúster de usuario sin que se bloquee la actualización del clúster de administrador, lo que te permite reducir la frecuencia de actualización del clúster de administrador, si así lo desea. El proceso de actualización puede proceder de la siguiente manera:

Actualiza los clústeres de usuario de producción a la versión 1.12.x.
Mantén la versión anterior del clúster de administrador y continúa recibiendo parches de seguridad.
Prueba la actualización de los clústeres de administrador de 1.11.x a 1.12.x en un entorno de prueba y, luego, informar los problemas si los hay
Si tu problema se resuelve con una versión de parche 1.12.x, puedes elegir actualizar el clúster de administrador de producción a esta versión de parche si lo deseas.

Problemas conocidos de versiones recientes

Los siguientes problemas conocidos podrían afectar las actualizaciones si estás actualizando desde la versión 1.7 o posterior.

Consulta también: Problemas conocidos

La actualización de la estación de trabajo de administrador puede fallar si el disco de datos está casi lleno

Si actualizas la estación de trabajo de administrador con el comando gkectl upgrade admin-workstation, la actualización podría fallar si el disco de datos está casi lleno, ya que el sistema intenta crear una copia de seguridad de la estación de trabajo de administrador actual de forma local mientras se actualiza a una nueva estación de trabajo de administrador. Si no puedes liberar suficiente espacio en el disco de datos, usa el comando gkectl upgrade admin-workstation con la marca adicional --backup-to-local=false para evitar realizar una copia de seguridad local de la estación de trabajo de administrador actual.

Interrupción de las cargas de trabajo con PodDisruptionBudgets

La actualización de los clústeres puede causar interrupciones o tiempo de inactividad para las cargas de trabajo que usan PodDisruptionBudgets (PDB).

El proceso de actualización de los nodos falla

Si tienes objetos PodDisruptionBudget configurados que no pueden permitir interrupciones adicionales, es posible que las actualizaciones de los nodos no se actualicen a la versión del plano de control después de varios intentos. Para evitar esta falla, te recomendamos que escales verticalmente la Deployment o la HorizontalPodAutoscaler a fin de permitir que el nodo se desvíe y aún respete la configuración de PodDisruptionBudget.

Para ver todos los objetos PodDisruptionBudget que no permiten ninguna interrupción, haz lo siguiente:

kubectl get poddisruptionbudget --all-namespaces -o jsonpath='{range .items[?(@.status.disruptionsAllowed==0)]}{.metadata.name}/{.metadata.namespace}{"\n"}{end}'

Apéndice

Acerca de las reglas de DRS de VMware habilitadas en la versión 1.1.0-gke.6

A partir de la versión 1.1.0-gke.6, Google Distributed Cloud crea automáticamente reglas de antiafinidad de Distributed Resource Scheduler (DRS) de VMware para los nodos del clúster de usuario, lo que hace que se distribuyan en al menos tres hosts físicos en tu centro de datos. A partir de la versión 1.1.0-gke.6, esta función se habilita de forma automática para clústeres nuevos y existentes.

Antes de realizar la actualización, asegúrate de que el entorno de vSphere cumpla con las siguientes condiciones:

DRS de VMware debe estar habilitado. Para el DRS de VMware, se requiere la edición de licencia de vSphere Enterprise Plus. Para aprender a habilitar el DRS, consulta Habilita el DRS de VMware en un clúster.
El nombre de usuario de vSphere que se proporciona en el archivo de configuración de credenciales tiene el permiso Host.Inventory.EditCluster.
Debe haber al menos tres hosts físicos disponibles.

Si el entorno de vSphere no cumple con las condiciones anteriores, aún puedes realizar la actualización. Pero para actualizar un clúster de usuario de 1.3.x a 1.4.x, debes inhabilitar los grupos antiafinidad. Para obtener más información, consulta este problema conocido en las notas de la versión de Google Distributed Cloud.

Información sobre el tiempo de inactividad durante las actualizaciones

Recurso	Descripción
Clúster de administrador	Cuando un clúster de administrador está inactivo, los planos de control y las cargas de trabajo en los clústeres de usuario continúan ejecutándose, a menos que se vean afectados por una falla que causó el tiempo de inactividad.
Plano de control del clúster de usuario	Por lo general, no es probable que se produzcan tiempos de inactividad perceptibles en los planos de control del clúster de usuario. Sin embargo, las conexiones de larga duración al servidor de la API de Kubernetes podrían fallar y tendrían que restablecerse. En esos casos, el emisor de la API debe volver a intentarlo hasta que se establezca una conexión. En el peor de los casos, puede haber hasta un minuto de tiempo de inactividad durante una actualización. Nota: Si los nodos del clúster de usuario no pueden acceder al plano de control de usuario durante la actualización, las cargas de trabajo nuevas no estarán programadas en el clúster. Las cargas de trabajo existentes no se verán afectadas.
Nodos del clúster de usuario	Si una actualización requiere un cambio en los nodos del clúster de usuario, Google Distributed Cloud recrea los nodos de forma progresiva y reprograma los Pods que se ejecutan en estos nodos. Puedes evitar el impacto en tus cargas de trabajo; para ello, configura PodDisruptionBudgets y reglas de antiafinidad adecuados.

Vuelve a crear un archivo de información si falta

Si falta el archivo de información de salida para tu estación de trabajo de administrador, debes volver a crear este archivo para poder continuar con la actualización. Este archivo se creó cuando creaste la estación de trabajo inicialmente y, si desde entonces realizaste una actualización, se actualizó con información nueva.

El archivo de información de salida tiene este formato:

Admin workstation version: GKEADM_VERSION
Created using gkeadm version: GKEADM_VERSION
VM name: ADMIN_WS_NAME
IP: ADMIN_WS_IP
SSH key used: FULL_PATH_TO_ADMIN_WS_SSH_KEY
To access your admin workstation:
ssh -i FULL-PATH-TO-ADMIN-WS-SSH-KEY ubuntu@ADMIN-WS-IP

A continuación, se muestra un archivo de información de salida de ejemplo:

Admin workstation version: v1.10.3-gke.49
Created using gkeadm version: v1.10.3-gke.49
VM name: admin-ws-janedoe
IP: 172.16.91.21
SSH key used: /usr/local/google/home/janedoe/.ssh/gke-admin-workstation
Upgraded from (rollback version): v1.10.0-gke.194
To access your admin workstation:
ssh -i /usr/local/google/home/janedoe/.ssh/gke-admin-workstation ubuntu@172.16.91.21

Crea el archivo en un editor y sustituye los parámetros que correspondan. Guarda el archivo con un nombre de archivo que sea igual al nombre de la VM en el directorio desde el que se ejecuta gkeadm. Por ejemplo, si el nombre de la VM es admin-ws-janedoe, guarda el archivo como admin-ws-janedoe.

¿Qué sigue?

Documentación de referencia de gcloud CLI
Documentación de referencia de Terraform
- google_gkeonprem_vmware_cluster
- google_gkeonprem_vmware_node_pool

Actualizar un clúster

Diferencias entre los clústeres avanzados

Actualización automática a clústeres avanzados en la versión 1.33

Requisitos

Reglas de versiones

Reglas de versión para gkectl

Revisa tus reglas de firewall

Habilitar stackdriver

Habilitar Dataplane V2

Requisitos de la API de Google y de IAM

Se bloquearon las funciones heredadas en las actualizaciones

Requisitos de IAM para actualizar clústeres de usuario

Limitaciones con los clústeres avanzados

Realiza cambios en la configuración antes o después de una actualización

Verifica las versiones disponibles para las actualizaciones de clústeres

Actualiza tu estación de trabajo de administrador

gkeadm

Ubica los archivos necesarios

Actualizar

Administrada por el usuario

Actualiza el clúster de administrador

1.31 y versiones más altas

1.30 y versiones más bajas

Antes de comenzar:

Realiza la actualización

Actualización asíncrona

Soluciona problemas de actualización asíncrona

Actualización síncrona

Actualiza un clúster de usuario

gkectl

Prepárate para actualizar un clúster de usuario

Ejecutar comprobaciones previas

Ejecuta gkectl upgrade cluster

Actualización asíncrona

Soluciona problemas de actualización asíncrona

Actualización síncrona

Reanuda una actualización

Console

gcloud CLI

Terraform

Quita el paquete completo

Reanuda la actualización de un clúster de administrador

Revierte una estación de trabajo de administrador después de una actualización

Instala el paquete con una versión diferente para la actualización

Soluciona problemas del proceso de actualización

Soluciona un problema de actualización del clúster de usuario

Soluciona problemas de actualización de un clúster de administrador

Problemas conocidos de versiones recientes

La actualización de la estación de trabajo de administrador puede fallar si el disco de datos está casi lleno

Interrupción de las cargas de trabajo con PodDisruptionBudgets

El proceso de actualización de los nodos falla

Apéndice

Acerca de las reglas de DRS de VMware habilitadas en la versión 1.1.0-gke.6

Información sobre el tiempo de inactividad durante las actualizaciones

Vuelve a crear un archivo de información si falta

¿Qué sigue?

Reglas de versión para `gkectl`

Habilitar `stackdriver`

Ejecuta `gkectl upgrade cluster`