Cómo obtener asistencia

El objetivo principal de la asistencia de Google es resolver los incidentes de producción lo más rápido posible. Comprender la configuración, analizar los registros y las métricas, y colaborar con los socios nos ayuda a resolver incidentes con rapidez.

Google Cloud ofrece varios paquetes de asistencia para satisfacer tus necesidades. Todos los paquetes de asistencia de Google Cloud son compatibles con la edición Google Kubernetes Engine (GKE) Enterprise y GKE en Bare Metal. Si tienes un paquete de asistencia de Google Cloud existente, ya tienes asistencia para GKE Enterprise y GKE en Bare Metal.

Para obtener más información, consulta la documentación de Asistencia de Google Cloud.

Requisitos para la asistencia de GKE en Bare Metal

Para solucionar de manera eficaz los incidentes críticos de la empresa, debes hacer lo siguiente:

Herramientas de asistencia

Para solucionar un incidente de GKE en Bare Metal, la asistencia de Google Cloud se basa en tres datos:

La configuración del entorno

Cuando abres un caso de ayuda, la ejecución de los siguientes comandos proporciona información clave sobre la configuración de tu clúster.

  • En todos tus tipos de clústeres, ejecuta el comando bmctl check cluster --snapshot para capturar información sobre Kubernetes y tus nodos. Adjunta el archivo tar resultante al caso de ayuda.

  • En los clústeres de administrador, independientes y híbridos, ejecuta el comando bmctl check cluster para verificar el estado del clúster y los nodos. Adjunta los registros resultantes al caso de ayuda. Deberían existir en el directorio bmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP].

  • Para los clústeres de usuario, primero crea un archivo YAML de verificación de estado con el nombre del clúster y el espacio de nombres y, luego, aplica el archivo en el clúster de administrador adecuado:

    1. Crea un archivo YAML con las siguientes propiedades de healthcheck. A continuación, se muestra contenido de muestra de un clúster llamado user1 en el espacio de nombres cluster-user1:

      apiVersion: baremetal.cluster.gke.io/v1
      kind: HealthCheck
      metadata:
        generateName: healthcheck-
        namespace: cluster-user1
      spec:
        clusterName: user1
      
    2. Después de crear el archivo YAML, aplica el recurso personalizado en el clúster de administrador que controla el clúster de usuario con el comando kubectl. A continuación, se muestra un comando de muestra con el archivo YAML creado en el paso anterior. En la muestra, la variable ADMIN_KUBECONFIG especifica la ruta de acceso al archivo kubeconfig del clúster de administrador:

      kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
      

      El comando muestra la siguiente respuesta:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
      
    3. Espera hasta que finalice el trabajo de verificación de estado para comprobar si se ha terminado de validar el trabajo de verificación de estado. En el caso de ejemplo anterior, el nombre del trabajo de verificación de estado es healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf. A continuación, se muestra una prueba de muestra con el comando kubectl que espera 30 minutos para que se complete el trabajo de verificación de estado:

      kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \
          -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
      

      Cuando se complete, este comando mostrará lo siguiente:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
      

      Puedes ver los resultados del trabajo de verificación de estado con el siguiente comando:

      kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \
          -n cluster-user1
      

      El comando muestra el siguiente resultado:

      NAME                PASS   AGE
      healthcheck-7c4qf   true   17m
      
    4. Recopila todos los registros del Pods del trabajo de verificación de estado en un archivo local con el comando kubectl. Este es un ejemplo que usa el trabajo de verificación de estado de muestra anterior:

      kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \
          -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \
          healthcheck-7c4qf.log
      

Registros del clúster

Cuando creas un clúster de GKE nuevo en Bare Metal, los agentes de Cloud Logging están habilitados de forma predeterminada y se limitan solo a los componentes a nivel del sistema. Esto replica los registros a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Los registros a nivel del sistema provienen de Pods de Kubernetes en los siguientes espacios de nombres:

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • gatekeeper-system
  • cnrm-system
  • knative-serving

Los registros se pueden consultar desde la consola de Cloud Logging.

Para obtener más información, consulta Logging y Monitoring.

Google Cloud CLI y acceso a clústeres remotos

Si abres un caso de ayuda, es posible que la Atención al cliente de Cloud te solicite acceso remoto de solo lectura a tus clústeres para diagnosticar y resolver problemas de manera más efectiva. Para que el equipo de asistencia tenga acceso suficiente a fin de solucionar los problemas de tu clúster de forma remota, asegúrate de haber instalado y actualizado la versión más reciente de la Google Cloud CLI. La Google Cloud CLI debe estar en la versión 401.0.0 o una superior para otorgar a la Atención al cliente de Cloud los permisos necesarios. Te recomendamos que actualices Google Cloud CLI de forma periódica para obtener los permisos adicionales y otras mejoras.

Para instalar los componentes más recientes de gcloud CLI, usa el comando gcloud components update. Si quieres obtener más información para otorgarle a Atención al cliente de Cloud acceso de solo lectura a tus clústeres, consulta Asistencia de Google Cloud para tus clústeres registrados.

Métricas del clúster

Además de los registros, el agente de Cloud Monitoring también captura métricas. Esto replica las métricas a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Las métricas a nivel de sistema provienen de Pods de Kubernetes que se ejecutan en los mismos espacios de nombres que se enumeran en Registros.

Para obtener más información, consulta Logging y Monitoring.

Cómo solucionamos los problemas de tu entorno

A continuación, se muestra un ejemplo de un incidente de asistencia típico:

  1. El administrador del clúster abre un caso de asistencia en la consola de Google Cloud o en Google Cloud Support Center y selecciona la edición Google Kubernetes Engine (GKE) Enterprise y GKE en Bare Metal como categoría y componente, respectivamente. Ingresa la información requerida y adjunta el resultado de los comandos bmctl relevantes al caso.

  2. El caso de ayuda se enruta a un ingeniero de asistencia técnica especializado en GKE en Bare Metal.

  3. El ingeniero de asistencia examina el contenido de la instantánea para obtener el contexto del entorno.

  4. El ingeniero de asistencia examina los registros y las métricas del proyecto de Google Cloud. Para ello, ingresa el ID del caso de ayuda como justificación empresarial, que se registra de forma interna.

  5. El ingeniero de asistencia responde al caso con una evaluación y una recomendación. El ingeniero de asistencia y el usuario continúan con la solución de problemas hasta llegar a una solución.

¿Qué hace la Atención al cliente de Google?

Por lo general, el equipo de asistencia de Cloud admite todos los componentes de software que se envían como parte de GKE en Bare Metal y Anthos Service Mesh, el Controlador de políticas, el Sincronizador de configuración y el Controlador de configuración. Consulta la siguiente tabla para obtener una lista más completa de lo que se admite y lo que no:

Con la asistencia de Google Cloud No compatible
Kubernetes y el entorno de ejecución del contenedor Elección por parte del cliente del balanceador de cargas (balanceo de cargas manual)
Connect y agente Connect Código del cliente (consulta Asistencia para programadores)
Cloud Operations, Monitoring, Logging y agentes Elección por parte del cliente del sistema operativo
Balanceador de cargas en paquetes Servidor, almacenamiento y red virtuales o físicos
Controlador de Ingress DNS externo, DHCP y sistemas de identidad
GKE Identity Service
Anthos Service Mesh
Policy Controller
Sincronizador de configuración
Config Controller

Política de asistencia de la versión

La compatibilidad con GKE en Bare Metal sigue la Política de compatibilidad de la versión de Google Kubernetes Engine (GKE) Enterprise Edition. A partir de la versión 1.14 de la edición Enterprise de Google Kubernetes Engine (GKE), Google admite cada versión secundaria de GKE en Bare Metal durante 12 meses después del lanzamiento inicial de la versión secundaria o hasta el lanzamiento de la tercera versión secundaria posterior, lo que sea más largo.

En la siguiente tabla, se muestran las versiones compatibles y no compatibles de este producto.

Versión secundaria Fecha de lanzamiento Fecha del final del ciclo de vida más temprana Parches disponibles Versión de Kubernetes
1.28 (más reciente) 15 de diciembre de 2023 15 de diciembre de 2024 1.28.400-gke.77 v1.28.7-gke.1700
1.28.300-gke.131 v1.28.7-gke.1700
1.28.200-gke.118 v1.28.5-gke.1200
1.28.100-gke.146 v1.28.5-gke.1200
1.28.0-gke.435 v1.28.3-gke.700
1.16 25 de agosto de 2023 25 de agosto de 2024 1.16.8 v1.27.12-gke.800
1.16.7 Versión 1.27.10-gke.500
1.16.6 v1.27.9-gke.1200
1.16.5 v1.27.8-gke.1500
1.16.4 v1.27.7-gke.1400
1.16.3 v1.27.6-gke.2500
1.16.2 v1.27.4-gke.1600
1.16.1 v1.27.4-gke.1600
1.16.0 v1.27.4-gke.1600
1.15 27 de abril 2023 27 de abril de 2024 1.15.11 v1.26.13-gke.1100
1.15.10 v1.26.13-gke.400
1.15.9 v1.26.12-gke.1200
1.15.8 v1.26.10-gke.1400
1.15.7 v1.26.9-gke.2400
1.15.6 v1.26.8-gke.200
1.15.5 v1.26.8-gke.200
1.15.4 v1.26.5-gke.2100
1.15.3 v1.26.5-gke.2100
1.15.2 v1.26.5-gke.1200
1.15.1 v1.26.2-gke.1001
1.15.0 v1.26.2-gke.1001
1.14 (no compatible) 8 de diciembre de 2022 8 de diciembre de 2023 1.14.11 v1.25.14-gke.2400
1.14.10 v1.25.14-gke.2400
1.14.9 v1.25.13-gke.200
1.14.8 Versión 1.25.10-gke.2100
1.14.7 Versión 1.25.10-gke.2100
1.14.6 v1.25.10-gke.1200
1.14.5 v1.25.7-gke.1000
1.14.4 v1.25.7-gke.1000
1.14.3 v1.25.6-gke.1000
1.14.2 v1.25.5-gke.1001
1.14.1 v1.25.5-gke.1001
1.14.0 v1.25.3-gke.1400
1.13 (no compatible) 29 de septiembre de 2022 17 de agosto de 2022 1.13.10 v1.24.14-gke.2100
1.13.9 v1.24.14-gke.1200
1.13.8 Versión 1.24.11-gke.1000
1.13.7 Versión 1.24.11-gke.1000
1.13.6 v1.24.9-gke.2500
1.13.5 v1.24.9-gke.2500
1.13.4 v1.24.9-gke.2500
1.13.3 v1.24.7-gke.1700
1.13.2 v1.24.7-gke.300
1.13.1 v1.24.5-gke.400
1.13.0 v1.24.2-gke.1900
1.12 (no compatible) 29 de junio de 2022 29 de marzo de 2023 1.12.9 v1.23.17-gke.300
1.12.8 v1.23.16-gke.100
1.12.7 v1.23.15-gke.2400
1.12.6 v1.23.13-gke.1700
1.12.5 v1.23.13-gke.1700
1.12.4 v1.23.11-gke.500
1.12.3 v1.23.10-gke.1000
1.12.2 v1.23.5-gke.1505
1.12.1 v1.23.5-gke.1505
1.12.0 v1.23.5-gke.1504
1.11 (no compatible) 21 de Marzo de 2022 21 de diciembre de 2022 1.11.8 v1.22.15-gke.3300
1.11.7 v1.22.14-gke.500
1.11.6 v1.22.8-gke.204
1.11.5 v1.22.8-gke.204
1.11.4 v1.22.8-gke.204
1.11.3 v1.22.8-gke.203
1.11.2 v1.22.8-gke.200
1.11.1 v1.22.8-gke.200
1.11.0 v1.22.8-gke.200
1.10 (no compatible) 10 de diciembre de 2021 10 de septiembre de 2022 1.10.8 v1.21.13-gke.202
1.10.7 v1.21.13-gke.202
1.10.6 v1.21.13-gke.201
1.10.5 v1.21.6-gke.1503
1.10.4 v1.21.6-gke.1503
1.10.3 v1.21.5-gke.1300
1.10.2 v1.21.5-gke.1300
1.10.1 v1.21.5-gke.1200
1.10.0 v1.21.5-gke.1200
1.9 (no compatible) 23 de septiembre de 2021 23 de junio de 2022 1.9.8 v1.21.13-gke.200
1.9.7 v1.21.6-gke.1503
1.9.6 v1.21.5-gke.1300
1.9.5 v1.21.5-gke.1300
1.9.4 v1.21.5-gke.1200
1.9.3 v1.21.5-gke.1200
1.9.2 v1.21.4-gke.201
1.9.1 v1.21.4-gke.201
1.9.0 v1.21.4-gke.200
1.8 (no compatible) 21 de junio de 2021 21 de Marzo de 2022 1.8.9 v1.20.9-gke.102
1.8.8 v1.20.9-gke.102
1.8.7 v1.20.9-gke.102
1.8.6 v1.20.9-gke.102
1.8.5 v1.20.9-gke.102
1.8.4 v1.20.9-gke.101
1.8.3 v1.20.9-gke.101
1.8.2 v1.20.8-gke.1500
1.8.1 v1.20.5-gke.1301
1.8.0 v1.20.5-gke.1301
1.7 (no compatible) 25 de marzo de 2021 25 de diciembre de 2021 1.7.7 v1.19.14-gke.2201
1.7.6 v1.19.14-gke.2201
1.7.5 v1.19.14-gke.2201
1.7.4 v1.19.14-gke.400
1.7.3 v1.19.13-gke.100
1.7.2 v1.19.10-gke.1602
1.7.1 v1.19.7-gke.1200
1.7.0 v1.19.7-gke.1200
1.6 (no compatible) 30 de noviembre de 2020 30 de agosto de 2021 1.6.4 v1.18.20-gke.3000
1.6.3 v1.18.18-gke.100
1.6.2 v1.18.6-gke.6600
1.6.1 v1.18.6-gke.6600
1.6.0 v1.18.6-gke.6600

Funciones admitidas

En este documento, se enumera la disponibilidad de características y capacidades de GKE en Bare Metal para las versiones compatibles. La tabla no es una lista exhaustiva, pero destaca algunos de los beneficios de actualizar los clústeres a la versión compatible más reciente.

Las funciones que se mencionan como Versión preliminar están cubiertas por las Condiciones de las ofertas de la fase previa a la DG de las Condiciones del Servicio de Google Cloud. Los productos y las funciones que se encuentran en la fase previa a la DG pueden tener asistencia limitada, y los cambios en estos productos y funciones podrían no ser compatibles con otras versiones de la fase previa a la DG. Para obtener más información, consulta las descripciones de la etapa de lanzamiento. Las ofertas de versión preliminar están destinadas solo para el uso en entornos de pruebas.

Las funciones que figuran con disponibilidad general (DG) tienen compatibilidad total, están abiertas a todos los clientes y están listas para su uso en producción.

Atributo/función 1.15 (no compatible) 1.16 1.28 1.29 (más reciente)
Compatibilidad del clúster de administrador con varias versiones del clúster de usuario - - - Vista previa
Políticas de alertas Vista previa Vista previa Vista previa Vista previa
Entorno de ejecución de VM en Google Distributed Cloud GA GA GA GA
Grupos de Azure Active Directory (AD) GA GA GA GA
Compatibilidad con balanceador de cargas basado en BGP para IPv6 GA GA GA GA
Autorización Binaria Vista previa GA GA GA
Balanceo de cargas en paquetes con BGP GA GA GA GA
Cloud Audit Logging GA GA GA GA
Compatibilidad con la CLI de copias de seguridad y restablecimiento de clústeres GA GA GA GA
Rotación de autoridades certificadas (CA) de clúster GA GA GA GA
Compatibilidad con la CLI de restablecimiento de nodos de clústeres GA GA GA GA
Pausar y reanudar la actualización del clúster - - Vista previa Vista previa
entorno de ejecución del contenedor containerd GA GA GA GA
Grupo de control v2 GA GA GA GA
Autoridades certificadoras personalizadas - Vista previa GA GA
Modo de reenvío de balanceo de cargas de retorno directo del servidor (DSR) de Dataplane V2 - Vista previa GA GA
IP plana dinámica con protocolo de puerta de enlace fronteriza (BGP) GA GA GA GA
Puerta de enlace NAT de salida GA GA GA GA
Modo IPv4 plano (estático) GA GA GA GA
Compatibilidad con IPv6 plana (modo BGP) GA GA GA GA
GKE Identity Service v2 - - Vista previa GA
Pila doble IPv4/IPv6 GA GA GA GA
Compatibilidad con KSA GA GA GA GA
Recopilador administrado de Google Cloud Managed Service para Prometheus GA GA GA GA
Conectividad de varios clústeres Vista previa Vista previa Vista previa Vista previa
Varias NIC para Pods GA GA GA GA
Puerta de enlace de red para GDC Vista previa Vista previa Vista previa Vista previa
Detector de problemas de nodos GA GA GA GA
Actualizaciones de nodos paralelos GA GA GA GA
Actualizaciones de grupos de nodos paralelos Vista previa GA GA GA
Operador de ajuste de rendimiento - Vista previa Vista previa Vista previa
Compatibilidad con registros privados para nodos - - - Vista previa
Compatibilidad con la duplicación de registros GA GA GA GA
Modo de computación seguro (seccomp) GA GA GA GA
Omitir actualización de la versión del grupo de nodos - - Vista previa GA
Herramientas de redes de SR-IOV GA GA GA GA
Resumen de las métricas de la API GA GA GA GA
Controles del servicio de VPC Vista previa GA GA GA
Reversión de la actualización del grupo de nodos trabajadores - - - Vista previa
Workload Identity GA GA GA GA

Modelo de responsabilidad compartida

La ejecución de una aplicación de producción esencial para la empresa en GKE en Bare Metal requiere que varias partes tengan diferentes responsabilidades. Si bien no es una lista exhaustiva, en las siguientes secciones, se enumeran las funciones y responsabilidades.

Responsabilidades de Google

  • Mantenimiento y distribución del paquete de software de GKE en Bare Metal.
  • Notificar a los usuarios sobre las actualizaciones disponibles para GKE en Bare Metal y producir secuencias de comandos de actualización para la versión anterior; GKE en Bare Metal solo admite actualizaciones secuenciales (ejemplo: 1.2 → 1.3 → 1.4 y no 1.2 → 1.4).
  • Operar los servicios de Connect y Cloud Operations.
  • Solucionar problemas, brindar soluciones alternativas y corregir la causa raíz de cualquier problema relacionado con los componentes que proporciona Google

Responsabilidades del usuario

  • Administrar de forma general el sistema para clústeres locales
  • Mantener cualquier carga de trabajo de la aplicación que se implementa en el clúster
  • Ejecutar, mantener y aplicar parches a la infraestructura del centro de datos, incluidas las herramientas de redes, los servidores, el sistema operativo, el almacenamiento y la conectividad a Google Cloud
  • Ejecutar, mantener y aplicar parches en los balanceadores de cargas de red si se elige la opción de balanceador de cargas manual
  • Actualizar GKE en versiones de Bare Metal con regularidad
  • Supervisar el clúster y las aplicaciones, y responder a cualquier incidente
  • Garantizar que los agentes de Cloud Operations se implementen en los clústeres
  • Proporcionar detalles del entorno a Google para solucionar problemas

Asistencia para desarrolladores

Google no proporciona asistencia específica para las cargas de trabajo de tu aplicación. Sin embargo, ofrecemos asistencia para desarrolladores en el mejor esfuerzo con el fin de garantizar que puedan ejecutar aplicaciones en GKE en Bare Metal. Creemos que interactuar temprano durante el desarrollo puede evitar incidentes críticos más adelante en la implementación.

El equipo de Asistencia para Desarrolladores de mejor esfuerzo está disponible para clientes con cualquier paquete de asistencia pago y se trata como una prioridad de P3 si un problema bloquea un lanzamiento o como una prioridad de P4 en el caso de las consultas generales. En esta clasificación, el nivel de prioridad 0 es la prioridad más alta.