El objetivo principal de la asistencia de Google es resolver los incidentes de producción lo más rápido posible. Comprender la configuración, analizar los registros y las métricas, y colaborar con los socios nos ayuda a resolver incidentes con rapidez.
Google Cloud ofrece varios paquetes de asistencia para satisfacer tus necesidades. Todos los paquetes de asistencia de Google Cloud son compatibles con la edición Google Kubernetes Engine (GKE) Enterprise y GKE en Bare Metal. Si tienes un paquete de asistencia de Google Cloud existente, ya tienes asistencia para GKE Enterprise y GKE en Bare Metal.
Para obtener más información, consulta la documentación de Asistencia de Google Cloud.
Requisitos para la asistencia de GKE en Bare Metal
Para solucionar de manera eficaz los incidentes críticos de la empresa, debes hacer lo siguiente:
- Verifica que tu entorno sea actual y que esté dentro de los períodos de fin de la asistencia publicados. Consulta la sección Política de compatibilidad de versiones para obtener más información.
- Habilita Cloud Logging y Cloud Monitoring para los componentes del sistema. Para obtener más detalles, consulta la siguiente sección Herramientas de asistencia.
Herramientas de asistencia
Para solucionar un incidente de GKE en Bare Metal, la asistencia de Google Cloud se basa en tres datos:
- La configuración del entorno
- Los registros de tus clústeres
- Las métricas de tus clústeres
La configuración del entorno
Cuando abres un caso de ayuda, la ejecución de los siguientes comandos proporciona información clave sobre la configuración de tu clúster.
En todos tus tipos de clústeres, ejecuta el comando
bmctl check cluster --snapshot
para capturar información sobre Kubernetes y tus nodos. Adjunta el archivo tar resultante al caso de ayuda.En los clústeres de administrador, independientes y híbridos, ejecuta el comando
bmctl check cluster
para verificar el estado del clúster y los nodos. Adjunta los registros resultantes al caso de ayuda. Deberían existir en el directoriobmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
.Para los clústeres de usuario, primero crea un archivo YAML de verificación de estado con el nombre del clúster y el espacio de nombres y, luego, aplica el archivo en el clúster de administrador adecuado:
Crea un archivo YAML con las siguientes propiedades de
healthcheck
. A continuación, se muestra contenido de muestra de un clúster llamadouser1
en el espacio de nombrescluster-user1
:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
Después de crear el archivo YAML, aplica el recurso personalizado en el clúster de administrador que controla el clúster de usuario con el comando
kubectl
. A continuación, se muestra un comando de muestra con el archivo YAML creado en el paso anterior. En la muestra, la variableADMIN_KUBECONFIG
especifica la ruta de acceso al archivo kubeconfig del clúster de administrador:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
El comando muestra la siguiente respuesta:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
Espera hasta que finalice el trabajo de verificación de estado para comprobar si se ha terminado de validar el trabajo de verificación de estado. En el caso de ejemplo anterior, el nombre del trabajo de verificación de estado es
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
. A continuación, se muestra una prueba de muestra con el comandokubectl
que espera 30 minutos para que se complete el trabajo de verificación de estado:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
Cuando se complete, este comando mostrará lo siguiente:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
Puedes ver los resultados del trabajo de verificación de estado con el siguiente comando:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
El comando muestra el siguiente resultado:
NAME PASS AGE healthcheck-7c4qf true 17m
Recopila todos los registros del Pods del trabajo de verificación de estado en un archivo local con el comando
kubectl
. Este es un ejemplo que usa el trabajo de verificación de estado de muestra anterior:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
Registros del clúster
Cuando creas un clúster de GKE nuevo en Bare Metal, los agentes de Cloud Logging están habilitados de forma predeterminada y se limitan solo a los componentes a nivel del sistema. Esto replica los registros a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Los registros a nivel del sistema provienen de Pods de Kubernetes en los siguientes espacios de nombres:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
Los registros se pueden consultar desde la consola de Cloud Logging.
Para obtener más información, consulta Logging y Monitoring.
Google Cloud CLI y acceso a clústeres remotos
Si abres un caso de ayuda, es posible que la Atención al cliente de Cloud te solicite acceso remoto de solo lectura a tus clústeres para diagnosticar y resolver problemas de manera más efectiva. Para que el equipo de asistencia tenga acceso suficiente a fin de solucionar los problemas de tu clúster de forma remota, asegúrate de haber instalado y actualizado la versión más reciente de la Google Cloud CLI. La Google Cloud CLI debe estar en la versión 401.0.0 o una superior para otorgar a la Atención al cliente de Cloud los permisos necesarios. Te recomendamos que actualices Google Cloud CLI de forma periódica para obtener los permisos adicionales y otras mejoras.
Para instalar los componentes más recientes de gcloud CLI, usa el comando gcloud
components update
. Si quieres obtener más información para otorgarle a Atención al cliente de Cloud acceso de solo lectura a tus clústeres, consulta Asistencia de Google Cloud para tus clústeres registrados.
Métricas del clúster
Además de los registros, el agente de Cloud Monitoring también captura métricas. Esto replica las métricas a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Las métricas a nivel de sistema provienen de Pods de Kubernetes que se ejecutan en los mismos espacios de nombres que se enumeran en Registros.
Para obtener más información, consulta Logging y Monitoring.
Cómo solucionamos los problemas de tu entorno
A continuación, se muestra un ejemplo de un incidente de asistencia típico:
El administrador del clúster abre un caso de asistencia en la consola de Google Cloud o en Google Cloud Support Center y selecciona la edición Google Kubernetes Engine (GKE) Enterprise y GKE en Bare Metal como categoría y componente, respectivamente. Ingresa la información requerida y adjunta el resultado de los comandos
bmctl
relevantes al caso.El caso de ayuda se enruta a un ingeniero de asistencia técnica especializado en GKE en Bare Metal.
El ingeniero de asistencia examina el contenido de la instantánea para obtener el contexto del entorno.
El ingeniero de asistencia examina los registros y las métricas del proyecto de Google Cloud. Para ello, ingresa el ID del caso de ayuda como justificación empresarial, que se registra de forma interna.
El ingeniero de asistencia responde al caso con una evaluación y una recomendación. El ingeniero de asistencia y el usuario continúan con la solución de problemas hasta llegar a una solución.
¿Qué hace la Atención al cliente de Google?
Por lo general, el equipo de asistencia de Cloud admite todos los componentes de software que se envían como parte de GKE en Bare Metal y Anthos Service Mesh, el Controlador de políticas, el Sincronizador de configuración y el Controlador de configuración. Consulta la siguiente tabla para obtener una lista más completa de lo que se admite y lo que no:
Con la asistencia de Google Cloud | No compatible |
---|---|
Kubernetes y el entorno de ejecución del contenedor | Elección por parte del cliente del balanceador de cargas (balanceo de cargas manual) |
Connect y agente Connect | Código del cliente (consulta Asistencia para programadores) |
Cloud Operations, Monitoring, Logging y agentes | Elección por parte del cliente del sistema operativo |
Balanceador de cargas en paquetes | Servidor, almacenamiento y red virtuales o físicos |
Controlador de Ingress | DNS externo, DHCP y sistemas de identidad |
GKE Identity Service | |
Anthos Service Mesh | |
Policy Controller | |
Sincronizador de configuración | |
Config Controller |
Política de asistencia de la versión
La compatibilidad con GKE en Bare Metal sigue la Política de compatibilidad de la versión de Google Kubernetes Engine (GKE) Enterprise Edition. A partir de la versión 1.14 de la edición Enterprise de Google Kubernetes Engine (GKE), Google admite cada versión secundaria de GKE en Bare Metal durante 12 meses después del lanzamiento inicial de la versión secundaria o hasta el lanzamiento de la tercera versión secundaria posterior, lo que sea más largo.
En la siguiente tabla, se muestran las versiones compatibles y no compatibles de este producto.
Versión secundaria | Fecha de lanzamiento | Fecha del final del ciclo de vida más temprana | Parches disponibles | Versión de Kubernetes |
---|---|---|---|---|
1.28 (más reciente) | 15 de diciembre de 2023 | 15 de diciembre de 2024 | 1.28.400-gke.77 | v1.28.7-gke.1700 |
1.28.300-gke.131 | v1.28.7-gke.1700 | |||
1.28.200-gke.118 | v1.28.5-gke.1200 | |||
1.28.100-gke.146 | v1.28.5-gke.1200 | |||
1.28.0-gke.435 | v1.28.3-gke.700 | |||
1.16 | 25 de agosto de 2023 | 25 de agosto de 2024 | 1.16.8 | v1.27.12-gke.800 |
1.16.7 | Versión 1.27.10-gke.500 | |||
1.16.6 | v1.27.9-gke.1200 | |||
1.16.5 | v1.27.8-gke.1500 | |||
1.16.4 | v1.27.7-gke.1400 | |||
1.16.3 | v1.27.6-gke.2500 | |||
1.16.2 | v1.27.4-gke.1600 | |||
1.16.1 | v1.27.4-gke.1600 | |||
1.16.0 | v1.27.4-gke.1600 | |||
1.15 | 27 de abril 2023 | 27 de abril de 2024 | 1.15.11 | v1.26.13-gke.1100 |
1.15.10 | v1.26.13-gke.400 | |||
1.15.9 | v1.26.12-gke.1200 | |||
1.15.8 | v1.26.10-gke.1400 | |||
1.15.7 | v1.26.9-gke.2400 | |||
1.15.6 | v1.26.8-gke.200 | |||
1.15.5 | v1.26.8-gke.200 | |||
1.15.4 | v1.26.5-gke.2100 | |||
1.15.3 | v1.26.5-gke.2100 | |||
1.15.2 | v1.26.5-gke.1200 | |||
1.15.1 | v1.26.2-gke.1001 | |||
1.15.0 | v1.26.2-gke.1001 | |||
1.14 (no compatible) | 8 de diciembre de 2022 | 8 de diciembre de 2023 | 1.14.11 | v1.25.14-gke.2400 |
1.14.10 | v1.25.14-gke.2400 | |||
1.14.9 | v1.25.13-gke.200 | |||
1.14.8 | Versión 1.25.10-gke.2100 | |||
1.14.7 | Versión 1.25.10-gke.2100 | |||
1.14.6 | v1.25.10-gke.1200 | |||
1.14.5 | v1.25.7-gke.1000 | |||
1.14.4 | v1.25.7-gke.1000 | |||
1.14.3 | v1.25.6-gke.1000 | |||
1.14.2 | v1.25.5-gke.1001 | |||
1.14.1 | v1.25.5-gke.1001 | |||
1.14.0 | v1.25.3-gke.1400 | |||
1.13 (no compatible) | 29 de septiembre de 2022 | 17 de agosto de 2022 | 1.13.10 | v1.24.14-gke.2100 |
1.13.9 | v1.24.14-gke.1200 | |||
1.13.8 | Versión 1.24.11-gke.1000 | |||
1.13.7 | Versión 1.24.11-gke.1000 | |||
1.13.6 | v1.24.9-gke.2500 | |||
1.13.5 | v1.24.9-gke.2500 | |||
1.13.4 | v1.24.9-gke.2500 | |||
1.13.3 | v1.24.7-gke.1700 | |||
1.13.2 | v1.24.7-gke.300 | |||
1.13.1 | v1.24.5-gke.400 | |||
1.13.0 | v1.24.2-gke.1900 | |||
1.12 (no compatible) | 29 de junio de 2022 | 29 de marzo de 2023 | 1.12.9 | v1.23.17-gke.300 |
1.12.8 | v1.23.16-gke.100 | |||
1.12.7 | v1.23.15-gke.2400 | |||
1.12.6 | v1.23.13-gke.1700 | |||
1.12.5 | v1.23.13-gke.1700 | |||
1.12.4 | v1.23.11-gke.500 | |||
1.12.3 | v1.23.10-gke.1000 | |||
1.12.2 | v1.23.5-gke.1505 | |||
1.12.1 | v1.23.5-gke.1505 | |||
1.12.0 | v1.23.5-gke.1504 | |||
1.11 (no compatible) | 21 de Marzo de 2022 | 21 de diciembre de 2022 | 1.11.8 | v1.22.15-gke.3300 |
1.11.7 | v1.22.14-gke.500 | |||
1.11.6 | v1.22.8-gke.204 | |||
1.11.5 | v1.22.8-gke.204 | |||
1.11.4 | v1.22.8-gke.204 | |||
1.11.3 | v1.22.8-gke.203 | |||
1.11.2 | v1.22.8-gke.200 | |||
1.11.1 | v1.22.8-gke.200 | |||
1.11.0 | v1.22.8-gke.200 | |||
1.10 (no compatible) | 10 de diciembre de 2021 | 10 de septiembre de 2022 | 1.10.8 | v1.21.13-gke.202 |
1.10.7 | v1.21.13-gke.202 | |||
1.10.6 | v1.21.13-gke.201 | |||
1.10.5 | v1.21.6-gke.1503 | |||
1.10.4 | v1.21.6-gke.1503 | |||
1.10.3 | v1.21.5-gke.1300 | |||
1.10.2 | v1.21.5-gke.1300 | |||
1.10.1 | v1.21.5-gke.1200 | |||
1.10.0 | v1.21.5-gke.1200 | |||
1.9 (no compatible) | 23 de septiembre de 2021 | 23 de junio de 2022 | 1.9.8 | v1.21.13-gke.200 |
1.9.7 | v1.21.6-gke.1503 | |||
1.9.6 | v1.21.5-gke.1300 | |||
1.9.5 | v1.21.5-gke.1300 | |||
1.9.4 | v1.21.5-gke.1200 | |||
1.9.3 | v1.21.5-gke.1200 | |||
1.9.2 | v1.21.4-gke.201 | |||
1.9.1 | v1.21.4-gke.201 | |||
1.9.0 | v1.21.4-gke.200 | |||
1.8 (no compatible) | 21 de junio de 2021 | 21 de Marzo de 2022 | 1.8.9 | v1.20.9-gke.102 |
1.8.8 | v1.20.9-gke.102 | |||
1.8.7 | v1.20.9-gke.102 | |||
1.8.6 | v1.20.9-gke.102 | |||
1.8.5 | v1.20.9-gke.102 | |||
1.8.4 | v1.20.9-gke.101 | |||
1.8.3 | v1.20.9-gke.101 | |||
1.8.2 | v1.20.8-gke.1500 | |||
1.8.1 | v1.20.5-gke.1301 | |||
1.8.0 | v1.20.5-gke.1301 | |||
1.7 (no compatible) | 25 de marzo de 2021 | 25 de diciembre de 2021 | 1.7.7 | v1.19.14-gke.2201 |
1.7.6 | v1.19.14-gke.2201 | |||
1.7.5 | v1.19.14-gke.2201 | |||
1.7.4 | v1.19.14-gke.400 | |||
1.7.3 | v1.19.13-gke.100 | |||
1.7.2 | v1.19.10-gke.1602 | |||
1.7.1 | v1.19.7-gke.1200 | |||
1.7.0 | v1.19.7-gke.1200 | |||
1.6 (no compatible) | 30 de noviembre de 2020 | 30 de agosto de 2021 | 1.6.4 | v1.18.20-gke.3000 |
1.6.3 | v1.18.18-gke.100 | |||
1.6.2 | v1.18.6-gke.6600 | |||
1.6.1 | v1.18.6-gke.6600 | |||
1.6.0 | v1.18.6-gke.6600 |
Funciones admitidas
En este documento, se enumera la disponibilidad de características y capacidades de GKE en Bare Metal para las versiones compatibles. La tabla no es una lista exhaustiva, pero destaca algunos de los beneficios de actualizar los clústeres a la versión compatible más reciente.
Las funciones que se mencionan como Versión preliminar están cubiertas por las Condiciones de las ofertas de la fase previa a la DG de las Condiciones del Servicio de Google Cloud. Los productos y las funciones que se encuentran en la fase previa a la DG pueden tener asistencia limitada, y los cambios en estos productos y funciones podrían no ser compatibles con otras versiones de la fase previa a la DG. Para obtener más información, consulta las descripciones de la etapa de lanzamiento. Las ofertas de versión preliminar están destinadas solo para el uso en entornos de pruebas.
Las funciones que figuran con disponibilidad general (DG) tienen compatibilidad total, están abiertas a todos los clientes y están listas para su uso en producción.
Atributo/función | 1.15 (no compatible) | 1.16 | 1.28 | 1.29 (más reciente) |
---|---|---|---|---|
Compatibilidad del clúster de administrador con varias versiones del clúster de usuario | - | - | - | Vista previa |
Políticas de alertas | Vista previa | Vista previa | Vista previa | Vista previa |
Entorno de ejecución de VM en Google Distributed Cloud | GA | GA | GA | GA |
Grupos de Azure Active Directory (AD) | GA | GA | GA | GA |
Compatibilidad con balanceador de cargas basado en BGP para IPv6 | GA | GA | GA | GA |
Autorización Binaria | Vista previa | GA | GA | GA |
Balanceo de cargas en paquetes con BGP | GA | GA | GA | GA |
Cloud Audit Logging | GA | GA | GA | GA |
Compatibilidad con la CLI de copias de seguridad y restablecimiento de clústeres | GA | GA | GA | GA |
Rotación de autoridades certificadas (CA) de clúster | GA | GA | GA | GA |
Compatibilidad con la CLI de restablecimiento de nodos de clústeres | GA | GA | GA | GA |
Pausar y reanudar la actualización del clúster | - | - | Vista previa | Vista previa |
entorno de ejecución del contenedor containerd | GA | GA | GA | GA |
Grupo de control v2 | GA | GA | GA | GA |
Autoridades certificadoras personalizadas | - | Vista previa | GA | GA |
Modo de reenvío de balanceo de cargas de retorno directo del servidor (DSR) de Dataplane V2 | - | Vista previa | GA | GA |
IP plana dinámica con protocolo de puerta de enlace fronteriza (BGP) | GA | GA | GA | GA |
Puerta de enlace NAT de salida | GA | GA | GA | GA |
Modo IPv4 plano (estático) | GA | GA | GA | GA |
Compatibilidad con IPv6 plana (modo BGP) | GA | GA | GA | GA |
GKE Identity Service v2 | - | - | Vista previa | GA |
Pila doble IPv4/IPv6 | GA | GA | GA | GA |
Compatibilidad con KSA | GA | GA | GA | GA |
Recopilador administrado de Google Cloud Managed Service para Prometheus | GA | GA | GA | GA |
Conectividad de varios clústeres | Vista previa | Vista previa | Vista previa | Vista previa |
Varias NIC para Pods | GA | GA | GA | GA |
Puerta de enlace de red para GDC | Vista previa | Vista previa | Vista previa | Vista previa |
Detector de problemas de nodos | GA | GA | GA | GA |
Actualizaciones de nodos paralelos | GA | GA | GA | GA |
Actualizaciones de grupos de nodos paralelos | Vista previa | GA | GA | GA |
Operador de ajuste de rendimiento | - | Vista previa | Vista previa | Vista previa |
Compatibilidad con registros privados para nodos | - | - | - | Vista previa |
Compatibilidad con la duplicación de registros | GA | GA | GA | GA |
Modo de computación seguro (seccomp) | GA | GA | GA | GA |
Omitir actualización de la versión del grupo de nodos | - | - | Vista previa | GA |
Herramientas de redes de SR-IOV | GA | GA | GA | GA |
Resumen de las métricas de la API | GA | GA | GA | GA |
Controles del servicio de VPC | Vista previa | GA | GA | GA |
Reversión de la actualización del grupo de nodos trabajadores | - | - | - | Vista previa |
Workload Identity | GA | GA | GA | GA |
Modelo de responsabilidad compartida
La ejecución de una aplicación de producción esencial para la empresa en GKE en Bare Metal requiere que varias partes tengan diferentes responsabilidades. Si bien no es una lista exhaustiva, en las siguientes secciones, se enumeran las funciones y responsabilidades.
Responsabilidades de Google
- Mantenimiento y distribución del paquete de software de GKE en Bare Metal.
- Notificar a los usuarios sobre las actualizaciones disponibles para GKE en Bare Metal y producir secuencias de comandos de actualización para la versión anterior; GKE en Bare Metal solo admite actualizaciones secuenciales (ejemplo: 1.2 → 1.3 → 1.4 y no 1.2 → 1.4).
- Operar los servicios de Connect y Cloud Operations.
- Solucionar problemas, brindar soluciones alternativas y corregir la causa raíz de cualquier problema relacionado con los componentes que proporciona Google
Responsabilidades del usuario
- Administrar de forma general el sistema para clústeres locales
- Mantener cualquier carga de trabajo de la aplicación que se implementa en el clúster
- Ejecutar, mantener y aplicar parches a la infraestructura del centro de datos, incluidas las herramientas de redes, los servidores, el sistema operativo, el almacenamiento y la conectividad a Google Cloud
- Ejecutar, mantener y aplicar parches en los balanceadores de cargas de red si se elige la opción de balanceador de cargas manual
- Actualizar GKE en versiones de Bare Metal con regularidad
- Supervisar el clúster y las aplicaciones, y responder a cualquier incidente
- Garantizar que los agentes de Cloud Operations se implementen en los clústeres
- Proporcionar detalles del entorno a Google para solucionar problemas
Asistencia para desarrolladores
Google no proporciona asistencia específica para las cargas de trabajo de tu aplicación. Sin embargo, ofrecemos asistencia para desarrolladores en el mejor esfuerzo con el fin de garantizar que puedan ejecutar aplicaciones en GKE en Bare Metal. Creemos que interactuar temprano durante el desarrollo puede evitar incidentes críticos más adelante en la implementación.
El equipo de Asistencia para Desarrolladores de mejor esfuerzo está disponible para clientes con cualquier paquete de asistencia pago y se trata como una prioridad de P3 si un problema bloquea un lanzamiento o como una prioridad de P4 en el caso de las consultas generales. En esta clasificación, el nivel de prioridad 0 es la prioridad más alta.