El objetivo principal de la asistencia de Google es resolver los incidentes de producción lo más rápido posible. Comprender la configuración, analizar los registros y las métricas, y colaborar con los socios nos ayuda a resolver incidentes con rapidez.
Google Cloud ofrece varios paquetes de asistencia para satisfacer tus necesidades. Todos los Google Cloud paquetes de asistencia incluyen asistencia para la edición Enterprise de Google Kubernetes Engine (GKE) y Google Distributed Cloud. Si tienes un paquete de asistencia deGoogle Cloud existente, ya tienes asistencia para GKE Enterprise y Google Distributed Cloud.
Para obtener más información, consulta la documentación de Atención al cliente de Cloud.
Requisitos para la asistencia de Google Distributed Cloud
Para solucionar de manera eficaz los incidentes críticos de la empresa, debes hacer lo siguiente:
- Verifica que tu entorno sea actual y que esté dentro de los períodos de fin de la asistencia publicados. Consulta la sección Política de asistencia de la versión para obtener más información.
- Habilita Cloud Logging y Cloud Monitoring para los componentes del sistema. Para obtener más información, consulta la siguiente sección Herramientas de asistencia.
Herramientas de asistencia
Para solucionar un incidente de Google Distributed Cloud,la asistencia de Google Cloud se basa en tres datos:
- La configuración del entorno
- Los registros de tus clústeres
- Las métricas de tus clústeres
La configuración del entorno
Cuando abres un caso de ayuda, la ejecución de los siguientes comandos proporciona información clave sobre la configuración de tu clúster.
En todos tus tipos de clústeres, ejecuta el comando
bmctl check cluster --snapshot
para capturar información sobre Kubernetes y tus nodos. Adjunta el archivo tar resultante al caso de asistencia.Para los clústeres independientes, híbridos y de administración, ejecuta el comando
bmctl check cluster
a fin de verificar el estado del clúster y los nodos. Adjunta los registros resultantes al caso de ayuda. Deben existir en el directoriobmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
.Para los clústeres de usuario, primero crea un archivo YAML de verificación de estado con el nombre del clúster y el espacio de nombres y, luego, aplica el archivo en el clúster de administrador correspondiente:
Crea un archivo YAML con las siguientes propiedades de
healthcheck
. El siguiente es un ejemplo del contenido para un clúster llamadouser1
en el espacio de nombrescluster-user1
:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
Después de crear el archivo YAML, aplica el recurso personalizado en el clúster de administrador que administra el clúster de usuarios con el comando
kubectl
. Este es un comando de muestra que usa el archivo YAML creado en el paso anterior. En la muestra, la variableADMIN_KUBECONFIG
especifica la ruta al archivo kubeconfig del clúster de administrador:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
El comando muestra la siguiente respuesta:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
Espera hasta que finalice el trabajo de verificación de estado para comprobar si se ha terminado de validar el trabajo de verificación de estado. En el caso de ejemplo anterior, el nombre del trabajo de verificación de estado es
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
. Esta es una prueba de muestra con el comandokubectl
que espera 30 minutos hasta que se completa el trabajo de verificación de estado:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
Cuando se complete, este comando mostrará lo siguiente:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
Puedes ver los resultados del trabajo de verificación de estado con el siguiente comando:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
El comando muestra el siguiente resultado:
NAME PASS AGE healthcheck-7c4qf true 17m
Recopila todos los registros del Pods del trabajo de verificación de estado en un archivo local con el comando
kubectl
. Este es un ejemplo que usa el trabajo de verificación de estado de muestra anterior:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
Registros del clúster
Cuando creas un nuevo clúster de Google Distributed Cloud, los agentes de Cloud Logging se habilitan de forma predeterminada y tienen permiso para acceder solo a los componentes a nivel del sistema. Esto replica los registros a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Los registros a nivel del sistema provienen de Pods de Kubernetes en los siguientes espacios de nombres:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
Los registros se pueden consultar desde la consola de Cloud Logging.
Para obtener más detalles, consulta Logging y Monitoring.
Google Cloud CLI y acceso a clústeres remotos
Si abres un caso de ayuda, es posible que la Atención al cliente de Cloud te solicite acceso remoto de solo lectura a tus clústeres para diagnosticar y resolver problemas de manera más efectiva. Para que el equipo de asistencia tenga acceso suficiente a fin de solucionar los problemas de tu clúster de forma remota, asegúrate de haber instalado y actualizado la versión más reciente de la Google Cloud CLI. La Google Cloud CLI debe estar en la versión 401.0.0 o una superior para otorgar a la Atención al cliente de Cloud los permisos necesarios. Te recomendamos que actualices Google Cloud CLI de forma periódica para obtener los permisos adicionales y otras mejoras.
Para instalar los componentes más recientes de gcloud CLI, usa el comando gcloud
components update
. Si deseas obtener más información sobre cómo otorgar acceso de solo lectura a tus clústeres a la Atención al cliente de Cloud, consulta Asistencia de Google Cloud para tus clústeres registrados.
Métricas del clúster
Además de los registros, el agente de Cloud Monitoring también captura métricas. Esto replica las métricas a nivel del sistema en el proyecto de Google Cloud asociado con el clúster. Las métricas a nivel de sistema provienen de Pods de Kubernetes que se ejecutan en los mismos espacios de nombres que se enumeran en Registros.
Para obtener más detalles, consulta Logging y Monitoring.
Cómo solucionamos los problemas de tu entorno
A continuación, se muestra un ejemplo de un incidente de asistencia típico:
El administrador del clúster abre un caso de asistencia en la consola de Google Cloud oGoogle Cloud Support Center y selecciona Google Kubernetes Engine (GKE) Enterprise Edition y Google Distributed Cloud como categoría y componente, respectivamente. Ingresa la información requerida y adjunta el resultado de los comandos
bmctl
relevantes al caso.El caso de asistencia se enruta a un ingeniero de asistencia técnica especializado en Google Distributed Cloud.
El ingeniero de asistencia examina el contenido de la instantánea para obtener el contexto del entorno.
El ingeniero de asistencia examina los registros y las métricas del proyecto de Google Cloud. Para ello, ingresa el ID del caso de ayuda como justificación empresarial, que se registra de forma interna.
El ingeniero de asistencia responde al caso con una evaluación y una recomendación. El ingeniero de asistencia y el usuario continúan con la solución de problemas hasta llegar a una solución.
¿Qué hace la Atención al cliente de Google?
Por lo general, el equipo de asistencia al cliente de Cloud admite todos los componentes de software enviados como parte de Google Distributed Cloud y Cloud Service Mesh, Policy Controller, Sincronizador de configuración y Config Controller. Consulta la siguiente tabla para obtener una lista más completa de lo que se admite y lo que no:
Google Cloud compatible | No compatible |
---|---|
Kubernetes y el entorno de ejecución del contenedor | Elección por parte del cliente del balanceador de cargas (balanceo de cargas manual) |
Connect y agente Connect | Código del cliente (consulta Asistencia para programadores) |
Google Cloud Operations, Monitoring, Logging y agentes | Elección por parte del cliente del sistema operativo |
Balanceador de cargas en paquetes | Servidor, almacenamiento y red virtuales o físicos |
Controlador de Ingress | DNS externo, DHCP y sistemas de identidad |
GKE Identity Service | |
Cloud Service Mesh | |
Policy Controller | |
Sincronizador de configuración | |
Config Controller |
Política de asistencia de la versión
La asistencia para Google Distributed Cloud sigue la Política de asistencia de GKE Enterprise. Google admite cada versión secundaria de Google Distributed Cloud durante el siguiente período:
- 12 meses después del lanzamiento inicial de la versión secundaria.
- La versión de la tercera versión secundaria posterior.
Para obtener listas de las versiones compatibles y no compatibles de Google Distributed Cloud, consulta Control de versiones.
Para obtener información sobre las versiones relacionadas con las actualizaciones de clústeres, consulta Reglas de versiones para actualizaciones.
Modelo de responsabilidad compartida
La ejecución de una aplicación de producción fundamental para la empresa en Google Distributed Cloud requiere que varias partes tengan diferentes responsabilidades. Si bien no es una lista exhaustiva, en las siguientes secciones se enumeran los roles y las responsabilidades.
Responsabilidades de Google
- Mantenimiento y distribución del paquete de software de Google Distributed Cloud.
- Notificar a los usuarios sobre las actualizaciones disponibles de Google Distributed Cloud y generar secuencias de comandos de actualización para la versión anterior. Google Distributed Cloud solo admite actualizaciones secuenciales (por ejemplo, 1.2 → 1.3 → 1.4 y no 1.2 → 1.4).
- Operar los servicios de Connect y Cloud Operations.
- Solucionar problemas, brindar soluciones alternativas y corregir la causa raíz de cualquier problema relacionado con los componentes que proporciona Google
Responsabilidades del usuario
- Administrar de forma general el sistema para clústeres locales
- Mantener cualquier carga de trabajo de la aplicación que se implementa en el clúster
- Ejecutar, mantener y aplicar parches en la infraestructura del centro de datos, que incluye redes, servidores, sistemas operativos, almacenamiento y conectividad aGoogle Cloud
- Ejecutar, mantener y aplicar parches en los balanceadores de cargas de red si se elige la opción de balanceador de cargas manual
- Actualizar las versiones de Google Distributed Cloud con regularidad
- Supervisar el clúster y las aplicaciones, y responder a cualquier incidente
- Garantizar que los agentes de Cloud Operations se implementen en los clústeres
- Proporcionar detalles del entorno a Google para solucionar problemas
Asistencia para desarrolladores
Google no proporciona asistencia específica para las cargas de trabajo de tu aplicación. Sin embargo, proporcionamos asistencia para desarrolladores de excelente calidad para garantizar que tus desarrolladores puedan ejecutar aplicaciones en Google Distributed Cloud. Creemos que la interacción temprana durante el desarrollo puede evitar incidentes críticos más adelante en la implementación.
Esta asistencia para desarrolladores de mejor esfuerzo está disponible para los clientes que cuentan con cualquier paquete de asistencia pago y se trata como prioridad P3 si un problema bloquea un lanzamiento o como prioridad P4 para las consultas generales. En esta clasificación, la prioridad 0 es la prioridad más alta.