Estás viendo la documentación de Anthos Service Mesh 1.6. Consulta la documentación más reciente o selecciona otra versión disponible:

Solución de problemas en la Anthos Service Mesh paso a paso

En esta sección, se explica cómo solucionar problemas relacionados con el uso de Anthos Service Mesh. Si necesitas asistencia adicional, consulta Obtén asistencia.

Pasos para la solución de problemas

Sigue estos pasos generales para solucionar los problemas de Anthos Service Mesh de la mejor manera:

  1. Usa las herramientas automatizadas de validación de configuración.
  2. Comprueba si tienes un problema común con una solución conocida.
  3. Limita el alcance del problema.
  4. Revisa la información y los registros relevantes.
  5. Recopila registros de diagnóstico y busca ayuda.

Usa herramientas de validación automatizadas

Anthos Service Mesh incluye herramientas automatizadas de diagnóstico y validación de la configuración que pueden resolver problemas y ayudarte a evitarlos en el futuro. En las siguientes secciones, se explica cómo usar estas herramientas.

istioctl analyze

La herramienta de diagnóstico istioctl analyze puede detectar problemas de configuración comunes. Instala istioctl mediante estas instrucciones.

istioctl analyze lee la configuración del clúster y, si encuentra un problema, proporciona mensajes informativos y sugiere soluciones. Puede ejecutarse en un clúster en vivo o en un conjunto de archivos de configuración local. También puede ejecutarse en una combinación de ambos, lo que te permite encontrar problemas antes de aplicar cambios a un clúster. Para obtener más información, consulta Diagnostica tu configuración con istioctl analyze. Para obtener más información sobre los errores que detecta istioctl analyze, consulta Mensajes de análisis de configuración.

Analiza un clúster en vivo

Analiza un clúster en vivo con el siguiente comando.

istioctl analyze -A

Si istioctl analyze detecta un problema con la configuración, mostrará un mensaje con información útil para resolverlo, si la hay. Por ejemplo, si cometiste el error común de no etiquetar de forma correcta tu espacio de nombres a fin de habilitar la inserción de sidecar de Istio, genera el siguiente mensaje:

Warn [IST0102] (Namespace default) The namespace is not enabled for Istio injection.
Run 'kubectl label namespace default istio-injection=enabled' to enable it,
or 'kubectl label namespace default istio-injection=disabled'
to explicitly mark it as not needing injection

Si el problema persiste, consulta la siguiente sección para verificar si el problema ya es conocido.

Verifica problemas y soluciones comunes

Para ahorrar tiempo, comprueba si tus síntomas coinciden con alguno de los problemas en estas secciones de problemas y soluciones comunes, agrupadas por áreas funcionales de Anthos Service Mesh:

Si esto no resuelve el problema, consulta la siguiente sección.

Limita el alcance del problema

Anthos Service Mesh consta de varias tecnologías que funcionan juntas, lo que significa que ciertos tipos de problemas están asociados con áreas o componentes funcionales en particular. Cada uno de estos componentes genera registros propios útiles. Antes de intentar analizar de forma manual el volumen de la información que proporcionan, puedes responder las siguientes preguntas para limitar el alcance de la solución de problemas:

  • ¿El problema se produce dentro del plano de control o del plano de datos, por ejemplo, en los proxies Istio o Envoy?
  • ¿En qué área funcional experimentas el problema, por ejemplo, en las herramientas de redes, la telemetría, la seguridad, etcétera?
  • ¿Existe una pérdida de tráfico en la malla de servicios o en una implementación específica?
  • ¿El problema aparece o empeora debido a la imposibilidad de escalar tráfico en la malla de servicios?
  • ¿Hay problemas de latencia o de rendimiento?
  • ¿Puedes reproducir el problema a pedido?
  • ¿El problema comenzó después de un cambio de configuración reciente en Istio, GKE, etcétera?
  • ¿Hay un aumento prolongado o repentino en el tráfico dentro de la malla de servicios?
  • ¿Este clúster tiene funciones notables habilitadas o implementaciones que no son típicas?
  • ¿Observas un uso elevado de memoria o CPU? Si es así, ¿cuál es el uso esperado a gran escala?
  • ¿Existen restricciones de cuota para tener en cuenta?

Visualiza el estado del plano de control

Los siguientes comandos pueden brindarte información sobre el estado del plano de control de Anthos Service Mesh:

  • kubectl get pods -n istio-system
  • kubectl describe -n istio-system
  • Para todos los pods de istio-system: kubectl logs -n istio-system -l istio --all-containers
  • istioctl version
  • istioctl proxy-status
  • kubectl get configmap istio -o yaml && kubectl get configmap istio-sidecar-injector -o yaml
  • kubectl top pods -n istio-system

Usa los siguientes comandos para obtener información sobre el escalamiento de la implementación:

  • kubectl get nodes
  • kubectl get services --all-namespaces
  • kubectl get pods --all-namespaces

Revisa la información y los registros relevantes

Después de limitar el alcance del problema, podrás enfocarte en la información y los registros de manera más eficaz. A fin de obtener más información sobre los registros que genera Anthos Service Mesh y cómo interpretar la información que contienen, consulta Interpreta los registros de la Anthos Service Mesh.

Recopila registros de diagnóstico y busca ayuda

Si fallaron otros pasos de solución de problemas, puedes recopilar registros de diagnóstico y obtener ayuda adicional. Usa esta secuencia de comandos para escribir todos los recursos o registros de Istio y Kubernetes del clúster en una carpeta istio-dump. Ten esta carpeta lista cuando te comuniques con el equipo de asistencia según se describe en Obtén asistencia.