Solución de problemas en la Anthos Service Mesh paso a paso
En esta sección, se explica cómo solucionar problemas relacionados con el uso de Anthos Service Mesh. Si necesitas asistencia adicional, consulta Obtén asistencia.
Pasos para solucionar problemas
Sigue estos pasos generales para solucionar los problemas de Anthos Service Mesh:
- Usa las herramientas automatizadas de validación de configuración.
- Comprueba si tienes un problema común con una solución conocida.
- Limita el alcance del problema.
- Revisa la información y los registros relevantes.
- Recopila registros de diagnóstico y busca ayuda.
Usa herramientas de validación automatizadas
Anthos Service Mesh incluye herramientas automatizadas de diagnóstico y validación de la configuración que pueden resolver problemas y ayudarte a evitarlos en el futuro. En las siguientes secciones, se explica cómo usar estas herramientas.
istioctl analyze
La herramienta de diagnóstico istioctl analyze
puede detectar problemas de configuración comunes.
Instala istioctl
mediante estas instructions.
istioctl analyze
lee la configuración del clúster y, si encuentra un problema, proporciona mensajes informativos y sugiere soluciones. Puede ejecutarse en un clúster en vivo o en un conjunto de archivos de configuración local. También puede ejecutarse en una combinación de ambos, lo que te permite encontrar problemas antes de aplicar cambios a un clúster. Para obtener más información, consulta Diagnostica tu configuración con istioctl analyze
.
Para obtener más información sobre los errores que detecta istioctl analyze
, consulta Mensajes de análisis de configuración.
Analiza un clúster en vivo
Analiza un clúster en vivo con el siguiente comando.
istioctl analyze -A
Si istioctl analyze
detecta un problema con la configuración, mostrará un mensaje con información útil para resolverlo, si la hay. Por ejemplo, si cometiste el error común de no etiquetar de forma correcta tu espacio de nombres a fin de habilitar la inserción de sidecar de Istio, genera el siguiente mensaje:
Warn [IST0102] (Namespace default) The namespace is not enabled for Istio injection. Run 'kubectl label namespace default istio-injection=enabled' to enable it, or 'kubectl label namespace default istio-injection=disabled' to explicitly mark it as not needing injection
Si el problema persiste, consulta la siguiente sección para verificar si el problema ya es conocido.
Verifica problemas y soluciones comunes
Para ahorrar tiempo, comprueba si tus síntomas coinciden con alguno de los problemas en estas secciones de problemas y soluciones comunes, agrupadas por áreas funcionales de Anthos Service Mesh:
- Problemas de instalación
- Problemas del plano de control administrado
- Problemas de observabilidad
- Problemas de implementación fuera de Google Cloud
- Problemas de proxy
- Problemas de recursos
- Problemas de escalamiento
- Problemas de seguridad
- Problemas con la administración del tráfico
- Problemas de webhook
- Problemas con los proxies de sidecar
Si esto no resuelve el problema, consulta la siguiente sección.
Limita el alcance del problema
Anthos Service Mesh consta de varias tecnologías que funcionan juntas, lo que significa que ciertos tipos de problemas están asociados con áreas o componentes funcionales en particular. Cada uno de estos componentes genera registros propios útiles. Antes de intentar analizar de forma manual el volumen de la información que proporcionan, puedes responder las siguientes preguntas para limitar el alcance de la solución de problemas:
- ¿El problema se produce dentro del plano de control o del plano de datos, por ejemplo, en los proxies
istiod
o Envoy? - ¿En qué área funcional experimentas el problema, por ejemplo, en las herramientas de redes, la telemetría, la seguridad, etcétera?
- ¿Existe una pérdida de tráfico en la malla de servicios o en una implementación específica?
- ¿El problema aparece o empeora debido a la imposibilidad de escalar tráfico en la malla de servicios?
- ¿Hay problemas de latencia o de rendimiento?
- ¿Puedes reproducir el problema a pedido?
- ¿El problema comenzó después de un cambio de configuración reciente en Istio, GKE, etcétera?
- ¿Hay un aumento prolongado o repentino en el tráfico dentro de la malla de servicios?
- ¿Este clúster tiene funciones notables habilitadas o implementaciones que no son típicas?
- ¿Observas un uso elevado de memoria o CPU? Si es así, ¿cuál es el uso esperado a gran escala?
- ¿Existen restricciones de cuota para tener en cuenta?
Visualiza el estado del plano de control
Los siguientes comandos pueden brindarte información sobre el estado del plano de control de Anthos Service Mesh:
kubectl get pods -n istio-system
kubectl describe -n istio-system
- Para todos los pods de istio-system:
kubectl logs -n istio-system -l istio --all-containers
istioctl version
istioctl proxy-status
kubectl get configmap istio -o yaml && kubectl get configmap istio-sidecar-injector -o yaml
kubectl top pods -n istio-system
Usa los siguientes comandos para obtener información sobre el escalamiento de la implementación:
kubectl get nodes
kubectl get services --all-namespaces
kubectl get pods --all-namespaces
Revisa la información y los registros relevantes
Después de limitar el alcance del problema, podrás enfocarte en la información y los registros de manera más eficaz. A fin de obtener más información sobre los registros que genera Anthos Service Mesh y cómo interpretar la información que contienen, consulta Interpreta los registros de la Anthos Service Mesh.