En esta sección, se explican los problemas comunes de Anthos Service Mesh y cómo solucionarlos. Si necesitas asistencia adicional, consulta Obtén asistencia.
Los problemas de límite de recursos de Anthos Service Mesh pueden deberse a alguna de las siguientes causas:
- Objetos
LimitRange
creados en el espacio de nombresistio-system
o cualquier espacio de nombres con la inserción automática de sidecar habilitada - Límites definidos por el usuario que son demasiado bajos
- Nodos que se quedaron sin memoria o sin otros recursos
Posibles síntomas de problemas de recursos:
- Anthos Service Mesh no recibe la configuración de Istiod que indica el error
Envoy proxy NOT ready
. Ver este error algunas veces al inicio es normal, pero, si esto continúa repitiéndose, es un problema. - Hay problemas de Herramientas de redes con algunos Pods o nodos que se vuelven inaccesibles.
istioctl proxy-status
muestra estadosSTALE
en el resultado.- Hay mensajes
OOMKilled
en los registros de un nodo. - Uso de memoria de los contenedores:
kubectl top pod POD_NAME --containers
- Uso de memoria de los Pods dentro de un nodo:
kubectl top node my-node
- Envoy no tiene memoria:
kubectl get pods
muestra el estadoOOMKilled
en el resultado.
Los archivos adicionales de Istio tardan mucho en recibir la configuración
La propagación lenta de la configuración puede ocurrir debido a que los recursos no se asignan a Istiod ni a un tamaño de clúster demasiado grande.
Existen varias soluciones posibles para este problema:
Si tus herramientas de supervisión (Prometheus, Stackdriver, etc.) muestran un alto uso de un recurso por parte de Istio, aumenta la asignación de ese recurso para, por ejemplo, aumentar el límite de CPU o memoria de la implementación de Istiod. Esta es una solución temporal, y te recomendamos que investigues los métodos para reducir el consumo de recursos.
Si encuentras este problema en un clúster o implementación de gran tamaño, configura Recursos de sidecar para reducir la cantidad de estado de configuración que se envía a cada proxy.
Si el problema persiste, prueba el escalamiento horizontal de Istiod.
Si todos los demás para solucionar problemas no lo resuelven, informa un error que detalle tu implementación y los problemas observados. Si es posible, sigue estos pasos para incluir un perfil de CPU y memoria en el informe de errores, junto con una descripción detallada del tamaño del clúster, la cantidad de Pods, la cantidad de servicios, etcétera.