Los clústeres de Anthos en equipos físicos incluyen varias opciones para el registro y la supervisión de clústeres, incluidos los servicios administrados basados en la nube, las herramientas de código abierto y la compatibilidad validada con soluciones comerciales de terceros. En esta página, se explican estas opciones y se proporciona orientación básica sobre cómo seleccionar la solución adecuada para el entorno.
Opciones para clústeres de Anthos en equipos físicos
Tienes varias opciones de registro y supervisión para tus clústeres de Anthos alojados en clústeres de equipos físicos:
- Cloud Logging y Cloud Monitoring, habilitados de forma predeterminada en los componentes del sistema de equipos físicos
- Prometheus y Grafana están disponibles en Cloud Marketplace.
- Opciones de configuración validadas con soluciones de terceros
Cloud Logging y Cloud Monitoring
Google Cloud's operations suite es la solución de observabilidad integrada para Google Cloud. Ofrece una solución de registro completamente administrada, recopilación de métricas, supervisión, paneles y alertas. Cloud Monitoring supervisa clústeres de Anthos alojados en clústeres de equipos físicos de manera similar a los clústeres de GKE basados en la nube.
Los agentes se pueden configurar con dos niveles de registro y supervisión diferentes:
- Solo componentes del sistema (predeterminado)
- Componentes y aplicaciones del sistema
Logging y Monitoring proporcionan una solución ideal si deseas una sola solución de observabilidad potente y fácil de configurar basada en la nube. Recomendamos Logging y Monitoring cuando se ejecutan cargas de trabajo solo en clústeres de Anthos en equipos físicos, o cargas de trabajo de GKE y Anthos en equipos físicos. Para las aplicaciones con componentes que se ejecutan en clústeres de Anthos alojados en equipos físicos y en la infraestructura local tradicional, podrías considerar otras soluciones fin de obtener una vista de extremo a extremo de esas aplicaciones.
Para obtener detalles sobre la arquitectura, la configuración y los datos que se replican en tu proyecto de Google Cloud de forma predeterminada para los clústeres de Anthos en equipos físicos, consulta la sección Cómo funcionan Logging y Monitoring en los clústeres de Anthos alojados en equipos físicos.
Para obtener más información sobre Logging, consulta la documentación de Cloud Logging.
Para obtener más información sobre Monitoring, consulta la documentación de Cloud Monitoring.
Prometheus y Grafana
Prometheus y Grafana son dos productos populares de supervisión de código abierto disponibles en Cloud Marketplace:
Prometheus recopila métricas de aplicaciones y sistemas.
Alertmanager maneja el envío de alertas con varios mecanismos de alerta diferentes.
Grafana es una herramienta de paneles.
Prometheus y Grafana se pueden habilitar en cada clúster de administrador y de usuario. Prometheus y Grafana se recomiendan para equipos de aplicaciones con experiencia previa en esos productos o equipos operativos que prefieren conservar las métricas de la aplicación dentro del clúster y, también, a fin de solucionar los problemas cuando se pierde la conectividad de red.
Soluciones de terceros
Google trabajó con varios proveedores de soluciones de registro y supervisión de terceros para que sus productos funcionen bien con clústeres de Anthos alojados en equipos físicos. Entre estos, se incluyen Datadog, Elastic y Splunk. En el futuro, se agregarán más proveedores validados.
Las siguientes guías de solución están disponibles para usar soluciones de terceros con clústeres de Anthos en equipos físicos:
- Supervisa clústeres de Anthos alojados en equipos físicos con Elastic Stack
- Recopila registros sobre clústeres de Anthos alojados en equipos físicos con Splunk Connect
Cómo funcionan Logging y Monitoring en los clústeres de Anthos alojados en equipos físicos
Cloud Logging y Cloud Monitoring se instalan y se activan en cada clúster cuando creas un nuevo clúster de administrador o de usuario.
Los agentes de Stackdriver incluyen varios componentes en cada clúster:
Operador de Stackdriver (
stackdriver-operator-*
): Administra el ciclo de vida de todos los demás agentes de Stackdriver implementados en el clúster.Recurso personalizado de Stackdriver. Es un recurso que se crea automáticamente como parte de los clústeres de Anthos en el proceso de instalación de equipos físicos.
Agregador de registros de Stackdriver (
stackdriver-log-aggregator-*
): Es un StatefulSet de Fluentd que envía registros a la API de Cloud Logging. Si no se pueden enviar los registros, el agregador de registros almacena en búfer hasta 200 GB de entradas de registro e intenta reenviarlas por hasta 24 horas. Si el búfer se llena o si el agregador de registros no puede acceder a la API de Logging dentro de las 24 horas, los registros se descartarán.Servidor de reenvío de registros de Stackdriver (
stackdriver-log-forwarder-*
): Es un daemonset de Fluentbit que reenvía los registros de cada máquina al agregador de registros de Stackdriver.Recopilador de metadatos de Stackdriver (
stackdriver-metadata-agent-
): Es una implementación que envía metadatos de recursos de Kubernetes, como pods, implementaciones o nodos, a la API de metadatos de recursos de Stackdriver. Estos datos se usan para enriquecer las consultas de métricas, ya que te permite realizar consultas por nombre de implementación, de nodo o incluso de servicio de Kubernetes.
Puedes ver todos los agentes que instaló Stackdriver mediante la ejecución del siguiente comando:
kubectl -n kube-system get pods | grep stackdriver
El resultado de este comando es similar al siguiente:
stackdriver-log-aggregator-0 1/1 Running 0 4h31m stackdriver-log-aggregator-1 1/1 Running 0 4h28m stackdriver-log-forwarder-bpf8g 1/1 Running 0 4h31m stackdriver-log-forwarder-cht4m 1/1 Running 0 4h31m stackdriver-log-forwarder-fth5s 1/1 Running 0 4h31m stackdriver-log-forwarder-kw4j2 1/1 Running 0 4h29m stackdriver-metadata-agent-cluster-level... 1/1 Running 0 4h31m stackdriver-operator-76ddb64d57-4tcj9 1/1 Running 0 4h37m
Métricas de Cloud Monitoring
Para obtener una lista de las métricas que recopila Cloud Monitoring, consulta métricas de Anthos On-Prem y Anthos en equipos físicos.
Configura agentes de Stackdriver para clústeres de Anthos alojados en equipos físicos
Los agentes de Stackdriver instalados con clústeres de Anthos en equipos físicos recopilan datos sobre los componentes del sistema, sujetos a la configuración, con el fin de mantener los clústeres de Anthos y solucionar problemas en clústeres de equipos físicos, en uno de los siguientes modos.
Solo componentes del sistema (modo predeterminado)
Después de la instalación, los agentes de Stackdriver se configuran de forma predeterminada para recopilar registros y métricas, incluidos los detalles de rendimiento (por ejemplo, el uso de CPU y memoria) y los metadatos similares, para los componentes del sistema que proporciona Google. Estas incluyen todas las cargas de trabajo del clúster de administrador y, para los clústeres de usuario, las cargas de trabajo de los espacios de nombres kube-system, gke-system, gke-connect, istio-system y config-management-system.
Stackdriver inhabilitado
Los agentes de Stackdriver se pueden inhabilitar por completo mediante la eliminación del recurso personalizado de Stackdriver. Precaución: No recomendamos que administres directamente los recursos personalizados de Stackdriver.
Antes de inhabilitar Stackdriver, consulta la página de asistencia para obtener detalles sobre cómo esto afecta a los ANS de Google Cloud Support.
Para inhabilitar los clústeres de Anthos para Stackdriver en un equipo físico, haz lo siguiente:
kubectl -n kube-system delete stackdrivers stackdriver
Los agentes de Stackdriver capturan datos almacenados de forma local, que están sujetos a la configuración de almacenamiento y retención. Los datos se replican en el proyecto de Google Cloud especificado en la instalación mediante una cuenta de servicio autorizada para escribir datos en ese proyecto. Los agentes de Stackdriver se pueden inhabilitar en cualquier momento, como se describió antes. Los datos que recopilan los agentes de Stackdriver se pueden administrar y borrar como cualquier métrica o dato de registro, como se describe en la Documentación de Cloud Monitoring.
Requisitos de configuración para Logging y Monitoring
Hay varios requisitos de configuración para habilitar Cloud Logging y Cloud Monitoring con clústeres de Anthos en equipos físicos. Estos pasos se incluyen en Configura una cuenta de servicio para usar con Logging y Monitoring en la página Habilita servicios de Google y en la siguiente lista:
- Se debe crear un lugar de trabajo de Cloud Monitoring dentro del proyecto de Google Cloud. Para ello, haz clic en Monitoring en la consola de Google Cloud y sigue el flujo de trabajo.
Debes habilitar las siguientes API de Stackdriver:
Debes asignar las siguientes funciones de IAM a la cuenta de servicio que usan los agentes de Stackdriver:
logging.logWriter
monitoring.metricWriter
stackdriver.resourceMetadata.writer
monitoring.dashboardEditor
Precios
No se aplican cargos por los registros y las métricas del sistema de Anthos.
En un clúster de Anthos alojado en un clúster de equipo físico, los registros y las métricas del sistema Anthos incluyen lo siguiente:
- Registros y métricas de todos los componentes en un clúster de administrador
- Registros y métricas de los componentes de estos espacios de nombres en un clúster de usuario:
kube-system
,gke-system
,gke-connect
,knative-serving
,istio-system
,monitoring-system
,config-management-system
,gatekeeper-system
,cnrm-system
Para obtener más información, consulta Precios de Google Cloud's operations suite.
Si quieres obtener información sobre los créditos de las métricas de Cloud Logging, comunícate con Ventas para obtener información sobre los precios.