En este documento se describen las fuentes de información de diagnóstico que puede usar para identificar problemas en la instalación o la ejecución del agente de Ops.
Verificar el estado del agente con gcpdiag
Puedes usar gcpdiag para generar informes sobre el estado del agente de Ops en máquinas virtuales concretas o en toda la flota de máquinas virtuales de tu proyecto. De esta forma, puedes confirmar que el agente está instalado y que envía registros y métricas de forma activa. gcpdiag puede crear informes de estado en varios formatos, como CSV o JSON.
A continuación, se muestra un informe del estado de los agentes de toda la flota en formato CSV:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
La herramienta gcpdiag se ha creado para ayudarte a autodiagnosticar problemas habituales en tu proyecto de Google Cloud , incluidos los problemas con el agente de operaciones. gcpdiag es una herramienta de código abierto, no un producto oficial de Google Cloud, pero el equipo de Asistencia de Google Cloud la desarrolla y mantiene activamente. Google Cloud Contribuye o informa de problemas en GitHub.
Antes de empezar
gcpdiag está integrado con Cloud Shell, por lo que puedes ejecutarlo sin necesidad de instalar nada. Para ejecutar gcpdiag, primero debes cumplir los siguientes requisitos:
Autorización: gcpdiag usa las credenciales de aplicación predeterminadas (ADC) en Cloud Shell para autenticar.
Asegúrate de que las credenciales usadas con gcpdiag tengan al menos los siguientes roles en el Google Cloud proyecto en el que se ejecuta el agente de operaciones:- Lector (
roles/viewer
) - Consumidor del uso del servicio (
roles/serviceusage.serviceUsageConsumer
)
- Lector (
APIs: para usar gcpdiag en un proyecto, deben habilitarse las siguientes APIs:
- API Cloud Resource Manager:
cloudresourcemanager.googleapis.com
- API de gestión de identidades y accesos:
iam.googleapis.com
- API de Cloud Logging:
logging.googleapis.com
- Uso del servicio:
serviceusage.googleapis.com
Para habilitar estas APIs, ejecuta el siguiente comando en Cloud Shell u otra línea de comandos:
gcloud --project=PROJECT_ID services enable \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ logging.googleapis.com \ serviceusage.googleapis.com
- API Cloud Resource Manager:
Gestor de VMs: habilita Gestor de VMs en el nivel gratuito de tu instancia. Si has instalado el Agente de operaciones durante la creación de la VM o si una política de agente gestiona la instalación del Agente de operaciones en tus instancias de VM, ya cumples los requisitos de VM Manager.
Ejecutar gcpdiag
El comando gcpdiag
para usar con el agente de Ops
tiene la siguiente sintaxis básica:
gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
- PROJECT_ID es el ID de tu Google Cloud proyecto.
- INSTANCE_NAME es el nombre de tu máquina virtual de Compute Engine.
Usa la opción
--name
para consultar una VM específica. Omite la opción para consultar toda la flota. - Usa la opción
--output
para guardar el informe en un archivo con formato CSV o JSON. Omite la opción si no quieres que se genere ningún archivo de salida.
El valor de la opción --include
especifica una o varias reglas de gcpdiag. gce/ERR/2024-004
es la regla del agente de Ops.
Para obtener más información sobre la sintaxis del comando gcpdiag, consulta gcpdiag - Diagnostics for Google Cloud Platform.
Por ejemplo, para generar un informe de toda la flota del proyecto "my-project", ejecuta el siguiente comando:
gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004
La salida es similar a la siguiente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/instance-1 [FAIL] Ops Agent not installed on the VM
- my-project/instance-2 [FAIL] Ops Agent not installed on the VM
- my-project/instance-3 [SKIP] Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
- my-project/instance-4 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
- my-project/instance-5 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (No) Is Ops Agent sending metrics? (No)
- my-project/instance-6 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
- my-project/instance-7 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Para generar un informe de la instancia "my-instance" del proyecto "my-project", ejecuta el siguiente comando:
gcpdiag lint --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004
La salida es similar a la siguiente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/my-instance [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Si el comando gcpdiag
falla y la salida es similar a la siguiente, comprueba que cumples todos los requisitos para ejecutar la herramienta.
WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get
HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details
Interpretar la salida de gcpdiag
En esta sección se proporciona información para ayudarte a entender y usar los informes generados por gcpdiag.
El comando gcpdiag genera informes que contienen la siguiente información:
- Un indicador de la regla de gcpdiag con la que se ha invocado el comando.
En el caso del agente de operaciones, esta información tiene el siguiente aspecto:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
- Identificador del resultado de una VM específica con el formato PROJECT_ID/INSTANCE_ID. En el caso de un informe de toda la flota, la salida contiene una entrada por cada VM. En el caso de los informes de una sola máquina virtual, el resultado contiene una sola entrada.
- El estado de la comprobación. El estado tiene uno de los siguientes valores:
- Descripción del valor del estado.
En las siguientes secciones se ofrece más información sobre los valores de estado y su significado.
Estado: OK
El estado OK
significa que el agente de operaciones se está ejecutando en la máquina virtual y envía tanto registros como métricas de la máquina virtual. El informe incluye la siguiente descripción del estado:
Ops Agent installed on the VM, and is successfully sending logs and metrics.
Estado: FAIL
El estado FAIL
significa que el agente de operaciones no está instalado o que no envía registros ni métricas desde la VM. La descripción del estado
indica qué problema se ha detectado:
- Si el agente de operaciones no está instalado, verás la siguiente descripción del estado:
Ops Agent not installed on the VM
- Si el agente de operaciones no envía registros y métricas desde la VM, verá una descripción del estado como la siguiente:
Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
Si el Agente de operaciones no está instalado, instálalo. Si la instalación falla, puede deberse a uno de los siguientes problemas:
- La VM no tiene ninguna cuenta de servicio asociada. Para solucionar este problema, vincula una cuenta de servicio a la VM y, a continuación, intenta instalar el agente de Ops de nuevo.
- La VM ya tiene instalado uno de los agentes antiguos (el agente de Monitoring o el agente de Logging). Para solucionar este problema, desinstala los agentes antiguos y, a continuación, intenta instalar el agente de operaciones de nuevo.
Si el agente de operaciones no envía registros ni métricas desde la VM, usa las comprobaciones del estado del agente para determinar y corregir los errores de hora de inicio.
Estado: SKIP
El estado SKIP
significa que gcpdiag no ha podido determinar si el agente de operaciones está instalado en la VM. El informe incluye la siguiente descripción del estado:
Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection.
Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
Para probar el estado del agente, gcpdiag necesita que VM Manager se esté ejecutando en tu VM. Para solucionar este problema, instala el nivel gratuito de VM Manager en tu instancia. Después de instalarlo, espera 15 minutos y vuelve a ejecutar el comando gcpdiag
.
Comprobaciones del estado del agente
La versión 2.25.1 introdujo comprobaciones del estado de inicio para el agente de operaciones. Cuando se inicia el agente de operaciones, realiza una serie de comprobaciones de las condiciones que impiden que el agente se ejecute correctamente. Si el agente detecta una de las condiciones, registra un mensaje que describe el problema. El agente de operaciones comprueba lo siguiente:
- Problemas de conectividad
- Disponibilidad de los puertos que usa el agente para informar sobre sus propias métricas
- Problemas con los permisos
- Disponibilidad de las APIs que usa el agente para escribir registros o métricas
- Un problema en la propia rutina de comprobación del estado.
La versión 2.37.0 introdujo comprobaciones del estado en tiempo de ejecución para el agente de operaciones. Estos errores se notifican a Cloud Logging y Error Reporting. Para obtener información sobre cómo localizar errores de tiempo de ejecución, consulta Buscar errores de tiempo de ejecución.
En la versión 2.46.0 se introdujo el código informativo LogPingOpsAgent
. Este código no representa un error.
Para obtener más información, consulta
Verificar que se han recogido los registros correctamente.
En la siguiente tabla se enumeran los códigos de comprobación de estado por orden alfabético y se describe el significado de cada uno. Los códigos que terminan con la cadena
Err
indican errores, mientras que los demás son informativos.
Código de comprobación del estado | Categoría | Significado | Sugerencia |
---|---|---|---|
DLApiConnErr
|
Conectividad |
La solicitud al subdominio de descargas, dl.google.com , ha fallado.
|
Comprueba tu conexión a Internet y las reglas del cortafuegos. Para obtener más información, consulta la sección sobre problemas de conectividad de red. |
FbMetricsPortErr
|
Disponibilidad de puertos | El puerto 20202, necesario para las métricas automáticas del agente de Ops, no está disponible. | Verifica que el puerto 20202 esté abierto. Para obtener más información, consulta la sección El puerto obligatorio no está disponible. |
HcFailureErr
|
Generic | La rutina de comprobación del estado del agente de Ops ha detectado un error interno. | Envía un caso de asistencia desde la Google Cloud consola. Para obtener más información, consulta el artículo Obtener asistencia. |
LogApiConnErr
|
Conectividad | No se ha podido completar la solicitud a la API Logging. | Comprueba tu conexión a Internet y las reglas del cortafuegos. Para obtener más información, consulta la sección sobre problemas de conectividad de red. |
LogApiDisabledErr
|
API | La API Logging está inhabilitada en el proyecto Google Cloud . | Habilita la API Logging. |
LogApiPermissionErr
|
Permiso |
A la cuenta de servicio le falta el rol Escritor de registros
(roles/logging.logWriter ).
|
Asigna el rol Escritor de registros a la cuenta de servicio. Para obtener más información, consulta El agente no tiene permisos de API. |
LogApiScopeErr
|
Permiso | A la VM le falta el permiso de acceso https://www.googleapis.com/auth/logging.write. | Añade el permiso https://www.googleapis.com/auth/logging.write a la VM. Para obtener más información, consulta Verificar tus ámbitos de acceso. |
LogApiUnauthenticatedErr
|
API | La VM actual no ha podido autenticarse en la API Logging. | Comprueba que los archivos de credenciales, los ámbitos de acceso de la VM y los permisos estén configurados correctamente. Para obtener más información, consulta Autorizar el agente de Ops. |
LogPingOpsAgent
|
Un mensaje de carga útil informativo que se escribe cada 10 minutos en el registro ops-agent-health . Puedes usar las entradas de registro resultantes para verificar que el agente está enviando registros. Este mensaje no es un error.
|
Este mensaje debería aparecer cada 10 minutos. Si el mensaje no aparece en un plazo de 20 minutos o más, es posible que el agente haya tenido algún problema. Para obtener información sobre cómo solucionar problemas, consulta el artículo Solucionar problemas con el agente de operaciones. | |
LogParseErr
|
Tiempo de ejecución | Ops Agent no ha podido analizar uno o varios registros. | Comprueba la configuración de los procesadores de registro que hayas creado. Para obtener más información, consulta Errores de análisis de registros. |
LogPipeLineErr
|
Tiempo de ejecución | Se ha producido un error en la canalización de registro del agente de Ops. | Verifica que el agente tenga acceso a los archivos de búfer. Comprueba si el disco está lleno y que la configuración del agente de operaciones es correcta. Para obtener más información, consulta la sección Errores de la canalización. |
MetaApiConnErr
|
Conectividad | No se ha podido completar la solicitud al servidor de metadatos de GCE para consultar los ámbitos de acceso de la VM, los tokens de OAuth y las etiquetas de recursos. | Comprueba tu conexión a Internet y las reglas del cortafuegos. Para obtener más información, consulta la sección sobre problemas de conectividad de red. |
MonApiConnErr
|
Conectividad | No se ha podido completar una solicitud a la API Monitoring. | Comprueba tu conexión a Internet y las reglas del cortafuegos. Para obtener más información, consulta la sección sobre problemas de conectividad de red. |
MonApiDisabledErr
|
API | La API Monitoring está inhabilitada en el proyecto Google Cloud . | Habilita la API Monitoring. |
MonApiPermissionErr
|
Permiso |
Falta el rol Editor de métricas de monitorización en la cuenta de servicio (roles/monitoring.metricWriter ).
|
Asigna el rol Escritor de métricas de Monitoring a la cuenta de servicio. Para obtener más información, consulta El agente no tiene permisos de API. |
MonApiScopeErr
|
Permiso | A la VM le falta el permiso de acceso https://www.googleapis.com/auth/monitoring.write. | Añade el permiso https://www.googleapis.com/auth/monitoring.write a la VM. Para obtener más información, consulta Verificar tus ámbitos de acceso. |
MonApiUnauthenticatedErr
|
API | La VM actual no ha podido autenticarse en la API Monitoring. | Comprueba que los archivos de credenciales, los ámbitos de acceso de la VM y los permisos estén configurados correctamente. Para obtener más información, consulta Autorizar el agente de Ops. |
OtelMetricsPortErr
|
Disponibilidad de puertos | El puerto 20201, necesario para las métricas automáticas del agente de operaciones, no está disponible. | Verifica que el puerto 20201 esté abierto. Para obtener más información, consulta la sección Un puerto obligatorio no está disponible. |
PacApiConnErr
|
Conectividad | Este código de comprobación del estado no es fiable. Este código está inhabilitado en la versión 2.46.1 del agente de operaciones. | Actualiza a la versión 2.46.1 del agente de operaciones o a una posterior. |
Buscar errores de hora de inicio
A partir de la versión 2.35.0, la API Cloud Logging escribe información sobre el estado en el registro ops-agent-health
(las versiones 2.33.0 y 2.34.0 usan ops-agent-health-checks
). La misma información también se escribe en un archivo health-checks.log
de la siguiente manera:
- Linux
/var/log/google-cloud-ops-agent/health-checks.log
- Windows:
C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log
También puedes ver los mensajes de comprobación del estado consultando el estado del servicio del agente de Ops de la siguiente manera:
- En Linux, ejecuta el siguiente comando:
sudo systemctl status google-cloud-ops-agent"*"
Busca mensajes como "[Ports Check] Result: PASS". Otros resultados son "ERROR" y "FAIL".
- En Windows, usa el Visor de eventos de Windows. Busca mensajes de
"Information" (Información), "Error" (Error) o "Failure" (Fallo)
asociados al servicio
google-cloud-ops-agent
.
Una vez que hayas resuelto los problemas, debes reiniciar el agente. Las comprobaciones de estado se ejecutan cuando se inicia el agente, por lo que, para volver a ejecutar las comprobaciones, debes reiniciar el agente.
Buscar errores del entorno de ejecución
Los comprobaciones de estado del tiempo de ejecución se registran en Cloud Logging y Error Reporting. Si el agente no se ha podido iniciar, pero ha podido informar de errores antes de fallar, también es posible que se hayan notificado errores de hora de inicio.
Para ver los errores de tiempo de ejecución del agente de Ops en Logging, haga lo siguiente:
-
En la Google Cloud consola, ve a la página Explorador de registros:
Ve al Explorador de registros.
Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuya sección sea Registro.
- Introduce la siguiente consulta y haz clic en Ejecutar consulta:
log_id("ops-agent-health")
Para ver los errores de tiempo de ejecución del agente de Ops en Error Reporting, haga lo siguiente:
-
En la Google Cloud consola, ve a la página Error Reporting:
También puedes encontrar esta página mediante la barra de búsqueda.
- Para ver los errores del agente de operaciones, filtre los errores por
Ops Agent
.
Verificar que los registros se han recogido correctamente
La versión 2.46.0 del agente de operaciones introdujo la comprobación del estado informativa LogPingOpsAgent
. Esta comprobación escribe un mensaje informativo en ops-agent-health
cada 10 minutos.
Puedes usar la presencia de estos mensajes para verificar que el agente de Ops escribe registros. Para ello, haz lo siguiente:
- Busca en los registros de una VM específica los mensajes de ping con el Explorador de registros.
- Comprueba el valor de la métrica
log_entry_count
de una VM específica con el explorador de métricas. - Crea una política de alertas para recibir una notificación si una VM específica no actualiza la métrica
log_entry_count
.
Si alguna de estas opciones indica que los mensajes de registro no se están ingiriendo, puedes hacer lo siguiente:
- Comprueba si hay códigos de error que indiquen errores de inicio o errores de tiempo de ejecución.
- Determina si el agente de operaciones está en funcionamiento.
- Ejecuta la secuencia de comandos de diagnóstico del agente.
Para comprobar el estado del agente de operaciones en una máquina virtual específica, necesitas el ID de instancia de la máquina virtual. Para encontrar el ID de instancia, sigue estos pasos:
-
En la Google Cloud consola, ve a la página Instancias de VM:
Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo sea Compute Engine.
- Haz clic en el nombre de una instancia de VM.
- En la pestaña Detalles, busca la sección Información básica. El ID de instancia aparece como una cadena numérica. Usa esta cadena para el valor INSTANCE_ID en las secciones siguientes.
Herramienta de diagnóstico de agentes para máquinas virtuales
La herramienta de diagnóstico de agentes recoge información de depuración local crítica de tus VMs para los siguientes agentes: Ops Agent, agente de registro antiguo y agente de monitorización antiguo. La información de depuración incluye datos como la información del proyecto, la información de la máquina virtual, la configuración del agente, los registros del agente, el estado del servicio del agente y la información que normalmente requiere trabajo manual para recopilarse. La herramienta también comprueba el entorno de la máquina virtual local para asegurarse de que cumple ciertos requisitos para que los agentes funcionen correctamente, como la conectividad de red y los permisos necesarios.
Cuando registres un caso de un cliente para un agente en una VM, ejecuta la herramienta de diagnóstico del agente y adjunta la información recogida al caso. Si nos proporciona esta información, se reducirá el tiempo necesario para solucionar su caso de asistencia. Antes de adjuntar la información al caso de asistencia,oculta cualquier información sensible, como contraseñas.
La herramienta de diagnóstico del agente debe ejecutarse desde la máquina virtual, por lo que normalmente tendrás que conectarte a la máquina virtual mediante SSH. El siguiente comando obtiene la herramienta de diagnóstico del agente y la ejecuta:
Linux
curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh
Windows
(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"
Sigue el resultado de la ejecución de la secuencia de comandos para localizar los archivos que incluyen la información recogida. Normalmente, puedes encontrarlos en el directorio /var/tmp/google-agents
en Linux y en el directorio $env:LOCALAPPDATA/Temp
en Windows, a menos que hayas personalizado el directorio de salida al ejecutar la secuencia de comandos.
Para obtener información detallada, consulta la secuencia de comandos diagnose-agents.sh
en Linux o la secuencia de comandos diagnose-agents.ps1
en Windows.
Herramienta de diagnóstico de agentes para políticas de instalación automática
Si se produce un error al intentar instalar el agente de Ops mediante una política de SO del agente de Ops, puedes usar la secuencia de comandos de diagnóstico que se describe en esta sección para depurar el problema. Por ejemplo, puede que se dé uno de los siguientes casos:
- La instalación del agente de operaciones falla cuando se ha usado la casilla Instalar el agente de operaciones para Monitoring y Logging para instalar el agente de operaciones durante la creación de la VM.
El estado del agente en el panel de control Instancias de VM de Cloud Monitoring o en la pestaña Observabilidad de la página de detalles de una VM de Compute Engine permanece en el estado Pendiente durante más de 10 minutos. Si el estado Pendiente se prolonga, puede deberse a uno de los siguientes motivos:
- Se ha producido un problema al aplicar la política.
- Un problema en la instalación del Agente de operaciones.
- Un problema de conectividad entre la VM y Cloud Monitoring.
En algunos de estos casos, también pueden ser útiles el script de diagnóstico del agente y las comprobaciones del estado.
Para ejecutar la secuencia de comandos policy-diagnostics, ejecuta los siguientes comandos:
curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh bash diagnose-ui-policies.sh VM_NAME VM_ZONE
Esta secuencia de comandos muestra información sobre las máquinas virtuales afectadas y las políticas de instalación automática relacionadas.
Cuando registres un caso de un cliente para un agente en una VM, ejecuta las herramientas de diagnóstico del agente y adjunta la información recogida al caso. Si nos proporciona esta información, se reducirá el tiempo necesario para solucionar su caso de asistencia. Antes de adjuntar la información al caso de asistencia,oculta cualquier información sensible, como contraseñas.
Registros automáticos del agente
Si el agente no puede ingerir registros en Cloud Logging, puede que tengas que inspeccionar los registros del agente de forma local en la VM para solucionar el problema. También puedes usar la rotación de registros para gestionar los registros automáticos del agente.
Linux
sigue estos pasos.Para inspeccionar los registros automáticos que se escriben en Journald
, ejecuta el siguiente comando:
journalctl -u google-cloud-ops-agent*
Para inspeccionar los registros automáticos que escribe en el disco el módulo de registro, ejecuta el siguiente comando:
vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log
Windows
Para inspeccionar los registros propios que se escriben en Windows Event Logs
, ejecuta el siguiente comando:
Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap
Para inspeccionar los registros automáticos que escribe en el disco el módulo de registro, ejecuta el siguiente comando:
notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"
Para inspeccionar los registros de Windows Service Control Manager
de los servicios de Ops Agent, ejecuta el siguiente comando::
Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap
Ver el uso de las métricas y los diagnósticos en Cloud Monitoring
La página Gestión de métricas de Cloud Monitoring proporciona información que puede ayudarte a controlar el importe que gastas en métricas facturables sin que esto afecte a la observabilidad. En la página Gestión de métricas se muestra la siguiente información:
- Volúmenes de ingesta para la facturación basada en bytes y en muestras, en todos los dominios de métricas y para métricas concretas.
- Datos sobre las etiquetas y la cardinalidad de las métricas.
- Número de lecturas de cada métrica.
- Uso de métricas en políticas de alertas y paneles de control personalizados.
- Tasa de errores de escritura de métricas.
También puede usar la página Gestión de métricas para excluir las métricas que no necesite y, de esta forma, no incurrir en los costes de ingesta.
Para ver la página Gestión de métricas, haz lo siguiente:
-
En la Google Cloud consola, ve a la página
Gestión de métricas:Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuya sección sea Monitorización.
- En la barra de herramientas, selecciona el periodo que quieras. De forma predeterminada, la página Gestión de métricas muestra información sobre las métricas recogidas en el día anterior.
Para obtener más información sobre la página Gestión de métricas, consulta el artículo Ver y gestionar el uso de métricas.