Visualiza los registros y las métricas de Vertex AI

Los registros y las métricas te permiten supervisar tus servicios y solucionar problemas relacionados con el rendimiento de los servicios. Puedes ver los registros y las métricas de los servicios de Vertex AI con los recursos de supervisión y registro de Google Distributed Cloud (GDC) aislado. También puedes crear consultas para supervisar métricas específicas de Vertex AI.

En esta página, se describe cómo consultar y ver los registros y las métricas de los servicios de Vertex AI en la instancia de supervisión de Distributed Cloud.

Esta página también contiene consultas de ejemplo que puedes usar para supervisar la plataforma y los servicios de Vertex AI, como el reconocimiento óptico de caracteres (OCR), Speech-to-Text y Vertex AI Translation. Para obtener más información sobre las soluciones de registro y supervisión en Distributed Cloud, consulta Supervisa métricas y registros.

Antes de comenzar

Para obtener los permisos que necesitas para ver los registros y las métricas de Vertex AI, pídele al administrador de IAM del proyecto que te otorgue el rol de visualizador de Grafana del proyecto (project-grafana-viewer) en el espacio de nombres del proyecto.

Para obtener más información sobre este rol, consulta Prepara los permisos de IAM.

Visualiza registros y métricas en paneles

Puedes ver las métricas y los registros de Vertex AI en los paneles. Por ejemplo, puedes crear una consulta para ver cómo Vertex AI afecta el uso de la CPU.

Sigue estos pasos para ver los registros y las métricas de Vertex AI en los paneles:

  1. Accede a la consola de GDC y selecciona tu proyecto.

  2. En el menú de navegación, haz clic en Vertex AI > APIs previamente entrenadas.

  3. En la página APIs previamente entrenadas, asegúrate de que la API de Vertex AI para el servicio que deseas supervisar esté habilitada.

  4. Haz clic en Supervisar servicios en Grafana para abrir la página principal de Grafana.

  5. En el menú de navegación de la página principal, haz clic en Explorar Explorar para abrir la página Explorar.

  6. En el menú de la página Explorar, selecciona una de las siguientes fuentes de datos:

    • Registros operativos: Recupera registros operativos.
    • Registros de auditoría: Recupera registros de auditoría.
    • Prometheus: Recupera métricas.
  7. Si deseas mostrar métricas, ingresa una consulta con expresiones de PromQL (lenguaje de consulta de Prometheus).

  8. Si deseas mostrar registros, ingresa una consulta con expresiones de LogQL (lenguaje de consultas de registros).

En la página, se muestran las métricas o los registros que coinciden con tu búsqueda.

La opción de Prometheus está seleccionada en la página Explorar para obtener métricas.

Figura 1. Opción de menú en Grafana para consultar métricas.

En la figura 1, la opción Prometheus muestra la interfaz que te permite crear consultas para recuperar métricas.

Consultas de muestra

En la siguiente tabla, se incluyen ejemplos de consultas para supervisar la plataforma de Vertex AI en tu entorno:

Vertex AI Platform
Fuente de datos Descripción Componente Consulta
Métricas Porcentaje de uso de CPU del contenedor Operador de nivel 1 rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l1operator"}[30s]) * 100
Operador de nivel 2 rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l2operator"}[30s]) * 100
Uso de memoria del contenedor en MB Operador de nivel 1 container_memory_usage_bytes{namespace="ai-system",container="l1operator"} * 1e-6
Operador de nivel 2 container_memory_usage_bytes{namespace="ai-system",container="l2operator"} * 1e-6
Registros operativos Registros del operador de L1 Operador de nivel 1 {service_name="vai-l1operator"}
Registros del operador de L2 Operador de nivel 2 {service_name="vai-l2operator"}
Registros de auditoría Registros de auditoría del frontend de la plataforma Frontend del complemento web de Vertex AI {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-frontend)
Registros de auditoría del backend de la plataforma Backend del complemento web de Vertex AI {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-backend)

En la siguiente tabla, se incluyen ejemplos de consultas para supervisar los servicios de la API de Vertex AI, como OCR, Speech-to-Text y Vertex AI Translation, en tu entorno:

Servicios de Vertex AI
Fuente de datos Descripción Servicio Consulta
Métricas Es el efecto de una API previamente entrenada en el uso de la CPU
.
OCR rate(container_cpu_usage_seconds_total{namespace="g-vai-ocr-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: vision-extractor | vision-frontend | vision-vms-ocr
Speech‑to‑Text rate(container_cpu_usage_seconds_total{namespace="g-vai-speech-sie",container="CONTAINER_NAME"}[30s]) * 100
Vertex AI Translation rate(container_cpu_usage_seconds_total{namespace="g-vai-translation-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: translation-aligner | translation-frontend | translation-prediction
Usa la etiqueta de filtro destination_service para obtener la tasa de errores de los últimos 60 minutos. OCR rate(istio_requests_total{destination_service=~".*g-vai-ocr-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Speech‑to‑Text rate(istio_requests_total{destination_service=~".*g-vai-speech-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Vertex AI Translation rate(istio_requests_total{destination_service=~".*g-vai-translation-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Registros operativos Registros operativos de los servicios de Vertex AI
OCR {namespace="g-vai-ocr-sie"}
Speech‑to‑Text {namespace="g-vai-speech-sie"}
Vertex AI Translation {namespace="g-vai-translation-sie"}
Registros de auditoría Registros de auditoría de los servicios de Vertex AI OCR {service_name="istio"} |= "vision-frontend-server"
Speech‑to‑Text {service_name="istio"} |= "speech-frontend-server"
Vertex AI Translation {service_name="istio"} |= "translation-frontend-server"