Veja registos e métricas do Vertex AI

Os registos e as métricas permitem-lhe monitorizar os seus serviços e resolver problemas com o desempenho dos serviços. Pode ver registos e métricas dos serviços do Vertex AI através dos recursos de monitorização e registo do Google Distributed Cloud (GDC) isolado. Também pode criar consultas para monitorizar métricas específicas do Vertex AI.

Esta página descreve como consultar e ver registos e métricas dos serviços da Vertex AI no a instância de monitorização do Distributed Cloud.

Esta página também contém exemplos de consultas que pode usar para monitorizar a plataforma e os serviços da Vertex AI, como o reconhecimento ótico de carateres (OCR), a conversão de voz em texto e a Vertex AI Translation. Para mais informações sobre soluções de registo e monitorização no Distributed Cloud, consulte o artigo Monitorize métricas e registos.

Antes de começar

Para receber as autorizações necessárias para ver registos e métricas do Vertex AI, peça ao administrador de IAM do projeto que lhe conceda a função de leitor do Grafana do projeto (project-grafana-viewer) no seu espaço de nomes do projeto.

Para mais informações sobre esta função, consulte o artigo Prepare as autorizações de IAM.

Visualize registos e métricas em painéis de controlo

Pode ver as métricas e os registos da Vertex AI em painéis de controlo. Por exemplo, pode criar uma consulta para ver como a Vertex AI afeta a utilização da CPU.

Siga estes passos para ver os registos e as métricas da Vertex AI em painéis de controlo:

  1. Inicie sessão na consola do GDC e selecione o seu projeto.

  2. No menu de navegação, clique em Vertex AI > APIs pré-treinadas.

  3. Na página APIs pré-treinadas, certifique-se de que a API Vertex AI para o serviço que quer monitorizar está ativada.

  4. Clique em Monitorizar serviços no Grafana para abrir a página inicial do Grafana.

  5. No menu de navegação da página inicial, clique em explorar Explorar para abrir a página Explorar.

  6. No menu da página Explorar, selecione uma das seguintes origens de dados:

    • Registos operacionais: obtenha registos operacionais.
    • Registos de auditoria: obtenha registos de auditoria.
    • Prometheus: obtenha métricas.
  7. Se quiser apresentar métricas, introduza uma consulta com expressões PromQL (Prometheus Query Language).

  8. Se quiser apresentar registos, introduza uma consulta com expressões LogQL (linguagem de consulta de registos).

A página apresenta as métricas ou os registos que correspondem à sua consulta.

A opção Prometheus está selecionada na página Explorar para obter métricas.

Figura 1. Opção de menu no Grafana para consultar métricas.

Na figura 1, a opção Prometheus apresenta a interface que lhe permite criar consultas para obter métricas.

Consultas de exemplo

A tabela seguinte contém exemplos de consultas para monitorizar a plataforma Vertex AI no seu ambiente:

Plataforma Vertex AI
Origem de dados Descrição Componente Consulta
Métrica Percentagem de utilização da CPU do contentor Operador de nível 1 rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l1operator"}[30s]) * 100
Operador de nível 2 rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l2operator"}[30s]) * 100
Utilização de memória em MB do contentor Operador de nível 1 container_memory_usage_bytes{namespace="ai-system",container="l1operator"} * 1e-6
Operador de nível 2 container_memory_usage_bytes{namespace="ai-system",container="l2operator"} * 1e-6
Registos operacionais Registos do operador de Nível 1 Operador de nível 1 {service_name="vai-l1operator"}
Registos do operador de nível 2 Operador de nível 2 {service_name="vai-l2operator"}
Registos de auditoria Registos de auditoria do front-end da plataforma Front-end do plug-in Web do Vertex AI {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-frontend)
Registos de auditoria do back-end da plataforma Back-end do plug-in Web da Vertex AI {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-backend)

A tabela seguinte contém exemplos de consultas para monitorizar os serviços da API Vertex AI, como OCR, Speech-to-Text e Vertex AI Translation, no seu ambiente:

Serviços do Vertex AI
Origem de dados Descrição Serviço Consulta
Métrica O efeito de uma API pré-treinada na
utilização da CPU.
OCR rate(container_cpu_usage_seconds_total{namespace="g-vai-ocr-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: vision-extractor | vision-frontend | vision-vms-ocr
Conversão de voz em texto rate(container_cpu_usage_seconds_total{namespace="g-vai-speech-sie",container="CONTAINER_NAME"}[30s]) * 100
Vertex AI Translation rate(container_cpu_usage_seconds_total{namespace="g-vai-translation-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: translation-aligner | translation-frontend | translation-prediction
Use a etiqueta de filtro destination_service para obter a taxa de erro nos últimos 60 minutos. OCR rate(istio_requests_total{destination_service=~".*g-vai-ocr-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Conversão de voz em texto rate(istio_requests_total{destination_service=~".*g-vai-speech-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Vertex AI Translation rate(istio_requests_total{destination_service=~".*g-vai-translation-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m])
Registos operacionais Registos operacionais dos serviços do Vertex AI
OCR {namespace="g-vai-ocr-sie"}
Conversão de voz em texto {namespace="g-vai-speech-sie"}
Vertex AI Translation {namespace="g-vai-translation-sie"}
Registos de auditoria Registos de auditoria dos serviços da Vertex AI OCR {service_name="istio"} |= "vision-frontend-server"
Conversão de voz em texto {service_name="istio"} |= "speech-frontend-server"
Vertex AI Translation {service_name="istio"} |= "translation-frontend-server"