Os registos e as métricas permitem-lhe monitorizar os seus serviços e resolver problemas com o desempenho dos serviços. Pode ver registos e métricas dos serviços do Vertex AI através dos recursos de monitorização e registo do Google Distributed Cloud (GDC) isolado. Também pode criar consultas para monitorizar métricas específicas do Vertex AI.
Esta página descreve como consultar e ver registos e métricas dos serviços da Vertex AI no a instância de monitorização do Distributed Cloud.
Esta página também contém exemplos de consultas que pode usar para monitorizar a plataforma e os serviços da Vertex AI, como o reconhecimento ótico de carateres (OCR), a conversão de voz em texto e a Vertex AI Translation. Para mais informações sobre soluções de registo e monitorização no Distributed Cloud, consulte o artigo Monitorize métricas e registos.
Antes de começar
Para receber as autorizações necessárias para ver registos e métricas do Vertex AI, peça ao administrador de IAM do projeto que lhe conceda a função de leitor do Grafana do projeto (project-grafana-viewer
) no seu espaço de nomes do projeto.
Para mais informações sobre esta função, consulte o artigo Prepare as autorizações de IAM.
Visualize registos e métricas em painéis de controlo
Pode ver as métricas e os registos da Vertex AI em painéis de controlo. Por exemplo, pode criar uma consulta para ver como a Vertex AI afeta a utilização da CPU.
Siga estes passos para ver os registos e as métricas da Vertex AI em painéis de controlo:
No menu de navegação, clique em Vertex AI > APIs pré-treinadas.
Na página APIs pré-treinadas, certifique-se de que a API Vertex AI para o serviço que quer monitorizar está ativada.
Clique em Monitorizar serviços no Grafana para abrir a página inicial do Grafana.
No menu de navegação da página inicial, clique em explorar Explorar para abrir a página Explorar.
No menu da página Explorar, selecione uma das seguintes origens de dados:
- Registos operacionais: obtenha registos operacionais.
- Registos de auditoria: obtenha registos de auditoria.
- Prometheus: obtenha métricas.
Se quiser apresentar métricas, introduza uma consulta com expressões PromQL (Prometheus Query Language).
Se quiser apresentar registos, introduza uma consulta com expressões LogQL (linguagem de consulta de registos).
A página apresenta as métricas ou os registos que correspondem à sua consulta.
Figura 1. Opção de menu no Grafana para consultar métricas.
Na figura 1, a opção Prometheus apresenta a interface que lhe permite criar consultas para obter métricas.
Consultas de exemplo
A tabela seguinte contém exemplos de consultas para monitorizar a plataforma Vertex AI no seu ambiente:
Plataforma Vertex AI | |||
---|---|---|---|
Origem de dados | Descrição | Componente | Consulta |
Métrica | Percentagem de utilização da CPU do contentor | Operador de nível 1 | rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l1operator"}[30s]) * 100 |
Operador de nível 2 | rate(container_cpu_usage_seconds_total{namespace="ai-system",container="l2operator"}[30s]) * 100 |
||
Utilização de memória em MB do contentor | Operador de nível 1 | container_memory_usage_bytes{namespace="ai-system",container="l1operator"} * 1e-6 |
|
Operador de nível 2 | container_memory_usage_bytes{namespace="ai-system",container="l2operator"} * 1e-6 |
||
Registos operacionais | Registos do operador de Nível 1 | Operador de nível 1 | {service_name="vai-l1operator"} |
Registos do operador de nível 2 | Operador de nível 2 | {service_name="vai-l2operator"} |
|
Registos de auditoria | Registos de auditoria do front-end da plataforma | Front-end do plug-in Web do Vertex AI | {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-frontend) |
Registos de auditoria do back-end da plataforma | Back-end do plug-in Web da Vertex AI | {service_name="istio"} |~ upstream_cluster:.*(vai-web-plugin-backend) |
A tabela seguinte contém exemplos de consultas para monitorizar os serviços da API Vertex AI, como OCR, Speech-to-Text e Vertex AI Translation, no seu ambiente:
Serviços do Vertex AI | |||
---|---|---|---|
Origem de dados | Descrição | Serviço | Consulta |
Métrica | O efeito de uma API pré-treinada na utilização da CPU. |
OCR | rate(container_cpu_usage_seconds_total{namespace="g-vai-ocr-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: vision-extractor | vision-frontend | vision-vms-ocr |
Conversão de voz em texto | rate(container_cpu_usage_seconds_total{namespace="g-vai-speech-sie",container="CONTAINER_NAME"}[30s]) * 100 |
||
Vertex AI Translation | rate(container_cpu_usage_seconds_total{namespace="g-vai-translation-sie",container="CONTAINER_NAME"}[30s]) * 100 CONTAINER_NAME values: translation-aligner | translation-frontend | translation-prediction |
||
Use a etiqueta de filtro destination_service para obter a taxa de erro nos últimos 60 minutos. |
OCR | rate(istio_requests_total{destination_service=~".*g-vai-ocr-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m]) |
|
Conversão de voz em texto | rate(istio_requests_total{destination_service=~".*g-vai-speech-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m]) |
||
Vertex AI Translation | rate(istio_requests_total{destination_service=~".*g-vai-translation-sie.svc.cluster.local",response_code=~"[4-5][0-9][0-9]"}[60m]) |
||
Registos operacionais | Registos operacionais dos serviços do Vertex AI |
OCR | {namespace="g-vai-ocr-sie"} |
Conversão de voz em texto | {namespace="g-vai-speech-sie"} |
||
Vertex AI Translation | {namespace="g-vai-translation-sie"} |
||
Registos de auditoria | Registos de auditoria dos serviços da Vertex AI | OCR | {service_name="istio"} |= "vision-frontend-server" |
Conversão de voz em texto | {service_name="istio"} |= "speech-frontend-server" |
||
Vertex AI Translation | {service_name="istio"} |= "translation-frontend-server" |