Usar o Imagen na legenda visual da Vertex AI e na Resposta visual a perguntas (VQA, na sigla em inglês) para receber informações de imagem (Console)
Saiba como usar o Imagen nos recursos de legendagem visual e resposta a perguntas visuais (VQA, na sigla em inglês) da Vertex AI para receber informações de texto sobre uma imagem. Neste guia de início rápido, mostramos como usar legendas visuais e o VQA no Console do Google Cloud.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Acessar a imagem de amostra
Depois de configurar o ambiente, é possível receber uma imagem de amostra e usar legendas visuais e o recurso Resposta visual a perguntas para conseguir informações sobre a imagem.
Para conseguir a imagem de amostra, faça o download da imagem diretamente do Cloud Storage ou use o seguinte comando para salvá-la no diretório atual:
curl -O https://storage.googleapis.com/cloud-samples-data/generative-ai/image/vcap-vqa-quickstart_fish.jpg
Gerar descrições de imagens com legendas visuais
Depois de receber a imagem de amostra, você pode enviar a solicitação de legenda visual para conseguir uma descrição em texto da imagem.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.
No menu inferior, clique em
Legenda.Clique em Fazer upload da imagem e selecione a imagem local para legendar.
No painel Parâmetros, defina o seguinte:
- Número de legendas: selecione
2
. - Idioma: se ainda não tiver selecionado, escolha
English (en)
.
- Número de legendas: selecione
Clique em
Gerar legendas.
Gerar respostas para perguntas com o VQA
Por fim, você pode usar a mesma imagem para fazer uma pergunta sobre ela e receber uma resposta usando o recurso VQA.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.
No menu inferior, clique em
Perguntas e respostas visuais.Clique em Fazer upload da imagem e selecione a imagem local.
No painel Parâmetros, selecione "2" como o Número de respostas.
No campo (Faça uma pergunta aqui) digite o seguinte:
What color is the left fish?
Clique em
Gerar.
Parabéns! Você acabou de usar os recursos de legendagem visual e VQA do Imagen para conseguir informações sobre uma imagem.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Excluir o projeto
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
A seguir
- Leia as diretrizes de uso do Imagen na Vertex AI.
- Confira modelos pré-treinados no Model Garden.
- Saiba mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI.