Usar o Imagen na legenda visual da Vertex AI e na Resposta visual a perguntas (VQA, na sigla em inglês) para receber informações de imagem (Console)

Saiba como usar o Imagen nos recursos de legendagem visual e resposta a perguntas visuais (VQA, na sigla em inglês) da Vertex AI para receber informações de texto sobre uma imagem. Neste guia de início rápido, mostramos como usar legendas visuais e o VQA no Console do Google Cloud.

Exemplo de imagem de um peixe
Fonte da imagem: Worachat Sodsri no Unsplash (imagem cortada, exibida no Console do Google Cloud).

Antes de começar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

Acessar a imagem de amostra

Depois de configurar o ambiente, é possível receber uma imagem de amostra e usar legendas visuais e o recurso Resposta visual a perguntas para conseguir informações sobre a imagem.

Exemplo de imagem de um peixe
Fonte da imagem: Worachat Sodsri no Unsplash (imagem cortada).

Para conseguir a imagem de amostra, faça o download da imagem diretamente do Cloud Storage ou use o seguinte comando para salvá-la no diretório atual:

curl -O https://storage.googleapis.com/cloud-samples-data/generative-ai/image/vcap-vqa-quickstart_fish.jpg

Gerar descrições de imagens com legendas visuais

Depois de receber a imagem de amostra, você pode enviar a solicitação de legenda visual para conseguir uma descrição em texto da imagem.

Console

  1. No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.

    Acessar a guia "Vertex AI Studio"

  2. No menu inferior, clique em Legenda.

  3. Clique em Fazer upload da imagem e selecione a imagem local para legendar.

  4. No painel Parâmetros, defina o seguinte:

    1. Número de legendas: selecione 2.
    2. Idioma: se ainda não tiver selecionado, escolha English (en).
  5. Clique em Gerar legendas.

Gerar respostas para perguntas com o VQA

Por fim, você pode usar a mesma imagem para fazer uma pergunta sobre ela e receber uma resposta usando o recurso VQA.

Console

  1. No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.

    Acessar a guia "Vertex AI Studio"

  2. No menu inferior, clique em Perguntas e respostas visuais.

  3. Clique em Fazer upload da imagem e selecione a imagem local.

  4. No painel Parâmetros, selecione "2" como o Número de respostas.

  5. No campo (Faça uma pergunta aqui) digite o seguinte:

    What color is the left fish?
    
  6. Clique em Gerar.

Parabéns! Você acabou de usar os recursos de legendagem visual e VQA do Imagen para conseguir informações sobre uma imagem.

Limpeza

Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.

Excluir o projeto

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

A seguir