Testar recursos do modelo no Model Garden

O Model Garden oferece várias opções para você conferir e testar rapidamente os recursos do modelo. Para modelos compatíveis, você pode testar playgrounds de demonstração ou iniciar aplicativos de demonstração chamados Model Garden Spaces, que podem ser compartilhados com outras pessoas para mostrar as capacidades de um modelo.

Os playgrounds são alimentados por endpoints de previsão on-line da Vertex AI pré-implantados e não geram cobranças. Ao abrir o cartão de um modelo compatível, use o painel Testar para testar rapidamente as funcionalidades dele enviando um comando de texto. Também é possível definir alguns dos parâmetros mais comuns, como temperatura e número de tokens de saída. O playground é limitado apenas à entrada e saída de texto.

Ao iniciar o Spaces, você tem um aplicativo da Web funcional pronto para uso com muito menos esforço manual do que implantar um modelo e criar um app para usar o endpoint do modelo. O Model Garden implanta o modelo selecionado na Vertex AI e o app de exemplo em uma instância do Cloud Run que usa o endpoint do modelo implantado. O aplicativo também pode usar endpoints atuais ou um endpoint de MaaS.

Para iniciar um modelo, abra o card dele e, no painel Testar os Spaces, clique em um Space para iniciar. Você recebe uma cobrança pelas máquinas usadas na implantação e pela instância do Cloud Run que hospeda o app.

Antes de começar

Neste tutorial, você precisa configurar um projeto do Google Cloud e ativar a API Vertex AI.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. Teste um playground

    1. No console Google Cloud , acesse o card de um modelo compatível, como o Gemma 2.

      Acessar o Gemma 2

    2. No painel Teste:

      1. Em Região, aceite o padrão ou escolha sua região.
      2. Em Endpoint, selecione Playground de demonstração.
      3. Na caixa Comando, digite Why is the sky blue?.
      4. Abra a seção Opções avançadas e confira os parâmetros padrão.

      O painel de teste do Gemma 2b-it

    3. Clique em Enviar. A saída aparece abaixo do botão "Enviar".

    Teste os Espaços

    É possível iniciar espaços com modelos como Gemini, Gemma, Llama e Stable Diffusion. Confira a seguir um exemplo de o que é compatível:

    Permissões do IAM

    Além das permissões atuais para usar a Vertex AI, você precisa ter as seguintes permissões para iniciar o Spaces:

    Ação Permissões necessárias Finalidade
    Ativar APIs adicionais serviceusage.services.enable Ative as APIs a seguir:
    • API Cloud Run Admin (run.googleapis.com)
    • API Artifact Registry (artifactregistry.googleapis.com)
    • API Cloud Build (cloudbuild.googleapis.com)
    • API Cloud Logging (logging.googleapis.com)
    Conceder permissões para contas de serviço resourcemanager.projects.setIamPolicy Conceda à conta de serviço padrão do Compute Engine os seguintes papéis:
    Implantar permissões específicas
    • storage.buckets.create
    • run.services.create
    • artifactregistry.repositories.create
    • run.services.setIamPolicy
    Durante a implantação, um conjunto de códigos-fonte será enviado ao Cloud Storage e implantado no Cloud Run com um novo serviço criado. O artifactregistry.repositories.create é necessário para criar um repositório para a imagem do contêiner. O run.services.setIamPolicy é necessário para tornar o serviço acessível publicamente.

    Se você for o proprietário do projeto, não precisará realizar outras ações. Basta seguir os guias no Vertex AI Studio. Se você não for o proprietário do projeto, peça ao administrador para realizar as duas primeiras ações e conceder a você os papéis de Editor (roles/editor) e Administrador do Cloud Run (roles/run.admin).

    Iniciar o Spaces

    Inicie o Spaces para testar e experimentar um modelo de um aplicativo de amostra do Gradio.

    1. No console Google Cloud , acesse o Model Garden para conferir o card de um modelo.

      Acessar o Model Garden

    2. Selecione o modelo a ser usado. Os modelos compatíveis têm um painel Testar o Spaces, como o card do modelo Gemma 3.

      Acessar o Gemma 3

    3. Clique em rocket_launch Executar para iniciar um espaço.

      1. Você pode Exigir autenticação (via Identity-Aware Proxy) ou Permitir acesso público. Para mais informações, consulte Ativar APIs para a primeira implantação e conceder permissões.
      1. Clique em Criar novo serviço para iniciar a implantação. É possível monitorar o status da implantação no card do modelo.
    4. Depois que o status do Spaces mudar para Pronto, clique nele para conferir os detalhes da implantação.

      Para proteção básica, o aplicativo da Web exige uma chave secreta que precisa ser adicionada ao URL ao enviar comandos. Essa chave secreta é fornecida no campo Chave secreta.

      1. Clique em Abrir para começar a usar o app. Você pode enviar comandos para o modelo e conferir as respostas dele no app.

      Você pode compartilhar o URL para que outras pessoas também possam testar o app.

      1. Para fechar o acesso ao app, clique em Editar no campo Controle de acesso.

      Na guia Segurança do aplicativo do Cloud Run, selecione Exigir autenticação e clique em Salvar. O aplicativo não está mais disponível no URL. As visitas ao URL resultam em um erro 403 (proibido).

    Limpar

    Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.

    Excluir espaços

    Para limpar os espaços, é preciso excluir os recursos do modelo e do aplicativo de exemplo no Cloud Run.

    Excluir recursos do modelo

    No app Gradio, é possível excluir endpoints de modelo para limpar recursos da Vertex AI. Em seguida, exclua o serviço do Cloud Run para interromper e excluir o app do Gradio.

    Para excluir recursos da Vertex AI manualmente, consulte Cancelar a implantação de modelos e excluir recursos.

    Excluir serviço do Cloud Run

    Exclua recursos relacionados a um serviço, incluindo todas as revisões dele. A exclusão de um serviço não inclui itens como imagens de contêiner do Artifact Registry. Para mais informações, consulte Gerenciar serviços na documentação do Cloud Run.

    1. No Google Cloud console, confira a lista de serviços do Cloud Run:

      Acessar o Cloud Run

    2. Localize e selecione o serviço que você quer excluir.

    3. Clique em excluir Excluir. Isso exclui todas as revisões do serviço.

    Excluir o projeto

    O jeito mais fácil de evitar cobranças é excluindo o projeto que você criou para o tutorial.

    Para excluir o projeto:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    A seguir

    Confira uma visão geral do Model Garden.