Clique em um cartão de modelo para usar o modelo associado a ele. É possível clicar em um cartão de modelo para testar solicitações, ajustar um modelo, criar aplicativos e conferir amostras de código.
Solicitações de teste
Use o cartão de modelo da API Vertex AI PaLM para testar as solicitações.
No Console do Google Cloud, acesse a página Model Garden.
Encontre um modelo compatível que você queira testar e clique em Ver detalhes.
Clique em Abrir design de solicitação.
Você será direcionado à página Design do prompt.
Em Prompt, digite o prompt que você quer testar.
Opcional: configure os parâmetros do modelo.
Clique em Enviar.
Ajustar um modelo
Para ajustar modelos compatíveis, use um pipeline da Vertex AI ou um notebook.
Ajustar usando um pipeline
Os modelos BERT e T5-FLAN são compatíveis com o ajuste de modelos usando um pipeline.
No Console do Google Cloud, acesse a página Model Garden.
Em Pesquisar modelos, digite BERT ou T5-FLAN e clique na lupa.
Clique em Ver detalhes no card do modelo T5-FLAN ou BERT.
Clique em Abrir pipeline de ajuste.
Você será direcionado para a página de pipelines da Vertex AI.
Para iniciar o ajuste, clique em Criar execução.
Ajustar um notebook
Os cards de modelo para a maioria dos modelos básicos de código aberto e modelos ajustáveis são compatíveis com ajustes em um notebook.
No Console do Google Cloud, acesse a página Model Garden.
Encontre um modelo compatível que você queira ajustar e clique em Ver detalhes.
Clique em Abrir notebook.
Implantar um modelo
É possível implantar um modelo, como Stable Diffusion, pelo card dele. Ao implantar um modelo, você pode usar uma reserva do Compute Engine. Saiba mais em Usar reservas com previsão.
No Console do Google Cloud, acesse a página Model Garden.
Encontre um modelo com suporte que você quer implantar e clique no card dele.
Clique em Implantar para abrir o painel Implantar modelo.
No painel Implantar modelo, especifique os detalhes da implantação.
- Use ou modifique os nomes do modelo e do endpoint gerados.
- Selecione um local para criar o endpoint do modelo.
- Selecione um tipo de máquina para cada nó da implantação.
Para usar uma reserva do Compute Engine, na seção Configurações de implantação, selecione Avançado.
Selecione um tipo de reserva no campo Tipo de reserva. A reserva precisa corresponder às especificações da máquina selecionada.
- Usar automaticamente a reserva criada: a Vertex AI seleciona automaticamente uma reserva permitida com propriedades correspondentes. Se não houver capacidade na reserva selecionada automaticamente, a Vertex AI vai usar o pool de recursos Google Cloudgeral.
- Selecionar reservas específicas: a Vertex AI usa uma reserva específica. Se não houver capacidade para a reserva selecionada, um erro será gerado.
- Não usar (padrão): a Vertex AI usa o conjunto de recursosGoogle Cloud geral. Esse valor tem o mesmo efeito que não especificar uma reserva.
Clique em Implantar.
Confira exemplos de código
A maioria dos cartões de modelos de soluções específicas de tarefas contém amostras de código que podem ser copiadas e testadas.
No Console do Google Cloud, acesse a página Model Garden.
Encontre um modelo compatível para ver amostras de código e clique na guia Documentação.
A página rola para a seção de documentação com o código de amostra incorporado.
Criar um app Vision
Os cartões para modelos de visão computacional aplicáveis são compatíveis com a criação de um aplicativo de visão.
No Console do Google Cloud, acesse a página Model Garden.
Na seção "Soluções específicas para tarefas", encontre um modelo de visão que você queira usar para criar um aplicativo de visão e clique em Visualizar detalhes.
Clique em Criar app.
Você será levado à Vertex AI Vision.
Em Nome do aplicativo, insira um nome para seu aplicativo e clique em Continuar.
Selecione um plano de faturamento e clique em Criar.
Você será levado ao Vertex AI Vision Studio, onde poderá continuar criando seu aplicativo de visão computacional.