Visão geral da IA generativa na Vertex AI

A IA generativa na Vertex AI (também conhecida como genAI ou gen AI) oferece acesso aos grandes modelos de IA generativa do Google para que seja possível testar, ajustar e implantá-los para uso nos seus aplicativos com tecnologia de IA. Nesta página, apresentamos uma visão geral do fluxo de trabalho de IA generativa na Vertex AI, os recursos e modelos disponíveis e direciona você aos recursos para começar.

Fluxo de trabalho da IA generativa

No diagrama a seguir, mostramos uma visão geral de alto nível do fluxo de trabalho da IA generativa.

Diagrama do fluxo de trabalho da IA generativa

Comando

Comando

O fluxo de trabalho da IA generativa geralmente começa com solicitações. Um prompt é uma solicitação de linguagem natural enviada a um modelo de linguagem para receber uma resposta de volta. A escrita de uma solicitação para receber a resposta desejada do modelo é uma prática chamada design de prompt. Embora o design de prompts seja um processo de tentativa e erro, há princípios e estratégias que podem ser usados para fazer com que o modelo se comporte da maneira desejada.

Modelos de fundação

Modelos de fundação

As solicitações são enviadas a um modelo para geração de respostas. A Vertex AI tem vários modelos de fundação de IA generativa acessíveis por uma API, incluindo o seguinte:

  • API Gemini: raciocínio avançado, chat com vários turnos, geração de código e comandos multimodais.
  • API PaLM: tarefas de linguagem natural, embeddings de texto e chat com vários turnos.
  • APIs Codey: geração de código, preenchimento de código e chat de código.
  • API Imagen: geração de imagens, edição de imagens e legendagem visual.
  • MedLM: resposta e resumo de perguntas médicas. (Disponibilidade geral particular)

Os modelos diferem em tamanho, modalidade e custo. É possível explorar os modelos reservados do Google e modelos de OSS no Model Garden.

Personalização de modelos

Personalização de modelos

É possível personalizar o comportamento padrão dos modelos básicos do Google para que eles gerem de maneira consistente os resultados desejados sem usar solicitações complexas. Esse processo de personalização é chamado de ajuste do modelo. O ajuste de modelo ajuda a reduzir o custo e a latência das solicitações, o que simplifica as solicitações.

A Vertex AI também oferece ferramentas de avaliação de modelos para ajudar você a avaliar o desempenho do modelo ajustado. Depois que o modelo ajustado estiver pronto para produção, será possível implantá-lo em um endpoint e monitorar o desempenho como em fluxos de trabalho MLOps padrão.

Serviço de embasamento da Vertex AI

Altitude de referência

Se você precisar que as respostas do modelo sejam baseadas em uma fonte de verdade, como seu próprio corpus de dados, use o embasamento na Vertex AI. A altitude de referência ajuda a reduzir alucinações de modelos, especialmente em tópicos desconhecidos e dá ao modelo acesso a novas informações.

Verificação da citação

Verificação da citação

Depois que a resposta é gerada, a Vertex AI verifica se as citações precisam ser incluídas nela. Se uma parte significativa do texto na resposta vier de uma fonte específica, essa fonte será adicionada aos metadados de citação na resposta.

IA e segurança responsáveis

IA e segurança responsáveis

A última camada de verificações que a solicitação e a resposta passam antes de serem retornadas são os filtros de segurança. A Vertex AI verifica a solicitação e a resposta para saber quanto ela pertence a uma categoria de segurança. Se o limite for excedido para uma ou mais categorias, a resposta será bloqueada e a Vertex AI vai retornar uma resposta alternativa.

Resposta

Resposta

Se a solicitação e a resposta forem aprovadas nas verificações do filtro de segurança, a resposta será retornada. Normalmente, a resposta é retornada de uma só vez. No entanto, você também pode receber respostas progressivamente conforme elas são geradas ativando o streaming.

APIs e modelos de IA generativa

Os modelos de IA generativa disponíveis na Vertex AI, também conhecidos como modelos de fundação, são categorizados pelo tipo de conteúdo que ele foi projetado para gerar. Esse conteúdo inclui texto, chat, imagem, código, vídeo, dados multimodais e embeddings. Cada modelo é exposto por meio de um endpoint do editor específico para seu projeto do Google Cloud. Por isso, não é necessário implantar o modelo de fundação, a menos que você precise ajustá-lo para um caso de uso específico.

Ofertas da API Gemini

A API Vertex AI Gemini contém os endpoints do editor para os modelos Gemini desenvolvidos pelo Google DeepMind.

  • O Gemini 1.0 Pro foi projetado para lidar com tarefas de linguagem natural, chat de código e texto com vários turnos e geração de código.
  • Gemini 1.0 Pro Vision: oferece suporte a solicitações multimodais. É possível incluir texto, imagens e vídeo nos comandos e receber respostas de texto ou código.

Ofertas da API PaLM

A API PaLM da Vertex AI contém os endpoints do editor para o Pathways Language Model 2 (PaLM 2) do Google, que são modelos de linguagem grandes (LLMs) que geram texto e código em resposta a comandos de linguagem natural.

  • A API PaLM for text é ajustada para tarefas de linguagem, como classificação, resumo e extração de entidades.
  • A API PaLM para chat é ajustada para o chat multiturno, em que o modelo monitora as mensagens anteriores no chat e as usa como contexto para gerar novas respostas.

Outras ofertas de IA generativa

  • As APIs do Codey geram códigp. As APIs do Codey incluem três modelos que geram código, sugerem código para a conclusão do código e permitem que os desenvolvedores conversem para receber ajuda com perguntas relacionadas ao código. Para mais informações, consulte Visão geral de modelos de código.

  • A API Text Embedding gera embeddings de vetores para o texto de entrada. É possível usar embeddings para tarefas como pesquisa semântica, recomendação, classificação e detecção de outliers.

  • Os embeddings multimodais geram vetores de embedding com base em entradas de imagem e texto. Esses embeddings podem ser usados posteriormente para outras tarefas subsequentes, como classificação de imagens ou recomendações de conteúdo. Para mais informações, consulte a página Embeddings multimodais.

  • O Imagen, nosso modelo de fundação de texto em imagem, permite que as organizações gerem e personalizem imagens de nível empresarial para qualquer tipo de necessidade comercial. Para mais informações, consulte a Visão geral do Imagen na Vertex AI.

  • O MedLM é uma família de modelos de fundação ajustados para o setor de saúde. Para mais informações, consulte a visão geral dos modelos MedLM.

Vertex AI Studio

O Vertex AI Studio é uma ferramenta do console do Google Cloud para a prototipagem e o teste rápidos de modelos de IA generativa. É possível testar comandos de amostra, projetar seus comandos e personalizar modelos de fundação para lidar com tarefas que atendam às necessidades do aplicativo. Nesta página, você vai conhecer as diferentes tarefas que podem ser executadas no Vertex AI Studio, incluindo as seguintes:

  • Testar modelos usando amostras de comandos.
  • Criar e salvar seus próprios comandos.
  • Ajustar um modelo de fundação
  • Converter voz e texto.

Testar modelos usando amostras de comando

A Prompt Gallery, na seção Idioma do Vertex AI Studio, contém uma variedade de comandos de amostra predefinidos para ajudar a demonstrar os recursos do modelo. Os comandos de amostra são categorizados pelo tipo de tarefa, como resumo, classificação e extração. Cada comando é pré-configurado com um modelo e valores de parâmetro especificados. Dessa maneira, basta abrir o comando de amostra e clicar em Enviar para que o modelo gere uma resposta.

IU de comando

Criar e salvar seus comandos

O design de comando é o processo de criação de comandos que extraem a resposta desejada de um modelo de linguagem. Ao elaborar os comandos com cuidado, é possível deslocar o modelo para gerar um resultado desejado. O design de comando pode ser uma maneira eficiente de testar a adaptação de um modelo de linguagem para um caso de uso específico.

É possível criar e salvar seus comandos no Vertex AI Studio. Ao criar uma novo comando, insira o texto do comando, especifique o modelo a ser usado, configure valores de parâmetro e teste o comando gerando uma resposta. Itere o comando e suas configurações até conseguir os resultados desejados. Quando terminar de projetar o comando, salve-o no Vertex AI Studio.

Citações de resposta

Ao usar um modelo de texto no Vertex AI Studio, como text-bison, você vai receber respostas de texto com base na entrada. O objetivo dos nossos recursos é produzir conteúdo original e não replicar conteúdo existente. Se o Vertex AI Studio citar muitos conteúdos de uma página da Web, ele vai indicar essa página na saída.

citação de texto

É possível alterar a qualidade das respostas ajustando a temperatura (aleatoriedade de saída) e testando outros parâmetros de resposta no Vertex AI Studio.

As citações estão disponíveis no Vertex AI Studio e na API. Para saber mais sobre IA responsável e citações, consulte Metadados da citação.

Explorar modelos de IA generativa no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a propriedade do Google e selecionar modelos e recursos de OSS. Para conferir os modelos de IA generativa e as APIs disponíveis na Vertex AI, acesse "Grupo de modelos" no console do Google Cloud.

Acessar o Model Garden

Para saber mais sobre o Model Garden, incluindo modelos e recursos disponíveis, consulte Explorar modelos de IA no Model Garden.

Ajustar um modelo de fundação

Embora o design do comando seja ótimo para a experimentação rápida, se os dados de treinamento estiverem disponíveis, uma qualidade maior poderá ser alcançada ajustando o próprio modelo. O ajuste de um modelo permite personalizar a resposta do modelo com base em exemplos da tarefa que você quer que o modelo execute.

Para saber como ajustar um modelo de fundação, consulte Ajustar modelos de fundação.

Converter voz e texto

Na ferramenta de voz do Vertex AI Studio, é possível transformar um snippet de texto em um arquivo de voz em áudio para reprodução e download. É possível selecionar várias vozes e ajustar a velocidade da voz.

Por outro lado, se você tiver um arquivo de voz em áudio, também poderá fazer o upload dele no Vertex AI Studio e transformá-lo em texto.

Para saber mais, leia as seguintes páginas:

Testar o Vertex AI Studio

O Vertex AI Studio está na página da Vertex AI no console do Google Cloud.

Acessar o Vertex AI Studio

Certificações e controles de segurança

A Vertex AI é compatível com CMEK, VPC Service Controls, residência de dados e transparência no acesso. Há algumas limitações para recursos de IA generativa. Para mais informações, consulte Controles de segurança da IA generativa.

Começar