Teste os modelos do Gemini 1.5, os modelos multimodais mais recentes na Vertex AI, e veja o que é possível criar com uma janela de contexto de até 2 milhões de tokens . Teste os modelos do Gemini 1.5, os modelos multimodais mais recentes na Vertex AI, e veja o que é possível criar com uma janela de contexto de até 2 milhões de tokens.

Introdução à IA generativa

Este guia para iniciantes apresenta as principais tecnologias da IA generativa e explica como eles se complementam para potencializar chatbots e aplicativos. A IA generativa, também conhecida como genAI ou genAI, é um campo de machine learning (ML) que desenvolve e usa modelos de ML para gerar conteúdo novo.

Os modelos de IA generativa são frequentemente chamados de modelos de linguagem grandes (LLMs) devido ao tamanho grande e a capacidade de entender e gerar linguagem natural. No entanto, dependendo dos dados com os quais os modelos são treinados, eles podem entender e gerar conteúdo em diversas modalidades, incluindo texto, imagens, vídeos e áudio. Modelos que funcionam com várias modalidades de dados chamados modelos multimodais.

Geração de conteúdo

Para que os modelos de IA generativa gerem conteúdo útil em aplicativos reais, elas precisam ter os seguintes recursos:

Aprenda a realizar novas tarefas:

Os modelos de IA generativa são projetados para realizar tarefas gerais. Se você quiser um modelo para executar tarefas exclusivas do seu caso de uso, é preciso personalizar o modelo. Na Vertex AI, é possível personalizar seu modelo por meio do ajuste de modelos.
Acesso a informações externas:

Os modelos de IA generativa são treinados com grandes quantidades de dados. No entanto, para que esses modelos sejam úteis, eles precisam conseguir acessar informações fora dos dados de treinamento. Por exemplo, se você quiser criar um chatbot de atendimento ao cliente com tecnologia de IA generativa, o modelo precisa ter acesso às informações sobre os produtos e serviços que você oferta. Na Vertex AI, você usa os recursos de chamada função e embasamento para ajudar o modelo a acessar informações externas.
Bloquear conteúdo nocivo:

Os modelos de IA generativa podem gerar resultados inesperados, incluindo texto ofensivo ou insensível. Para manter a segurança e evitar o uso indevido, os modelos precisam de filtros de segurança para bloquear comandos e respostas que sejam considerados potencialmente nocivos. A Vertex AI tem recursos de segurança integrados que promovem o uso responsável dos nossos serviços de IA generativa.

O diagrama a seguir mostra como esses diferentes recursos funcionam em parceria para gerar o conteúdo que você quer:

Diagrama do fluxo de trabalho da IA generativa

Comando

O fluxo de trabalho da IA generativa geralmente começa com solicitações. Um prompt é uma solicitação de linguagem natural enviada a um modelo de IA generativa para receber uma resposta. Dependendo do modelo, um comando pode conter texto, imagens, vídeos, áudio, documentos e outras modalidades, ou até mesmo várias modalidades (multimodais).

Criar um comando para receber a resposta desejada do modelo é uma prática chamada design de comandos. Embora o design de prompts seja um processo de tentativa e erro, há princípios e estratégias que podem ser usados para fazer com que o modelo se comporte da maneira desejada. O Vertex AI Studio oferece uma ferramenta de gestão de comandos para ajudar você a gerenciá-los.

Modelos de fundação

Os comandos são enviados a um modelo de IA generativa para geração de respostas. A Vertex AI tem vários modelos de fundação de IA generativa acessíveis por uma API, incluindo estes:

API Gemini: raciocínio avançado, chat com vários turnos, geração de código e comandos multimodais.
API Imagen: geração de imagens, edição de imagens e legendagem visual.
MedLM: resposta e resumo de perguntas médicas. (Disponibilidade geral particular)

Os modelos diferem em tamanho, modalidade e custo. Conheça os modelos do Google, bem como os de parceiros do Google, no Model Garden.

Personalização de modelos

É possível personalizar o comportamento padrão dos modelos básicos do Google para que eles gerem de maneira consistente os resultados desejados sem usar solicitações complexas. Esse processo de personalização é chamado de ajuste do modelo. O ajuste de modelo ajuda a reduzir o custo e a latência das solicitações, o que simplifica as solicitações.

A Vertex AI também oferece ferramentas de avaliação de modelos para ajudar você a avaliar o desempenho do modelo ajustado. Depois que o modelo ajustado estiver pronto para produção, será possível implantá-lo em um endpoint e monitorar o desempenho como em fluxos de trabalho MLOps padrão.

Acessar informações externas

A Vertex AI oferece várias maneiras de fornecer o acesso do modelo a APIs externas e informações em tempo real.

Embasamento: conecta as respostas do modelo a uma fonte da verdade, como seus próprios dados ou a pesquisa na Web, o que ajuda a reduzir as alucinações.
RAG: conecta modelos a fontes de conhecimento externas, como documentos e bancos de dados, para gerar respostas mais precisas e informativas.
Chamada de função: permite que o modelo interaja com APIs externas para receber informações em tempo real e realizar tarefas reais.

Verificação de citação

Depois que a resposta é gerada, a Vertex AI verifica se as citações precisam ser incluídas nela. Se uma parte significativa do texto na resposta vier de uma fonte específica, essa fonte será adicionada aos metadados de citação na resposta.

IA e segurança responsáveis

A última camada de verificações que a solicitação e a resposta passam antes de serem retornadas são os filtros de segurança. A Vertex AI verifica a solicitação e a resposta para saber quanto ela pertence a uma categoria de segurança. Se o limite for excedido para uma ou mais categorias, a resposta será bloqueada e a Vertex AI vai retornar uma resposta alternativa.

Resposta

Se a solicitação e a resposta forem aprovadas nas verificações do filtro de segurança, a resposta será retornada. Normalmente, a resposta é retornada de uma só vez. No entanto, com a Vertex AI você também pode receber respostas progressivamente à medida que são geradas, ativando o streaming.

Experiências do console do Vertex AI Studio

Ao usar o Vertex AI Studio com o teste gratuito ou sem fazer login no Google Cloud, alguns recursos não estão disponíveis. Para testar o Vertex AI Studio, aceite a janela de Termos de Serviço do Vertex AI Studio no console do Google Cloud.

	Usar sem uma conta do Google Cloud	Usar com uma conta de teste gratuito do Google Cloud	Usar com uma conta do Google Cloud
É necessário fazer login	Não	Sim	Sim
Consultas por minuto (QPM)	2 QPM para todos os modelos multimodais	Conferir limites de cota	Conferir limites de cota
Créditos oferecidos	US$ 0	Até US$ 300 por 90 dias	US$ 0
Galeria de comandos	Não	Sim	Sim
Designer de comandos	Sim	Sim	Sim
Salvar comandos	Não	Sim	Sim
Histórico de solicitações	Não	Sim	Sim
Parâmetros avançados	Não	Não	Sim
Ajuste	Não	Não	Sim
Uso da API	Não	Sim	Sim
Faturamento necessário	Não	Não	Sim
Como começar	Acesse o Vertex AI Studio	Inscreva-se para um teste gratuito	Teste o Vertex AI Studio no seu console

Começar a usar a IA generativa na Vertex AI

Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
Confira modelos pré-treinados no Model Garden.
Confira a referência do SDK da API Vertex AI Gemini para Python, Node.js, Java, GO ou C#.
Saiba mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI.
Saiba mais sobre Preços.
Saiba mais sobre como chamar o Gemini usando a biblioteca da OpenAI.