Guia para principiantes de IA generativa

Este guia para principiantes apresenta-lhe as tecnologias essenciais da IA generativa e explica como se encaixam para alimentar chatbots e aplicações. A IA generativa (também conhecida como IA gen ou IA gen) é um campo da aprendizagem automática (ML) que desenvolve e usa modelos de ML para gerar novo conteúdo.

Os modelos de IA generativa são frequentemente denominados modelos de linguagem (conteúdo extenso) (MDIs/CEs) devido ao seu tamanho grande e capacidade de compreender e gerar linguagem natural. No entanto, consoante os dados com os quais os modelos são preparados, estes modelos podem compreender e gerar conteúdo a partir de várias modalidades, incluindo texto, imagens, vídeos e áudio. Os modelos que funcionam com várias modalidades de dados são denominados modelos multimodais.

A Google oferece a família de modelos de IA generativa Gemini concebidos para exemplos de utilização multimodais; capazes de processar informações de várias modalidades, incluindo imagens, vídeos e texto.

Geração de conteúdo

Para que os modelos de IA generativa gerem conteúdo útil em aplicações do mundo real, têm de ter as seguintes capacidades:

  • Saiba como realizar novas tarefas:

    Os modelos de IA generativa são concebidos para realizar tarefas gerais. Se quiser que um modelo execute tarefas exclusivas do seu exemplo de utilização, tem de poder personalizá-lo. No Vertex AI, pode personalizar o seu modelo através do ajuste de modelos.

  • Aceder a informações externas:

    Os modelos de IA generativa são preparados com grandes quantidades de dados. No entanto, para que estes modelos sejam úteis, têm de poder aceder a informações fora dos respetivos dados de preparação. Por exemplo, se quiser criar um chatbot de serviço ao cliente com tecnologia de um modelo de IA generativa, o modelo tem de ter acesso a informações sobre os produtos e os serviços que oferece. No Vertex AI, usa as funcionalidades de fundamentação e de chamadas de funções para ajudar o modelo a aceder a informações externas.

  • Bloqueie conteúdo prejudicial:

    Os modelos de IA generativa podem gerar resultados inesperados, incluindo texto ofensivo ou insensível. Para manter a segurança e evitar a utilização indevida, os modelos precisam de filtros de segurança para bloquear comandos e respostas que sejam considerados potencialmente prejudiciais. O Vertex AI tem funcionalidades de segurança incorporadas que promovem a utilização responsável dos nossos serviços de IA generativa.

O diagrama seguinte mostra como estas diferentes capacidades funcionam em conjunto para gerar o conteúdo que quer:

Diagrama do fluxo de trabalho da IA generativa

Comando

Comando

Normalmente, o fluxo de trabalho da IA generativa começa com a introdução de comandos. Um comando é um pedido de linguagem natural enviado a um modelo de IA generativa para obter uma resposta. Consoante o modelo, um comando pode conter texto, imagens, vídeos, áudio, documentos e outras modalidades ou até várias modalidades (multimodal).

Criar um comando para receber a resposta desejada do modelo é uma prática denominada design de comandos. Embora a conceção de comandos seja um processo de tentativa e erro, existem princípios e estratégias de conceção de comandos que pode usar para incentivar o modelo a comportar-se da forma desejada. O Vertex AI Studio oferece uma ferramenta de gestão de comandos para ajudar a gerir os seus comandos.

Modelos de base

Modelos de base

Os comandos são enviados para um modelo de IA generativa para a geração de respostas. O Vertex AI tem uma variedade de modelos de base de IA generativa acessíveis através de uma API gerida, incluindo o seguinte:

  • API Gemini: raciocínio avançado, chat com várias interações, geração de código e comandos multimodais.
  • API Imagen: geração de imagens, edição de imagens e legendas visuais.
  • MedLM: respostas a perguntas médicas e resumo. (Descontinuado)

Os modelos diferem em tamanho, modalidade e custo. Pode explorar modelos da Google, bem como modelos abertos e modelos de parceiros da Google, no Model Garden.

Personalização de modelos

Personalização de modelos

Pode personalizar o comportamento predefinido dos modelos de base da Google para que gerem consistentemente os resultados pretendidos sem usar comandos complexos. Este processo de personalização chama-se ajuste do modelo. O ajuste de modelos ajuda a reduzir o custo e a latência dos seus pedidos, permitindo-lhe simplificar os comandos.

O Vertex AI também oferece ferramentas de avaliação de modelos para ajudar a avaliar o desempenho do seu modelo otimizado. Depois de o modelo otimizado estar pronto para produção, pode implementá-lo num ponto final e monitorizar o desempenho, tal como nos fluxos de trabalho de MLOps padrão.

Aceda a informações externas

Aumento

O Vertex AI oferece várias formas de dar ao modelo acesso a APIs externas e informações em tempo real.

  • Fundamentação: Associa as respostas do modelo a uma fonte de informações verdadeiras, como os seus próprios dados ou a pesquisa na Web, o que ajuda a reduzir as alucinações.
  • RAG: liga modelos a origens de conhecimento externas, como documentos e bases de dados, para gerar respostas mais precisas e informativas.
  • Chamada de funções: Permite que o modelo interaja com APIs externas para obter informações em tempo real e realizar tarefas do mundo real.

Verificação de citações

Verificação de citações

Depois de a resposta ser gerada, o Vertex AI verifica se é necessário incluir citações na resposta. Se uma quantidade significativa do texto na resposta for proveniente de uma determinada fonte, essa fonte é adicionada aos metadados de citação na resposta.

IA responsável e segurança

IA responsável e segurança

A última camada de verificações que o comando e a resposta atravessam antes de serem devolvidos são os filtros de segurança. O Vertex AI verifica o comando e a resposta para determinar a que categoria de segurança pertencem o comando ou a resposta. Se o limite for excedido para uma ou mais categorias, a resposta é bloqueada e a Vertex AI devolve uma resposta alternativa.

Resposta

Resposta

Se o comando e a resposta passarem nas verificações do filtro de segurança, a resposta é devolvida. Normalmente, a resposta é devolvida de uma só vez. No entanto, com a Vertex AI, também pode receber respostas progressivamente à medida que são geradas ativando o streaming.

Começar

Experimente um destes inícios rápidos para começar a usar a IA generativa na Vertex AI.