APIs da Vertex AI para criar experiências de pesquisa e RAG

A Vertex AI oferece um pacote de APIs para ajudar você a criar sua própria recuperação para aplicativos de geração aumentada (RAG) ou para criar seu próprio mecanismo de pesquisa. Isso introduz essas APIs.

Recuperação e geração

A RAG é uma metodologia que permite que os modelos de linguagem grandes (LLMs) gerem respostas com base na sua fonte de dados preferida. Há duas etapas em RAG:

  1. Recuperação: identificar rapidamente os fatos mais relevantes pode ser uma tarefa um problema de pesquisa. Com a RAG, é possível recuperar rapidamente os fatos importante para gerar uma resposta.
  2. Geração: o LLM usa os fatos recuperados para gerar uma resposta fundamentada.

A Vertex AI oferece opções para os dois estágios para atender a várias necessidades de desenvolvedores.

As opções de recuperação incluem Vertex AI, criação do próprio recuperador, LlamaIndex na Vertex AI, traga seu próprio retriever e a Pesquisa Google. As opções de geração incluem a API Grounded Generation e o Gemini.

Recuperação

Escolha o melhor método de recuperação para suas necessidades:

  • Vertex AI para Pesquisa: é um mecanismo de recuperação de informações com a qualidade da Pesquisa Google que pode ser um componente de qualquer aplicativo de IA generativa que usa dados corporativos. A Vertex AI para Pesquisa funciona como um mecanismo de pesquisa de palavras-chave e semântica pronto para uso na RAG, com a capacidade de processar vários tipos de documento e com conectores para vários sistemas de origem, incluindo o BigQuery e muitos sistemas de terceiros.

    Para mais informações, consulte Vertex AI para Pesquisa.

  • Crie sua própria recuperação: se você quiser criar sua pesquisa semântica, use as APIs da Vertex AI para componentes do seu sistema RAG personalizado. Esse pacote de APIs oferece implementações de alta qualidade para análise, geração de embedding, pesquisa vetorial e classificação semântica. Ao usar essas as APIs de nível inferior oferecem flexibilidade total no design do seu retriever oferecendo maior rapidez no tempo de lançamento usando APIs da Vertex AI de nível inferior.

    Para mais informações, consulte Crie sua própria Geração Aumentada de Recuperação.

  • Traga uma recuperação existente: é possível usar sua pesquisa existente como um retriever para a geração de consciência. Também é possível usar as APIs Vertex para RAG para melhorar sua pesquisa atual.

  • LlamaIndex na Vertex AI: o LlamaIndex na Vertex AI permite que desenvolvedores familiarizados com esse framework de software de código aberto (OSS, na sigla em inglês) criem retrievers para uso na produção e em um contexto pronto para uso empresarial.

    Para mais informações, consulte LlamaIndex na Vertex AI para RAG. informações gerais no curso IA generativa na Vertex AI na documentação do Google Cloud.

  • Pesquisa Google: quando você usa o Embasamento com a Pesquisa Google para seu modelo do Gemini, o Gemini usa a Pesquisa Google e gera uma saída baseada nos resultados de pesquisa relevantes. Esse método de recuperação não requer gerenciamento e disponibiliza todo o conhecimento do mundo para o Gemini.

    Para mais informações, consulte Embasamento com Pesquisa Google na documentação da IA generativa na Vertex AI.

Geração

Escolha o melhor método de geração para suas necessidades:

  • API Grounded Generation (GA com lista de permissões): use a API Grounded Generation API para gerar respostas bem fundamentadas para a consulta de um usuário. Essa API usa um modelo Gemini especializado e ajustado, além de ser uma forma eficaz de reduzir alucinações e fornecer respostas fundamentadas em suas fontes, fontes de terceiros ou a Pesquisa Google, incluindo referências a conteúdo de suporte de embasamento.

    Para mais informações, consulte Gerar respostas fundamentadas.

  • Gemini:o Gemini é o modelo mais eficiente do Google, e oferece uma base pronta para uso com a Pesquisa Google. Você pode usá-la para criar sua solução de geração de dados fundamentada totalmente personalizada.

    Para mais informações, consulte Como usar a Pesquisa Google na documentação da IA generativa na Vertex AI.

  • Model Garden: se você quiser controle total e o modelo de sua escolha, é possível usar qualquer um dos modelos Model Garden da Vertex AI para geração.

Crie sua própria Geração Aumentada de Recuperação

O desenvolvimento de um sistema RAG personalizado para aterramento oferece flexibilidade e controle em cada etapa do processo. A Vertex AI oferece um pacote de APIs para ajudar você criar suas próprias soluções de pesquisa. O uso dessas APIs oferece flexibilidade total o design do aplicativo RAG, oferecendo ao mesmo tempo tempo de lançamento e alta qualidade, contando com esses APIs da Vertex AI.

A Vertex AI oferece APIs para processamento e anotação, incorporação, indexação e recuperação, classificação, geração baseada e validação.

  • O analisador de layout da Document AI. O Analisador de layout da Document AI transforma documentos em várias formatos em representações estruturadas, tornando conteúdos como parágrafos, tabelas, listas e elementos estruturais como títulos, cabeçalhos de páginas e rodapés acessíveis e a criação de blocos baseados no contexto que facilitam recuperação de informações em uma variedade de apps de descoberta e IA generativa.

    Para mais informações, consulte Analisador de layout da Document AI na documentação da Document AI.

  • API Embeddings:as APIs de embeddings da Vertex AI permitem criar embeddings para entradas de texto ou multimodais. Os embeddings são vetores de números de ponto flutuante projetados para capturar o significado da entrada. É possível usar os embeddings para melhorar a pesquisa semântica usando a pesquisa vetorial.

    Para mais informações, consulte Embeddings de texto e Embeddings multimodais na documentação da IA generativa na Vertex AI.

  • Pesquisa vetorial. O mecanismo de recuperação é uma parte fundamental do seu RAG ou app de pesquisa. A pesquisa de vetores da Vertex AI é uma de recuperação que pode pesquisar em bilhões de objetos semanticamente parecidos ou itens semanticamente relacionados em grande escala, com altas consultas por segundo (QPS), recall, baixa latência e eficiência de custos. Ele pode pesquisar em densos e é compatível com a pesquisa de palavras-chave de incorporação esparsa e a pesquisa híbrida em Acesso antecipado.

    Para mais informações, consulte a Visão geral da pesquisa de vetores da Vertex AI na documentação da Vertex AI.

  • A API de classificação. A API de classificação recebe uma lista de documentos e reclassifica esses documentos com base na relevância dos documentos para uma determinada consulta. Em comparação com incorporações que analisam apenas a semelhança semântica de um documento e uma consulta, a API de classificação pode fornecer uma pontuação mais precisa sobre a capacidade de um documento responder a uma determinada consulta.

    Para mais informações, consulte Classificar e reclassificar documentos.

  • A API de geração embasada. Usar a coluna de codificador-decodificador para gerar respostas bem fundamentadas para uma solicitação do usuário. As fontes de embasamento podem ser seus Armazenamentos de dados da Vertex AI para Pesquisa, dados personalizados fornecidos por você ou Pesquisa Google.

    Para mais informações, consulte Gerar respostas fundamentadas.

  • A API de base para verificação. A API de verificação de fundação determina o nível de fundamentação de um texto em uma determinado conjunto de textos de referência. A API pode gerar citações de suporte de o texto de referência para indicar onde o texto fornecido é suportado pelo textos de referência. Entre outras coisas, a API pode ser usada para avaliar a base das respostas de um sistema RAG. Além disso, como um recurso experimental, a API também gera citações contraditórias que mostram onde o texto e os textos de referência divergem.

    Para mais informações, consulte Verificar o embasamento.

Fluxo de trabalho: gerar respostas fundamentadas com base em dados não estruturados

Confira um fluxo de trabalho que descreve como integrar as APIs RAG da Vertex AI para gerar respostas com base em dados não estruturados.

  1. Importe seus documentos não estruturados, como arquivos PDF, HTML ou imagens com texto, para um local do Cloud Storage.
  2. Processe os documentos importados usando o analisador de layout. O analisador de layout divide os documentos não estruturados em partes e transforma o conteúdo não estruturado em uma representação estruturada dele. O analisador de layout também extrai anotações dos blocos.
  3. Crie embeddings de texto para blocos usando a API Text embeddings da Vertex AI.
  4. Indexe e extraia as embeddings de fragmento usando a Pesquisa vetorial.
  5. Classifique os blocos usando a API de classificação e determine os mais bem classificados pedaços
  6. Gere respostas empíricas com base nas partes mais bem classificadas usando a API de geração empírica.

Se você gerou as respostas usando um modelo de geração de respostas diferente dos modelos do Google, é possível verificar a fundamentação dessas respostas usando o método de verificação de fundamentação.