¿Qué es la generación mejorada por recuperación (RAG)?

RAG (generación aumentada de recuperación) es un framework de IA que combina las fortalezas de los sistemas tradicionales de recuperación de información (como las bases de datos) con las capacidades de los modelos de lenguaje grandes (LLM) generativos.Al combinar este conocimiento adicional con sus propias habilidades lingüísticas, la IA puede escribir texto más preciso, actualizado y relevante para tus necesidades específicas.

Bases para Gemini con Vertex AI Search y RAG DIY

¿Cómo funciona la generación mejorada por recuperación?

Las RAG operan con algunos pasos principales para ayudar a mejorar los resultados de la IA generativa: 

  • Recuperación y procesamiento previo: Las RAG aprovechan algoritmos de búsqueda potentes para realizar consultas en datos externos, como páginas web, bases de conocimiento y bases de datos. Una vez recuperada, la información relevante se somete a un procesamiento previo, lo que incluye la tokenización, la lematización y la eliminación de palabras irrelevantes.
  • Generación: la información recuperada preprocesada se incorpora sin problemas al LLM previamente capacitado. Esta integración mejora el contexto del LLM y le proporciona una comprensión más integral del tema. Este contexto aumentado permite que el LLM genere respuestas más precisas, informativas y atractivas. 

La RAG funciona recuperando primero información relevante de una base de datos a través de una consulta generada por el LLM. Luego, esta información recuperada se integra en la entrada de la consulta del LLM, lo que le permite generar texto más preciso y relevante según el contexto. La RAG aprovecha las bases de datos vectoriales, que almacenan los datos de una forma que facilita una búsqueda y recuperación eficientes.

¿Por qué usar RAV?

RAG ofrece varias ventajas sobre los métodos tradicionales de generación de texto, especialmente cuando se trata de información fáctica o respuestas basadas en datos. Estas son algunas de las razones clave por las que puede ser beneficioso usar RAG:

Acceso a información actualizada

Los LLMs tradicionales suelen limitarse a su conocimiento y datos previamente entrenados. Esto podría generar respuestas potencialmente desactualizadas o imprecisas. Para superar esto, RAG otorga a los LLMs acceso a fuentes de información externas y garantiza respuestas precisas y actualizadas.

Fundamentación basada en hechos

Los LLMs son herramientas poderosas para generar texto creativo y atractivo, pero a veces pueden tener dificultades con la exactitud fáctica. Esto se debe a que los LLMs se entrenan con cantidades enormes de datos de texto, que pueden contener imprecisiones o sesgos.

RAG ayuda a abordar este problema proporcionando a los LLMs acceso a una base de conocimiento seleccionada, lo que garantiza que el texto generado se base en información fáctica. Esto hace que RAG sea particularmente valioso para aplicaciones en las que la precisión es primordial, como la cobertura de noticias, redacción científica o atención al cliente.

Nota: RAG también puede ayudar a evitar que se envíen alucinaciones al usuario final. El LLM seguirá generando soluciones ocasionalmente cuando su entrenamiento sea incompleto, pero la técnica de RAG ayuda a mejorar la experiencia del usuario.

Relevancia contextual

El mecanismo de recuperación en la RAG garantiza que la información recuperada sea relevante para la consulta o el contexto de entrada.

Cuando se proporciona información contextualmente relevante al LLM, la RAG ayuda al modelo a generar respuestas más coherentes y alineadas con el contexto dado.

Esta base contextual ayuda a reducir la generación de respuestas irrelevantes o descontextualizadas.

Coherencia fáctica

La RAG incentiva al LLM a generar respuestas coherentes con la información fáctica recuperada.

A través del acondicionamiento del proceso de generación según el conocimiento recuperado, la RAG ayuda a minimizar las contradicciones y las incoherencias en el texto generado.

Esto promueve la coherencia fáctica y reduce la probabilidad de generar información falsa o engañosa.

Utiliza bases de datos vectoriales

Las RAG aprovechan las bases de datos vectoriales para recuperar eficazmente documentos relevantes. Las bases de datos de vectores almacenan documentos como vectores en un espacio de alta dimensión, lo que permite una recuperación rápida y precisa basada en la similitud semántica.

Precisión de respuesta mejorada

Las RAG complementan a los LLM, ya que les proporcionan información contextualmente relevante. Luego, los LLMs pueden usar esta información para generar respuestas más coherentes, informativas y precisas, incluidos los modelos multimodales.

RAG y chatbots

Las RAG pueden integrarse en un sistema de chatbots para mejorar sus habilidades de conversación. Mediante el acceso a información externa, los chatbots con tecnología de RAG ayudan a aprovechar el conocimiento externo para proporcionar respuestas más integrales, informativas y contextuales, lo que mejora la experiencia general del usuario.

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud