Ajuste de documentos

En esta página se describen los requisitos previos y las instrucciones detalladas para ajustar Gemini con datos de documentos mediante el aprendizaje supervisado.

Casos prácticos

El ajuste fino te permite personalizar modelos de lenguaje potentes para adaptarlos a tus necesidades específicas. Estos son algunos casos prácticos clave en los que el ajuste fino con tu propio conjunto de PDFs puede mejorar significativamente el rendimiento de un modelo:

  • Base de conocimientos interna: convierte tus documentos internos en una base de conocimientos basada en IA que proporcione respuestas y estadísticas al instante. Por ejemplo, un representante de ventas podría acceder al instante a las especificaciones de los productos y a los detalles de los precios de materiales de formación anteriores.
  • Asistente de investigación: crea un asistente de investigación capaz de analizar una colección de artículos, libros y documentos de investigación. Un investigador que estudie el cambio climático podría analizar rápidamente artículos científicos para identificar tendencias en el aumento del nivel del mar o evaluar la eficacia de diferentes estrategias de mitigación.
  • Cumplimiento de la legislación o de las normativas: el ajuste fino en documentos legales puede ayudar a automatizar la revisión de contratos y a detectar posibles incoherencias o áreas de riesgo. De esta forma, los profesionales del ámbito jurídico pueden centrarse en tareas de mayor nivel y, al mismo tiempo, cumplir las normativas.
  • Generación de informes automatizada: automatiza el análisis de informes financieros complejos, extrae indicadores clave de rendimiento y genera resúmenes para las partes interesadas. De esta forma, se puede ahorrar tiempo y reducir el riesgo de errores en comparación con el análisis manual.
  • Resumen y análisis de contenido: resume documentos PDF extensos, extrae información valiosa y analiza tendencias. Por ejemplo, un equipo de investigación de mercado podría analizar una colección de encuestas a clientes para identificar temas y sentimientos clave.
  • Comparación de documentos y control de versiones: compara diferentes versiones de un documento para identificar los cambios y hacer un seguimiento de las revisiones. Esto puede ser especialmente útil en entornos de colaboración en los que varios autores contribuyen a un documento.

Limitaciones

Modelos de Gemini 2.5

Especificaciones Valor
Número máximo de páginas PDF por ejemplo 300
Número máximo de archivos PDF por ejemplo 4
Tamaño máximo del archivo PDF 20 MB

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Especificaciones Valor
Número máximo de páginas PDF por ejemplo 300
Número máximo de archivos PDF por ejemplo 4
Tamaño máximo del archivo PDF 20 MB

Para obtener más información sobre los requisitos de la interpretación de documentos, consulta Interpretación de documentos.

Formato del conjunto de datos

El fileUri de tu conjunto de datos puede ser el URI de un archivo de un segmento de Cloud Storage o una URL HTTP o HTTPS disponible públicamente.

Para ver un ejemplo de formato genérico, consulta Ejemplo de conjunto de datos para Gemini.

A continuación, se muestra un ejemplo de un conjunto de datos de documentos.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

Siguientes pasos