Ajuste de documentos

En esta página, se proporcionan los requisitos previos y las instrucciones detalladas para ajustar Gemini en datos de documentos con el aprendizaje supervisado.

Casos de uso

El ajuste fino te permite personalizar modelos de lenguaje potentes para tus necesidades específicas. Estos son algunos casos de uso clave en los que el ajuste fino con tu propio conjunto de archivos PDF puede mejorar significativamente el rendimiento de un modelo:

  • Base de conocimiento interna: Convierte tus documentos internos en una base de conocimiento potenciada por IA que proporcione respuestas y estadísticas instantáneas. Por ejemplo, un representante de ventas podría acceder de inmediato a las especificaciones de los productos y los detalles de los precios de los materiales de capacitación anteriores.
  • Asistente de investigación: Crea un asistente de investigación capaz de analizar una colección de artículos de investigación, artículos y libros. Un investigador que estudia el cambio climático podría analizar rápidamente artículos científicos para identificar tendencias en el aumento del nivel del mar o evaluar la eficacia de diferentes estrategias de mitigación.
  • Cumplimiento legal o regulatorio: El perfeccionamiento de los documentos legales puede ayudar a automatizar la revisión de contratos y marcar posibles inconsistencias o áreas de riesgo. Esto permite que los profesionales legales se enfoquen en tareas de nivel superior y, al mismo tiempo, garanticen el cumplimiento.
  • Generación automática de informes: Automatiza el análisis de informes financieros complejos, extrae indicadores clave de rendimiento y genera resúmenes para las partes interesadas. Esto puede ahorrar tiempo y reducir el riesgo de errores en comparación con el análisis manual.
  • Resumen y análisis de contenido: Resume documentos PDF extensos, extrae estadísticas clave y analiza tendencias. Por ejemplo, un equipo de investigación de mercado podría analizar una colección de encuestas de clientes para identificar temas y opiniones clave.
  • Comparación de documentos y control de versiones: Compara diferentes versiones de un documento para identificar los cambios y hacer un seguimiento de las revisiones. Esto puede ser especialmente útil en entornos colaborativos en los que varios autores contribuyen a un documento.

Limitaciones

  • Cantidad máxima de páginas por ejemplo: 16
  • Cantidad máxima de archivos PDF por ejemplo: 4
  • Tamaño máximo del archivo PDF: 20 MB

Para obtener más información sobre los requisitos de comprensión de documentos, consulta Comprensión de documentos.

Formato del conjunto de datos

El siguiente es un ejemplo de un conjunto de datos de documentos.

Para ver el ejemplo de formato genérico, consulta Ejemplo de conjunto de datos para Gemini 1.5 Pro y Gemini 1.5 Flash.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist.Please summarize the given document."
        }
      ]
    }, 
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 1.5 Pro, a multimodal AI model developed by Google DeepMind. The report positions Gemini 1.5 Pro as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

¿Qué sigue?