El ajuste de modelos es un proceso fundamental para adaptar Gemini para que realice tareas específicas con mayor precisión y exactitud. El ajuste del modelo proporciona un modelo con un conjunto de datos de entrenamiento que contiene un conjunto de ejemplos de tareas descendentes específicas.
En esta página, se proporciona una descripción general del ajuste de modelos para Gemini, se describen las opciones de ajuste disponibles para Gemini y se ofrece ayuda para determinar cuándo se debería usar cada opción de ajuste.
Beneficios del ajuste de modelos
El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos proporciona los siguientes beneficios:
- Mayor calidad para tus tareas específicas.
- Mayor robustez del modelo
- Menor latencia de inferencia y costo debido a instrucciones más cortas.
Comparación entre el ajuste y el diseño de instrucciones
- Instrucciones con modelos de Gemini previamente entrenados: La creación de instrucciones es el arte de elaborar instrucciones eficaces para guiar a los modelos de IA como Gemini en la generación de los resultados que deseas.
Implica diseñar instrucciones que transmitan claramente la tarea, el formato que deseas y cualquier contexto relevante. Puedes usar las funciones de Gemini con una configuración mínima.
Esto es ideal para lo siguiente:
- Datos etiquetados limitados: Si tienes una pequeña cantidad de datos etiquetados o no puedes permitirte un proceso de ajuste prolongado.
- Prototipado rápido: Cuando necesitas probar un concepto rápidamente, o bien obtener un rendimiento de referencia sin una gran inversión en el ajuste.
- Ajuste personalizado de los modelos de Gemini: Para obtener resultados más personalizados, Gemini te permite ajustar sus modelos en tus conjuntos de datos específicos. Para crear un modelo de IA que se destaque en tu dominio específico, considera ajustarlo. Esto implica volver a entrenar el modelo base con tu propio conjunto de datos etiquetados y adaptar sus pesos a tu tarea y datos. Puedes adaptar Gemini a tus casos de uso. El ajuste es más eficaz en los siguientes casos:
- Tienes datos etiquetados: Un conjunto de datos de gran tamaño para entrenar (piensa en 100 ejemplos o más), que permite que el modelo aprenda en profundidad los detalles de tu tarea.
- Tareas complejas o únicas: Para situaciones en las que las estrategias de instrucciones avanzadas no son suficientes y un modelo adaptado a tus datos es esencial.
Te recomendamos comenzar con instrucciones para encontrar la instrucción óptima. Luego, continúa con el ajuste (si es necesario) para mejorar aún más el rendimiento o corregir los errores recurrentes. Si bien agregar más ejemplos puede ser beneficioso, es importante evaluar dónde el modelo comete errores antes de agregar más datos. Los datos bien etiquetados y de alta calidad son fundamentales para obtener un buen rendimiento, y esto es más importante que tener una gran cantidad de datos. Además, los datos que usas para el ajuste deben reflejar la distribución, el formato y el contexto de la instrucción que el modelo encontrará en la producción.
El ajuste proporciona los siguientes beneficios en comparación con el diseño de instrucciones:
- Permite una personalización profunda del modelo y genera un mejor rendimiento en tareas específicas.
- Alinea el modelo con la sintaxis, las instrucciones y las reglas semánticas específicas del dominio personalizadas.
- Ofrece resultados más coherentes y confiables.
- Puede manejar más ejemplos a la vez.
- Ahorra costos en la inferencia quitando ejemplos e instrucciones largas en las instrucciones
Enfoques de ajuste
El ajuste eficiente de parámetros y el ajuste completo son dos enfoques para la personalización de modelos grandes. Ambos métodos tienen sus ventajas e implicaciones en términos de calidad del modelo y eficiencia de los recursos.
El ajuste eficiente de parámetros
El ajuste eficiente de parámetros, también llamado ajuste del adaptador, permite una adaptación eficiente de grandes modelos a tus tareas o dominios específicos. El ajuste eficiente de parámetros actualiza un subconjunto relativamente pequeño de parámetros del modelo durante el proceso de ajuste.
Para comprender cómo Vertex AI admite el ajuste y la entrega del adaptador, puedes encontrar más detalles en este informe, Adaptación de modelos de base grandes.
Ajuste completo
El ajuste completo actualiza todos los parámetros del modelo, lo que lo hace adecuado para adaptar el modelo a tareas muy complejas, con el potencial de lograr una mayor calidad. Sin embargo, el ajuste completo requiere recursos de procesamiento más altos para el ajuste y la entrega, lo que genera costos generales más altos.
Comparación entre el ajuste eficiente de parámetros y el ajuste completo
El ajuste eficiente de los parámetros es más eficiente en cuanto a recursos y rentable en comparación con el ajuste completo. Usa recursos de procesamiento mucho más bajos para entrenar. Puede adaptar el modelo más rápido con un conjunto de datos más pequeño. La flexibilidad del ajuste eficiente de los parámetros ofrece una solución para el aprendizaje multitarea sin la necesidad de un reentrenamiento extenso.
Métodos de ajuste admitidos
Vertex AI admite el ajuste supervisado para personalizar los modelos de base.
Ajuste supervisado
El ajuste supervisado mejora el rendimiento del modelo, ya que le enseña una habilidad nueva. Los datos que contienen cientos de ejemplos etiquetados se usan para enseñarle al modelo a imitar un comportamiento o una tarea deseados. Cada ejemplo etiquetado demuestra lo que deseas que el modelo genere durante la inferencia.
Cuando ejecutas un trabajo de ajuste supervisado, el modelo aprende parámetros adicionales que lo ayudan a codificar la información necesaria para realizar la tarea deseada o aprender el comportamiento deseado. Estos parámetros se usan durante la inferencia. El resultado del trabajo de ajuste es un modelo nuevo que combina los parámetros recién aprendidos con el modelo original.
El ajuste supervisado de un modelo de texto es una buena opción cuando el resultado de tu modelo no es complejo y es relativamente fácil de definir. Se recomienda el ajuste supervisado para la clasificación, el análisis de opiniones, la extracción de entidades, el resumen del contenido que no es complejo y la escritura de consultas específicas del dominio. Para los modelos de código, la única opción es el ajuste supervisado.
Modelos que admiten el ajuste supervisado
gemini-1.5-pro-002
(En DG)gemini-1.5-flash-002
(En DG)gemini-1.0-pro-002
(en versión preliminar, solo admite el ajuste de texto)
Para obtener más información sobre el uso del ajuste supervisado con cada modelo respectivo, consulta las siguientes páginas: Ajusta los tipos de datos de texto, imagen, audio y documento.
¿Qué sigue?
- Para obtener más información sobre la capacidad de comprensión de documentos de los modelos de Gemini, consulta la descripción general de Comprensión de documentos.
- Para comenzar a ajustar, consulta Ajusta los modelos de Gemini con el ajuste supervisado.
- Para obtener información sobre cómo se puede usar el ajuste supervisado en una solución que compila una base de conocimiento de IA generativa, consulta Solución de inicio rápido: base de conocimiento de IA generativa.