Introducción al ajuste

El ajuste de modelos es un proceso crucial para adaptar Gemini a tareas específicas con mayor precisión. El ajuste de modelos funciona proporcionando a un modelo un conjunto de datos de entrenamiento que contiene un conjunto de ejemplos de tareas específicas posteriores.

En esta página se ofrece una descripción general del ajuste de modelos de Gemini, se describen las opciones de ajuste disponibles para Gemini y se explica cuándo se debe usar cada opción de ajuste.

Ventajas del ajuste de modelos

El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos ofrece las siguientes ventajas:

  • Mayor calidad para tus tareas específicas
  • Mayor solidez del modelo
  • Menor latencia y coste de inferencia gracias a las peticiones más cortas

Ajuste en comparación con el diseño de peticiones

  • Crear peticiones con modelos de Gemini preentrenados: crear peticiones es el arte de redactar instrucciones eficaces para guiar a modelos de IA como Gemini a la hora de generar los resultados que quieres. Implica diseñar peticiones que transmitan claramente la tarea, el formato que quieres y cualquier contexto relevante. Puedes usar las funciones de Gemini con una configuración mínima. Es más adecuada para:
    • Datos etiquetados limitados: si tienes una cantidad pequeña de datos etiquetados o no puedes permitirte un proceso de ajuste prolongado.
    • Creación rápida de prototipos: cuando necesites probar rápidamente un concepto u obtener un rendimiento de referencia sin invertir mucho en la optimización.
  • Ajuste personalizado de los modelos de Gemini: para obtener resultados más adaptados, Gemini te permite ajustar sus modelos en tus conjuntos de datos específicos. Para crear un modelo de IA que destaque en tu dominio específico, considera la posibilidad de optimizarlo. Esto implica volver a entrenar el modelo base con tu propio conjunto de datos etiquetado, adaptando sus pesos a tu tarea y datos. Puedes adaptar Gemini a tus casos prácticos. El ajuste fino es más eficaz cuando:
    • Tienes datos etiquetados: un conjunto de datos considerable para entrenar (unos 100 ejemplos o más), lo que permite que el modelo aprenda en profundidad los detalles de tu tarea.
    • Tareas complejas o únicas: en situaciones en las que las estrategias de peticiones avanzadas no son suficientes y es esencial un modelo adaptado a tus datos.

Te recomendamos que empieces con las peticiones para encontrar la óptima. Después, pasa a la fase de ajuste (si es necesario) para mejorar aún más el rendimiento o corregir errores recurrentes. Aunque añadir más ejemplos puede ser útil, es importante evaluar dónde comete errores el modelo antes de añadir más datos. Para obtener un buen rendimiento, es fundamental que los datos sean de alta calidad y estén bien etiquetados. Esto es más importante que la cantidad. Además, los datos que uses para el ajuste fino deben reflejar la distribución, el formato y el contexto de las peticiones que el modelo encontrará en producción.

El ajuste ofrece las siguientes ventajas con respecto al diseño de peticiones:

  • Permite personalizar el modelo en profundidad y ofrece un mejor rendimiento en tareas específicas.
  • Alinear el modelo con la sintaxis personalizada, las instrucciones y las reglas semánticas específicas del dominio.
  • Ofrece resultados más coherentes y fiables.
  • Capaz de gestionar más ejemplos a la vez.
  • Ahorra costes en la inferencia eliminando ejemplos de pocos disparos e instrucciones largas en las peticiones

Estrategias de ajuste

El ajuste eficiente de parámetros y el ajuste fino completo son dos enfoques para personalizar modelos grandes. Ambos métodos tienen sus ventajas e implicaciones en términos de calidad del modelo y eficiencia de los recursos.

Ajuste eficiente de parámetros

El ajuste eficiente de parámetros, también llamado ajuste de adaptadores, permite adaptar de forma eficiente modelos grandes a tus tareas o dominio específicos. El ajuste eficiente de parámetros actualiza un subconjunto relativamente pequeño de los parámetros del modelo durante el proceso de ajuste.

Para saber cómo admite Vertex AI el ajuste y el servicio de adaptadores, consulta el siguiente informe técnico: Adaptación de modelos básicos grandes.

Afinamiento completo

El ajuste completo actualiza todos los parámetros del modelo, por lo que es adecuado para adaptar el modelo a tareas muy complejas, con el potencial de lograr una mayor calidad. Sin embargo, el ajuste fino completo requiere más recursos computacionales tanto para el ajuste como para el servicio, lo que conlleva un aumento de los costes generales.

Ajuste eficiente de parámetros en comparación con el ajuste fino completo

El ajuste eficiente de parámetros es más eficiente en cuanto a recursos y más rentable que el ajuste fino completo. Utiliza muchos menos recursos computacionales para entrenar. Puede adaptar el modelo más rápido con un conjunto de datos más pequeño. La flexibilidad del ajuste eficiente de parámetros ofrece una solución para el aprendizaje multitarea sin necesidad de volver a entrenar los modelos de forma exhaustiva.

Métodos de ajuste admitidos

Vertex AI admite el ajuste fino supervisado para personalizar modelos fundacionales.

Afinamiento supervisado

El ajuste fino supervisado mejora el rendimiento del modelo enseñándole una nueva habilidad. Los datos que contienen cientos de ejemplos etiquetados se usan para enseñar al modelo a imitar un comportamiento o una tarea deseados. Cada ejemplo etiquetado muestra lo que quieres que el modelo genere durante la inferencia.

Cuando ejecutas un trabajo de ajuste fino supervisado, el modelo aprende parámetros adicionales que le ayudan a codificar la información necesaria para realizar la tarea deseada o aprender el comportamiento deseado. Estos parámetros se usan durante la inferencia. El resultado del trabajo de ajuste es un nuevo modelo que combina los parámetros recién aprendidos con el modelo original.

El ajuste fino supervisado de un modelo de texto es una buena opción cuando el resultado del modelo no es complejo y es relativamente fácil de definir. Se recomienda el ajuste fino supervisado para la clasificación, el análisis de sentimiento, la extracción de entidades, el resumen de contenido que no sea complejo y la escritura de consultas específicas de un dominio. En el caso de los modelos de código, el ajuste supervisado es la única opción.

Modelos que admiten el ajuste fino supervisado

Los siguientes modelos de Gemini admiten el ajuste supervisado:

Para obtener más información sobre cómo usar el ajuste fino supervisado con cada modelo, consulta las siguientes páginas: Ajustar datos de texto, imagen, audio y documento.

Limitaciones

El ajuste fino supervisado tiene las siguientes limitaciones:

  • La optimización no es un Servicio Cubierto y está excluida del OLS de ningún Acuerdo de Nivel de Servicio.

Siguientes pasos