Descripción general del ajuste de modelos para Gemini

El ajuste de modelos es un proceso fundamental para adaptar Gemini para que realice tareas específicas con mayor precisión y exactitud. El ajuste del modelo proporciona un modelo con un conjunto de datos de entrenamiento que contiene un conjunto de ejemplos de tareas descendentes específicas.

En esta página, se proporciona una descripción general del ajuste de modelos para Gemini, se describen las opciones de ajuste disponibles para Gemini y te ayuda a determinar cuándo se debe usar cada opción de ajuste.

Beneficios del ajuste de modelos

El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y eficiencia del modelo. El ajuste del modelo proporciona los siguientes beneficios:

  • Mayor calidad para tus tareas específicas.
  • Mayor solidez del modelo.
  • Menor latencia y costo de inferencia debido a mensajes más cortos.

Ajuste en comparación con el diseño de mensajes

El ajuste proporciona los siguientes beneficios sobre el diseño de mensajes.

  • Permite una personalización profunda del modelo y da como resultado un mejor rendimiento en tareas específicas.
  • Ofrece resultados más coherentes y confiables.
  • Es capaz de manejar más ejemplos a la vez.

El ajuste eficiente de parámetros

El ajuste eficiente de los parámetros, también llamado ajuste del adaptador, permite una adaptación eficiente de modelos grandes a tus tareas o dominios específicos. El ajuste eficiente de los parámetros actualiza un subconjunto relativamente pequeño de los parámetros del modelo durante el proceso de ajuste.

Para comprender cómo Vertex AI admite el ajuste y la entrega del adaptador, puedes encontrar más detalles en este informe, Adaptación de modelos de base grandes.

El ajuste eficiente de parámetros en comparación con el ajuste completo

El ajuste eficiente de parámetros y el ajuste completo son dos enfoques para personalizar modelos grandes. Ambos métodos tienen sus ventajas e implicaciones en términos de calidad del modelo y eficiencia de recursos.

El ajuste completo actualiza todos los parámetros del modelo, por lo que es adecuado para adaptarlo a tareas altamente complejas, con el potencial de lograr una mayor calidad. Sin embargo, el ajuste completo requiere recursos de procesamiento más altos para el ajuste y la entrega, lo que genera costos generales más altos.

El ajuste eficiente de los parámetros es más eficiente en cuanto a recursos y rentable en comparación con el ajuste completo. Usa recursos de procesamiento significativamente menores para el entrenamiento. Es capaz de adaptar el modelo más rápido con un conjunto de datos más pequeño. La flexibilidad del ajuste eficiente de los parámetros ofrece una solución para el aprendizaje de varias tareas sin la necesidad de un reentrenamiento extenso.

Vertex AI admite el ajuste eficiente de los parámetros y el ajuste completo para diferentes modelos en diferentes situaciones.

Ajusta los modelos de Gemini

Los siguientes modelos de Gemini admiten el ajuste supervisado con el ajuste eficiente de parámetros:

  • gemini-1.0-pro-002

El ajuste supervisado es una buena opción cuando tienes una tarea bien definida con datos etiquetados disponibles. Es particularmente eficaz para aplicaciones específicas de dominio en las que el lenguaje o el contenido difieren de manera significativa de los datos en los que se entrenó el modelo grande en un principio.

El ajuste supervisado adapta el comportamiento del modelo con un conjunto de datos etiquetados. Este proceso ajusta las ponderaciones del modelo para minimizar la diferencia entre sus predicciones y las etiquetas reales. Puede mejorar el rendimiento del modelo para los siguientes tipos de tareas:

  • Clasificación
  • Análisis de opiniones
  • Extracción de entidades
  • Resumen del contenido que no es complejo
  • Escribir consultas específicas de dominio.

Cuota para ajustar modelos de Gemini

La cuota se aplica a la cantidad de trabajos de ajuste simultáneos. Cada proyecto viene con una cuota predeterminada para ejecutar al menos un trabajo de ajuste. Esta es una cuota global que se comparte en todas las regiones disponibles. Si necesitas ejecutar más trabajos de forma simultánea, debes solicitar una cuota adicional para Global concurrent tuning jobs.

¿Qué sigue?