Descripción general del ajuste de modelos para Gemini

El ajuste de modelos es un proceso fundamental para adaptar Gemini para que realice tareas específicas con mayor precisión y exactitud. El ajuste del modelo proporciona un modelo con un conjunto de datos de entrenamiento que contiene un conjunto de ejemplos de tareas descendentes específicas.

En esta página, se proporciona una descripción general del ajuste de modelos para Gemini, se describen las opciones de ajuste disponibles para Gemini y se ofrece ayuda para determinar cuándo se debería usar cada opción de ajuste.

Beneficios del ajuste de modelos

El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos proporciona los siguientes beneficios:

Mayor calidad para tus tareas específicas.
Mayor robustez del modelo.
Menor latencia de inferencia y costo debido a instrucciones más cortas.

Ajuste frente al diseño de instrucciones

El ajuste ofrece los siguientes beneficios en comparación con el diseño de instrucciones.

Permite una personalización profunda del modelo y genera un mejor rendimiento en tareas específicas.
Ofrece resultados más coherentes y confiables.
Es capaz de manejar más ejemplos a la vez.

Enfoques de ajuste

El ajuste eficiente de parámetros y el ajuste completo son dos enfoques para la personalización de modelos grandes. Ambos métodos tienen sus ventajas e implicaciones en términos de calidad del modelo y eficiencia de los recursos.

El ajuste eficiente de parámetros

El ajuste eficiente de parámetros, también llamado ajuste del adaptador, permite una adaptación eficiente de grandes modelos a tus tareas o dominios específicos. El ajuste eficiente de parámetros actualiza un subconjunto relativamente pequeño de parámetros del modelo durante el proceso de ajuste.

Para comprender cómo Vertex AI admite el ajuste y la entrega del adaptador, puedes encontrar más detalles en este informe, Adaptación de modelos de base grandes.

Ajuste completo

El ajuste completo actualiza todos los parámetros del modelo, lo que lo hace adecuado para adaptar el modelo a tareas muy complejas, con el potencial de lograr una mayor calidad. Sin embargo, el ajuste completo requiere recursos de procesamiento más altos para el ajuste y la entrega, lo que genera costos generales más altos.

El ajuste eficiente de parámetros en comparación con el ajuste completo

El ajuste eficiente de los parámetros es más eficiente en cuanto a recursos y rentable en comparación con el ajuste completo. Usa recursos de procesamiento significativamente menores para su entrenamiento. Puede adaptar el modelo más rápido con un conjunto de datos más pequeño. La flexibilidad del ajuste eficiente de los parámetros ofrece una solución para el aprendizaje multitarea sin la necesidad de un reentrenamiento extenso.

Ajusta modelos de Gemini

Los modelos de Gemini (gemini-1.0-pro-002) admiten los siguientes métodos de ajuste:

Ajuste supervisado (eficiente de parámetros)

El ajuste supervisado para los modelos de Gemini mejora el rendimiento del modelo, ya que le enseña una nueva habilidad. Los datos que contienen cientos de ejemplos etiquetados se usan para enseñarle al modelo a imitar un comportamiento o una tarea deseados. Cada ejemplo etiquetado demuestra lo que deseas que el modelo genere durante la inferencia.

El ajuste supervisado es ideal cuando tienes una tarea bien definida con datos etiquetados disponibles. El ajuste supervisado adapta el comportamiento del modelo con un conjunto de datos etiquetado. Este proceso ajusta las ponderaciones del modelo para minimizar la diferencia entre sus predicciones y las etiquetas reales.

Cuota

La cuota se aplica a la cantidad de trabajos de ajuste simultáneos. Cada proyecto viene con una cuota predeterminada para ejecutar al menos un trabajo de ajuste. Esta es una cuota global, compartida en todas las regiones disponibles. Si necesitas ejecutar más trabajos de forma simultánea, debes solicitar una cuota adicional para Global concurrent tuning jobs.

Precios

El ajuste supervisado para gemini-1.0-pro-002 está en versión preliminar.

Mientras el ajuste se encuentra en versión preliminar, no se cobra por ajustar un modelo.
Después de ajustar un modelo, se siguen aplicando los costos de inferencia para el modelo ajustado. Los precios de inferencia son los mismos para cada versión estable de Gemini 1.0 Pro.

Para obtener más información, consulta Precios de Vertex AI y Versiones de modelos estables de Gemini disponibles.

¿Qué sigue?

Para obtener información sobre cómo preparar datos de ajuste, consulta Prepara datos de ajuste supervisado.
Para obtener información sobre cómo se puede usar el ajuste supervisado en una solución que compila una base de conocimiento de IA generativa, consulta Solución de inicio rápido: base de conocimiento de IA generativa.