Acerca del ajuste supervisado para los modelos de Gemini

El ajuste supervisado es una buena opción cuando tienes una tarea bien definida con datos etiquetados disponibles. Es particularmente eficaz para aplicaciones específicas de dominio en las que el lenguaje o el contenido difieren de manera significativa de los datos en los que se entrenó el modelo grande en un principio.

El ajuste supervisado adapta el comportamiento del modelo con un conjunto de datos etiquetado. Este proceso ajusta las ponderaciones del modelo para minimizar la diferencia entre sus predicciones y las etiquetas reales. Por ejemplo, puede mejorar el rendimiento del modelo para los siguientes tipos de tareas:

Clasificación
Resúmenes
Búsqueda de respuestas de extracción
Chat

Modelos compatibles

Los siguientes modelos de base de Gemini admiten la optimización supervisada:

gemini-1.0-pro-002

Casos de uso para usar ajustes supervisados en modelos de texto

Los modelos de texto base funcionan bien cuando el resultado o la tarea esperados se pueden definir de forma clara y concisa en un mensaje y el mensaje produce el resultado esperado de manera coherente. Si deseas que un modelo aprenda algo específico o que se desvíe de los patrones generales de lenguaje, deberías considerar ajustar ese modelo. Por ejemplo, puedes usar el ajuste de modelos para enseñarle al modelo lo siguiente:

Estructuras o formatos específicos para generar salidas.
Comportamientos específicos, como cuándo proporcionar una salida tersa o verbosa.
Salidas específicas personalizadas para tipos específicos de entradas.

Los siguientes ejemplos son casos prácticos que son difíciles de capturar solo con instrucciones rápidas:

Clasificación: La respuesta esperada es una palabra o frase específica.

Instrucción: Clasifica el siguiente texto en una de las siguientes clases: [empresa, entretenimiento]. Texto: Diversifica tu cartera de inversión

Respuesta: empresa

El ajuste del modelo puede ayudar a evitar que el modelo genere respuestas detalladas.

Resumen: El resumen sigue un formato específico. Por ejemplo, es posible que debas quitar la información de identificación personal (PII) de un resumen de chat.

Instrucción: Resumen: Jessica: Suena excelente. Nos vemos en la plaza de Armas. Alex: Nos vemos a las 10.

Respuesta: #Persona1 y #Persona2 acuerdan reunirse en la plaza de Armas a las 10:00 a.m.

Este formato de reemplazo de los nombres de los interlocutores con #Person1 y #Person2 es difícil de describir y el modelo de base podría no producir esa respuesta de forma natural.

Respuestas extractivas: La pregunta se relaciona con un contexto, y la respuesta es una substring del contexto.

Instrucción: Existen pruebas de que, en los últimos 21,000 años hasta el Último Máximo Glacial (LGM) y la siguiente desglaciación, hubo cambios significativos en la vegetación de la selva tropical amazónica. Pregunta: ¿Qué significa LGM?

Respuesta: Último Máximo Glacial

La respuesta "Último máximo glacial" (Last Glacial Maximum) es una frase específica del contexto.

Chat: Necesitas personalizar la respuesta del modelo para seguir a una persona, un rol o un carácter.

Instrucción: Usuario: ¿Cómo está el clima hoy?

Respuesta: Asistente: Como comerciante virtual de Organización de ejemplo, solo puedo ayudarte con las compras y el envío.

También puedes ajustar un modelo en las siguientes situaciones:

Los mensajes no producen los resultados esperados de forma coherente.
La tarea es demasiado complicada para definirla en una instrucción. Por ejemplo, deseas que el modelo clone el comportamiento para un comportamiento que es difícil de articular en una instrucción.
Tienes intuiciones complejas sobre una tarea que son fáciles de obtener, pero difíciles de formalizar en una instrucción.
Quieres quitar la longitud de contexto para quitar los ejemplos de tomas.

Cuota

La cuota se aplica a la cantidad de trabajos de ajuste simultáneos. Cada proyecto viene con una cuota predeterminada para ejecutar al menos un trabajo de ajuste. Esta es una cuota global, compartida en todas las regiones disponibles. Si necesitas ejecutar más trabajos de forma simultánea, debes solicitar una cuota adicional para Global concurrent tuning jobs.

Precios

El ajuste supervisado de gemini-1.0-pro-002 se encuentra en Vista previa.

Mientras el ajuste se encuentra en versión preliminar, no se cobra por ajustar un modelo.
Después de ajustar un modelo, se aplican los costos de inferencia para el modelo ajustado. Los precios de inferencia son los mismos para cada versión estable de Gemini 1.0 Pro.

Para obtener más información, consulta los precios de Vertex AI y las versiones disponibles de modelos estables de Gemini.

¿Qué sigue?

Prepara un conjunto de datos de ajuste supervisado