Diseña instrucciones

En esta página, se describe cómo diseñar instrucciones eficaces para los modelos de Gemini de texto y multimodales. Si diseñas tus instrucciones con cuidado y ajustas los parámetros del modelo, puedes guiar a los modelos de Gemini para que produzcan resultados creativos, pertinentes y de alta calidad.

Para obtener más información sobre el diseño de instrucciones, consulta Descripción general de las estrategias de instrucciones en la documentación de Google Cloud .

Diseña instrucciones de texto

Las instrucciones de texto son la principal forma de interactuar con los modelos de Gemini. Una instrucción de texto bien elaborada puede guiar al modelo para que genere resultados pertinentes y de alta calidad. Estas son algunas prácticas recomendadas para diseñar instrucciones de texto:

  • Sé claro y conciso: Evita la ambigüedad y la complejidad innecesaria.
  • Proporciona contexto: Bríndale al modelo la información general que necesita para comprender tu solicitud.
  • Especifica el resultado esperado: Dile al modelo qué tipo de respuesta quieres (por ejemplo, un resumen, una lista o un poema).
  • Usa palabras clave: Incluye palabras clave pertinentes para ayudar al modelo a enfocarse en el tema correcto.
  • Experimenta con diferentes enfoques: Prueba diferentes estilos y longitudes de instrucciones para ver qué funciona mejor.

Tareas comunes de instrucciones de texto

Puedes crear instrucciones de texto para controlar cualquier cantidad de tareas que se pueden organizar en las siguientes categorías:

  • Clasificación: Asigna una etiqueta o categoría a un fragmento de texto.
  • Resúmenes: Condensa un texto más largo en un resumen más corto.
  • Extracción: Extrae información específica de un texto.

Diseña prompts multimodales

Las instrucciones multimodales combinan texto con otras modalidades, como imágenes o audio, para proporcionar una entrada más enriquecida a los modelos de Gemini y permitir interacciones más complejas y matizadas. Estas son algunas prácticas recomendadas para diseñar instrucciones multimodales:

  • Elige las modalidades adecuadas: Selecciona las modalidades que sean pertinentes para la tarea y complementen la instrucción de texto.
  • Alinea las modalidades: Asegúrate de que las diferentes modalidades transmitan información coherente.
  • Considera el orden: El orden en el que presentas las modalidades afecta el resultado del modelo.
  • Usa el formato adecuado: Formatea la instrucción de manera que el modelo pueda comprenderla.

Ajusta los parámetros

Puedes ajustar los parámetros para controlar el resultado de un modelo de Gemini:

  • Tokens máximos: Determina la cantidad máxima de tokens que el modelo puede generar en la respuesta. Los valores más bajos son para respuestas más cortas, y los valores más altos generan respuestas potencialmente más largas. Un token tiene aproximadamente cuatro caracteres.
  • Temperatura: Controla la aleatoriedad del resultado. Las temperaturas más altas producen resultados más creativos e impredecibles, mientras que las temperaturas más bajas producen resultados más determinísticos y conservadores.
  • Top-P: Cambia la manera en la que el modelo selecciona los tokens para el resultado y limita el vocabulario del modelo a un subconjunto de tokens con la probabilidad acumulativa que definas.

Para obtener más información sobre los parámetros que puedes ajustar, consulta Experimenta con parámetros y Parámetros de la API.

¿Qué sigue?