Diseñar peticiones

En esta página se describe cómo diseñar peticiones eficaces para los modelos de texto y multimodales de Gemini. Si diseñas tus peticiones con cuidado y ajustas los parámetros del modelo, puedes guiar a los modelos de Gemini para que produzcan resultados de alta calidad, relevantes y creativos.

Para obtener más información sobre cómo diseñar peticiones, consulta la descripción general de las estrategias de peticiones en la documentación de Google Cloud .

Diseñar peticiones de texto

Las peticiones de texto son la forma principal de interactuar con los modelos de Gemini. Una petición de texto bien elaborada puede guiar al modelo para que genere resultados relevantes y de alta calidad. A continuación, se indican algunas prácticas recomendadas para diseñar peticiones de texto:

  • Sé claro y conciso: evita la ambigüedad y la complejidad innecesaria.
  • Proporciona contexto: ofrece al modelo la información general que necesita para entender tu petición.
  • Especifica el resultado esperado: indica al modelo qué tipo de respuesta quieres (por ejemplo, un resumen, una lista o un poema).
  • Usa palabras clave: incluye palabras clave relevantes para ayudar al modelo a centrarse en el tema adecuado.
  • Experimenta con diferentes enfoques: prueba diferentes estilos y longitudes de peticiones para ver qué funciona mejor.

Tareas habituales de peticiones de texto

Puedes crear peticiones de texto para gestionar cualquier cantidad de tareas que se puedan organizar en las siguientes categorías:

  • Clasificación: asigna una etiqueta o una categoría a un fragmento de texto.
  • Resumen: condensa un texto más largo en un resumen más corto.
  • Extracción: extrae información específica de un texto.

Diseña peticiones multimodales

Las peticiones multimodales combinan texto con otras modalidades, como imágenes o audio, para proporcionar información más completa a los modelos de Gemini y permitir interacciones más complejas y matizadas. A continuación, se indican algunas prácticas recomendadas para diseñar peticiones multimodales:

  • Elige las modalidades adecuadas: selecciona las modalidades que sean relevantes para la tarea y complementen la petición de texto.
  • Alinea las modalidades: asegúrate de que las diferentes modalidades transmitan información coherente.
  • Ten en cuenta el orden: el orden en el que presentes las modalidades afectará al resultado del modelo.
  • Usa el formato adecuado: da formato a la petición de forma que el modelo pueda entenderla.

Ajustar parámetros

Puedes ajustar los parámetros para controlar la respuesta de un modelo de Gemini:

  • Máximo de tokens: determina el número máximo de tokens que puede generar el modelo en la respuesta. Los valores más bajos corresponden a respuestas más cortas, mientras que los valores más altos generan respuestas potencialmente más largas. Un token tiene aproximadamente cuatro caracteres.
  • Temperatura: controla la aleatoriedad de la salida. Las temperaturas más altas producen resultados más creativos e impredecibles, mientras que las temperaturas más bajas producen resultados más deterministas y conservadores.
  • Top-P: cambia la forma en que el modelo selecciona los tokens de salida y limita el vocabulario del modelo a un subconjunto de tokens con la probabilidad acumulada que definas.

Para obtener más información sobre los parámetros que puede ajustar, consulte Experimentar con parámetros y Parámetros de la API.

Siguientes pasos