Usa una estrategia de instrucciones

Las estrategias de ingeniería de instrucciones son fundamentales para obtener los resultados esperados y maximizar el rendimiento del modelo. En esta página, se proporciona una descripción general de las estrategias clave de instrucciones para interactuar con los modelos de IA generativa, en particular, Gemini.

Para obtener más información sobre las estrategias de instrucciones, consulta Descripción general de las estrategias de instrucciones en la documentación de Google Cloud .

Conceptos básicos del diseño de instrucciones

Una instrucción es la entrada principal de un modelo de IA generativa, que le indica que produzca un resultado específico. Las instrucciones pueden variar desde consultas simples hasta instrucciones complejas de varias partes que incorporan contexto, ejemplos y requisitos específicos de formato de salida.

A continuación, se incluyen consideraciones clave para generar instrucciones eficaces:

  • Proporciona instrucciones claras y específicas: Cuando diseñes instrucciones, es fundamental que seas claro y específico sobre lo que quieres que haga el modelo. Las instrucciones ambiguas o vagas pueden generar resultados inesperados y, posiblemente, irrelevantes. Por ejemplo, en lugar de pedirle que escriba un poema, una instrucción más específica sería "Escribe un poema corto sobre la belleza de la naturaleza al estilo de Robert Frost". Además, proporcionar contexto ayuda al modelo a comprender la tarea esperada y generar respuestas pertinentes.
  • Desglosa las tareas complejas: Para las tareas complejas, suele ser útil desglosar la instrucción en subtareas más pequeñas y fáciles de administrar. Esta estrategia permite que el modelo se enfoque en un aspecto a la vez y puede generar resultados más precisos y coherentes. Por ejemplo, si quieres que el modelo escriba un cuento, puedes dividirlo en instrucciones para generar los personajes, el escenario, la trama y el diálogo por separado.
  • Experimenta y realiza iteraciones con los resultados: El diseño de instrucciones suele ser un proceso iterativo. Puedes experimentar con diferentes enfoques, frases y parámetros para encontrar el mejor resultado según tus necesidades. Este proceso implica probar diferentes longitudes de instrucciones, reformular las instrucciones o ajustar el parámetro de configuración de temperatura del modelo, que controla la aleatoriedad del resultado. Los valores de temperatura más altos producen resultados más creativos e impredecibles, mientras que las temperaturas más bajas generan respuestas más determinísticas y enfocadas.

Técnicas principales para crear instrucciones

Puedes usar varias técnicas para optimizar las instrucciones y obtener el comportamiento esperado de los modelos de IA generativa.

En la siguiente tabla, se muestran los métodos de instrucción esenciales para los modelos de IA generativa:

Método de instrucción Descripción Ejemplo de instrucción
Instrucciones sin ejemplos Consultar directamente el modelo sin ejemplos específicos, basándose en su conocimiento previo y su capacidad de generalización Es eficaz con datos de entrenamiento diversos y completos. Translate "Hello, how are you?" into French.
Instrucciones con varios ejemplos Proporciona algunos ejemplos en la instrucción para guiar la salida del modelo y mostrar el formato o patrón esperado para una mayor precisión. Translate the following sentences into Spanish: "My name is Alice." = "Me llamo Alice." / "I like to read." = "Me gusta leer." / "Where is the library?" =
Instrucción de roles Asigna un rol específico al modelo (por ejemplo, "asistente útil" o "editor profesional") para influir en el tono, el estilo y el contenido, y alinear el resultado con esa personificación. You are a seasoned journalist. Write a brief news report on the latest advancements in renewable energy.
Instrucciones Indica de forma clara y explícita la tarea o acción esperada con un lenguaje conciso y sin ambigüedades, y especifica los requisitos de salida, las restricciones y las necesidades de formato. Summarize the following text into a three-sentence paragraph, focusing on the key arguments and conclusions: ...

Estrategias de instrucciones avanzadas

Además de las técnicas básicas, usa estrategias más avanzadas para definir mejor los resultados:

  • Instrucciones de cadena de pensamiento: Proporciona una serie de pasos de razonamiento intermedios como parte de la instrucción para alentar al modelo a pensar paso a paso. Esta estrategia puede ser beneficiosa para las tareas que requieren razonamiento lógico o resolución de problemas. Por ejemplo, si le pides al modelo que resuelva un problema matemático de palabras, incluye una serie de instrucciones que lo guíen por los pasos para resolver el problema.
  • Fundamentación: Proporciona al modelo información o conocimiento externos para mejorar su comprensión y sus capacidades de generación de respuestas. Este proceso permite que el modelo acceda a documentos, bases de datos o APIs pertinentes. Cuando fundamentas el modelo, puedes mejorar su precisión, facticidad y capacidad de generar respuestas más fundamentadas. Por ejemplo, si quieres que el modelo responda preguntas sobre un tema específico, proporciona un artículo o un documento de investigación pertinente como fundamentación.
  • Generación mejorada por recuperación (RAG): Usa el modelo para recuperar información pertinente de una base de conocimiento o una fuente externa. Luego, incorpora esta información recuperada en la instrucción para guiar la generación de la respuesta. La RAG puede ser conveniente para tareas que requieren acceso a una gran cantidad de información o conocimiento, como responder preguntas o resumir documentos.

Consideraciones clave

Cuando diseñes una instrucción bien estructurada, ten en cuenta las siguientes consideraciones:

  • Busca la claridad y la concisión. Si bien las instrucciones detalladas pueden ser beneficiosas, las instrucciones demasiado largas o complejas confunden al modelo.
  • Comprende las características específicas del modelo que usas para crear instrucciones eficaces.
  • Evita depender de los modelos para generar información fáctica.
  • Úsalo con cuidado en problemas matemáticos y lógicos.

¿Qué sigue?