Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking es un modelo experimental que se entrena para generar el "proceso de pensamiento" que atraviesa el modelo como parte de su respuesta. Como resultado, Gemini 2.0 Flash Thinking es capaz de realizar razonamientos más sólidos en sus respuestas que el modelo base de Gemini 2.0 Flash.

Usa el pensamiento rápido

Los modelos de Flash Thinking están disponibles como un modelo experimental en Vertex AI. Para usar el modelo de Flash Thinking más reciente, selecciona el modelo gemini-2.0-flash-thinking-exp-01-21 en el menú desplegable Modelo.

Pensamientos

El proceso de pensamiento del modelo se muestra como el primer elemento de la lista content.parts que se crea cuando el modelo genera la respuesta. Por ejemplo, el siguiente código imprime solo el proceso de pensamiento del modelo:

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp-01-21',
    contents='Solve 3*x^3-5*x=1'
)

Markdown(response.candidates[0].content.parts[0].text)

Puedes ver más ejemplos de cómo usar el pensamiento rápido en nuestro notebook de Colab.

Limitaciones

El pensamiento rápido es un modelo experimental y tiene las siguientes limitaciones:

  • Límite de entrada de 1 millón de tokens
  • Solo entrada de imagen y texto
  • Límite de salida de tokens de 64 K
  • Salida de solo texto
  • No se debe usar ninguna herramienta integrada, como la Búsqueda o la ejecución de código.

Próximos pasos

Prueba Flash Thinking por tu cuenta con nuestro notebook de Colab, o abre la consola de Vertex AI y prueba solicitar el modelo por tu cuenta.