Gemini 2.0 Flash Thinking es un modelo experimental que se entrena para generar el "proceso de pensamiento" por el que pasa el modelo como parte de su respuesta. Como resultado, Gemini 2.0 Flash Thinking es capaz de tener capacidades de razonamiento más sólidas en sus respuestas que el modelo básico de Gemini 2.0 Flash.
Usa el pensamiento rápido
Los modelos de pensamiento rápido están disponibles como un modelo experimental en Vertex AI.
Para usar el modelo de Flash Thinking más reciente, selecciona el modelo gemini-2.0-flash-thinking-exp-01-21
en el menú desplegable Modelo.
Gen AI SDK for Python
Obtén información para instalar o actualizar Gen AI SDK for Python.
Para obtener más información, consulta la documentación de referencia del SDK.Establece variables de entorno para usar el SDK de Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Limitaciones
Flash Thinking es un modelo experimental y tiene las siguientes limitaciones:
- Límite de entrada de 1 millón de tokens
- Entrada de texto, imagen, audio y video
- Límite de salida de tokens de 64,000
- Salida de solo texto
- No se debe usar ninguna herramienta integrada, como la Búsqueda o la ejecución de código.
Próximos pasos
Prueba Flash Thinking por tu cuenta con nuestro notebook de Colab, o abre la consola de Vertex AI y prueba solicitar el modelo por tu cuenta.