Gemini 2.0 Flash Thinking es un modelo experimental que se entrena para generar el "proceso de pensamiento" que atraviesa el modelo como parte de su respuesta. Como resultado, Gemini 2.0 Flash Thinking es capaz de tener capacidades de razonamiento más sólidas en sus respuestas que el modelo base de Gemini 2.0 Flash.
Usa el pensamiento flash
Los modelos de pensamiento rápido están disponibles como un modelo experimental en Vertex AI.
Para usar el modelo de Flash Thinking más reciente, selecciona el modelo gemini-2.0-flash-thinking-exp-01-21
en el menú desplegable Modelo.
SDK de Gen AI para Python
Obtén información para instalar o actualizar el SDK de Google Gen AI para Python.
Para obtener más información, consulta la
documentación de referencia de la API del SDK de Gen AI para Python o el
repositorio de GitHub de python-genai
.
Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Limitaciones
Flash Thinking es un modelo experimental y tiene las siguientes limitaciones:
- Límite de entrada de 1 millón de tokens
- Entrada de texto, imagen, audio y video
- Límite de salida de tokens de 64,000
- Salida de solo texto
- No se debe usar ninguna herramienta integrada, como la Búsqueda o la ejecución de código.
Próximos pasos
Prueba Flash Thinking por tu cuenta con nuestro notebook de Colab, o abre la consola de Vertex AI y prueba solicitar el modelo por tu cuenta.