Gemini 2.0 Flash Thinking est un modèle expérimental qui est entraîné pour générer le "processus de réflexion " qu'il suit dans le cadre de sa réponse. Par conséquent, Gemini 2.0 Flash Thinking est capable de fournir des réponses plus pertinentes que le modèle Gemini 2.0 Flash de base.
Utiliser la pensée flash
Les modèles Flash Thinking sont disponibles en tant que modèle expérimental dans Vertex AI.
Pour utiliser le dernier modèle Flash Thinking, sélectionnez le modèle gemini-2.0-flash-thinking-exp-01-21
dans le menu déroulant Modèle.
Gen AI SDK for Python
Découvrez comment installer ou mettre à jour Gen AI SDK for Python.
Pour en savoir plus, consultez la documentation de référence du SDK.Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Limites
Flash Thinking est un modèle expérimental qui présente les limites suivantes:
- Limite d'entrée de 1 million de jetons
- Entrée de texte, d'images, d'audio et de vidéo
- Limite de sortie de 64 000 jetons
- Sortie en texte uniquement
- Aucune utilisation d'outil intégré tel que la recherche ou l'exécution de code
Étape suivante
Essayez Flash Thinking par vous-même avec notre notebook Colab, ou ouvrez la console Vertex AI et essayez d'inviter le modèle vous-même.