O Gemini 2.0 Flash Thinking é um modelo experimental que é treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o Gemini 2.0 Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo básico do Gemini 2.0 Flash.
Usar o pensamento rápido
Os modelos de Pensamento rápido estão disponíveis como um modelo experimental na Vertex AI.
Para usar o modelo mais recente do Flash Thinking, selecione o modelo gemini-2.0-flash-thinking-exp-01-21
no menu suspenso Modelo.
Gen AI SDK for Python
Saiba como instalar ou atualizar o Gen AI SDK for Python.
Para saber mais, consulte a documentação de referência do SDK.Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Limitações
O Flash Thinking é um modelo experimental e tem as seguintes limitações:
- Limite de entrada de 1 milhão de tokens
- Entrada de texto, imagem, áudio e vídeo
- Limite de saída de 64 mil tokens
- Saída somente de texto
- Não use ferramentas integradas, como a Pesquisa ou a execução de código.
A seguir
Teste o Flash Thinking com nosso notebook do Colab ou abra o console da Vertex AI e tente solicitar o modelo.