O Gemini 2.0 Flash Thinking é um modelo experimental que é treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o Gemini 2.0 Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo básico do Gemini 2.0 Flash.
Usar o pensamento rápido
Os modelos de Pensamento rápido estão disponíveis como um modelo experimental na Vertex AI.
Para usar o modelo mais recente do Flash Thinking, selecione o modelo gemini-2.0-flash-thinking-exp-01-21
no menu suspenso Modelo.
Pensamentos
O processo de pensamento do modelo é retornado como o primeiro elemento da
lista content.parts
criada quando o modelo gera a resposta. Por
exemplo, o código a seguir imprime apenas o processo de pensamento do modelo:
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp-01-21',
contents='Solve 3*x^3-5*x=1'
)
Markdown(response.candidates[0].content.parts[0].text)
Limitações
O Flash Thinking é um modelo experimental e tem as seguintes limitações:
- Limite de entrada de 1 milhão de tokens
- Somente entrada de texto e imagem
- Limite de saída de 64 mil tokens
- Saída somente de texto
- Não use ferramentas integradas, como a Pesquisa ou a execução de código.
A seguir
Teste o Flash Thinking com nosso notebook do Colab ou abra o console da Vertex AI e tente solicitar o modelo.