Gemini 2.0 Flash Thinking

O Gemini 2.0 Flash Thinking é um modelo experimental que é treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o Gemini 2.0 Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo básico do Gemini 2.0 Flash.

Usar o pensamento rápido

Os modelos de Pensamento rápido estão disponíveis como um modelo experimental na Vertex AI. Para usar o modelo mais recente do Flash Thinking, selecione o modelo gemini-2.0-flash-thinking-exp-01-21 no menu suspenso Modelo.

Pensamentos

O processo de pensamento do modelo é retornado como o primeiro elemento da lista content.parts criada quando o modelo gera a resposta. Por exemplo, o código a seguir imprime apenas o processo de pensamento do modelo:

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp-01-21',
    contents='Solve 3*x^3-5*x=1'
)

Markdown(response.candidates[0].content.parts[0].text)

Limitações

O Flash Thinking é um modelo experimental e tem as seguintes limitações:

  • Limite de entrada de 1 milhão de tokens
  • Somente entrada de texto e imagem
  • Limite de saída de 64 mil tokens
  • Saída somente de texto
  • Não use ferramentas integradas, como a Pesquisa ou a execução de código.

A seguir

Teste o Flash Thinking com nosso notebook do Colab ou abra o console da Vertex AI e tente solicitar o modelo.