Gemini 2.0 Flash Thinking은 모델이 응답의 일부로 거치는 '사고 과정'을 생성하도록 학습된 실험용 모델입니다. 따라서 Gemini 2.0 Flash Thinking은 기본 Gemini 2.0 Flash 모델보다 더 강력한 추론 기능을 갖춘 대답을 제공할 수 있습니다.
플래시 사고 사용
플래시 사고 모델은 Vertex AI에서 실험용 모델로 사용할 수 있습니다.
최신 Flash Thinking 모델을 사용하려면 모델 드롭다운 메뉴에서 gemini-2.0-flash-thinking-exp-01-21
모델을 선택합니다.
Python용 생성형 AI SDK
Python용 Google Gen AI SDK를 설치하거나 업데이트하는 방법을 알아보세요.
자세한 내용은
Python용 Gen AI SDK API 참고 문서 또는
python-genai
GitHub 저장소를 참고하세요.
Vertex AI에서 Gen AI SDK를 사용하도록 환경 변수를 설정합니다.
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
제한사항
Flash Thinking은 실험용 모델이며 다음과 같은 제한사항이 있습니다.
- 토큰 100만 개 입력 한도
- 텍스트, 이미지, 오디오, 동영상 입력
- 64k 토큰 출력 한도
- 텍스트 전용 출력
- 검색이나 코드 실행과 같은 기본 제공 도구 사용 불가
다음 단계
Colab 노트북을 사용하여 Flash Thinking을 직접 사용해 보거나 Vertex AI 콘솔을 열고 직접 모델에 프롬프트를 제공해 보세요.