Gemini 2.0 모델은 Vertex AI에서 지원되는 최신 Google 모델입니다. 이 페이지에서는 다음 모델을 설명합니다.
Gemini 2.0 Flash Thinking 모델에 관한 정보를 확인하려면 Gemini 2.0 Flash Thinking 문서를 참고하세요.
2.0 모델
2.0 Flash
Gemini 2.0 Flash는 Gemini 제품군의 최신 정식 버전 모델입니다. 모든 일상적인 작업을 위한 워크호스 모델로, 향상된 성능을 제공하고 실시간 Live API를 지원합니다. 2.0 Flash는 품질이 훨씬 우수하지만 속도가 약간 느린 모델을 원하는 1.5 Flash 사용자 또는 품질과 실시간 지연 시간을 약간 개선하면서 비용을 줄이고자 하는 1.5 Pro 사용자를 위한 업그레이드 경로입니다.
Gemini 2.0 Flash에서는 다음과 같은 새로운 기능과 향상된 기능을 도입합니다.
- Multimodal Live API: 이 새로운 API를 사용하면 Gemini와의 양방향 음성 및 동영상 상호작용으로 지연 시간이 짧습니다.
- 품질: Gemini 1.5 Pro보다 대부분의 품질 벤치마크에서 성능이 향상되었습니다.
- 에이전트 기능 개선: 2.0 Flash는 다중 모달 이해, 코딩, 복잡한 안내 따르기, 함수 호출을 개선합니다. 이러한 개선사항은 함께 작동하여 더 나은 상담사 환경을 지원합니다.
- 새로운 모달: 2.0 Flash에는 내장 이미지 생성 및 제어 가능한 텍스트 음성 변환 기능이 도입되어 이미지 수정, 현지화된 아트워크 제작, 표현력 있는 스토리텔링이 가능합니다.
Gemini 2.0 Flash 기능:
- 멀티모달 입력
- 텍스트 출력 (일반 버전) / 멀티모달 출력 (비공개 미리보기)
- 프롬프트 옵티마이저
- 제어 생성
- 함수 호출
- Google 검색으로 그라운딩
- 코드 실행
- 토큰 수
Gen AI SDK에서 Gemini 2.0 Flash를 사용하려면 이 모델 ID를 사용하세요. gemini-2.0-flash-001
기능 제공 여부
Gemini 2.0 Flash에서는 다음 기능을 사용할 수 있습니다.
특성 | 가용성 수준 |
---|---|
텍스트 생성 | 정식 버전 |
Google 검색으로 그라운딩 | 정식 버전 |
Gen AI SDK | 정식 버전 |
Multimodal Live API | 공개 미리보기 |
경계 상자 감지 | 공개 미리보기 |
이미지 생성 | 비공개 미리보기 |
음성 생성 | 비공개 미리보기 |
- 정식 버전: 이 기능은 공개적으로 제공되며 프로덕션 수준 코드에서 사용할 수 있도록 지원됩니다.
- 공개 미리보기: 이 기능은 축소된 용량으로 공개적으로 제공됩니다. 프로덕션 코드에서 공개 미리보기로 출시된 기능은 사용하지 마세요. 해당 기능의 지원 수준과 기능이 경고 없이 변경될 수 있기 때문입니다.
- 비공개 미리보기: 이 기능은 승인된 허용 목록에 등록된 사용자만 사용할 수 있습니다. 비공개 미리보기로 출시된 기능은 프로덕션 코드에서 사용하지 마세요. 해당 기능의 지원 수준과 기능이 경고 없이 변경될 수 있기 때문입니다.
가격 책정
Gemini 2.0 Flash의 가격에 대한 자세한 내용은 가격 책정 페이지를 참고하세요.
할당량 및 제한사항
Gemini 2.0 Flash의 GA 기능은 동적 공유 할당량을 사용합니다.
Gemini 2.0 Flash에서 Google 검색으로 그라운딩하는 경우 비율 제한이 적용됩니다.
2.0 Flash-Lite
Gemini 2.0 Flash-Lite는 가장 빠르고 비용 효율적인 Flash 모델입니다. 동일한 가격과 속도로 더 나은 품질을 원하는 1.5 Flash 사용자를 위한 업그레이드 경로입니다.
Gemini 2.0 Flash-Lite에는 다음이 포함됩니다.
- 멀티모달 입력, 텍스트 출력
- 1백만 개의 토큰 입력 컨텍스트 윈도우
- 8,000개의 토큰 출력 컨텍스트 윈도우
2.0 Flash-Lite에는 다음과 같은 2.0 Flash 기능이 포함되지 않습니다.
- 멀티모달 출력 생성
- Multimodal Live API와 통합
- 생각 중
- 기본 제공 도구 사용
Gen AI SDK에서 Gemini 2.0 Flash-Lite를 사용하려면 이 모델 ID(gemini-2.0-flash-lite-preview-02-05
)를 사용하세요.
할당량 및 제한사항
Gemini 2.0 Flash-Lite는 공개 미리보기 기간 동안 분당 60개의 쿼리로 속도가 제한됩니다.
Gemini 2.0 Flash-Lite는 Vertex AI의 us-central1
리전에서만 사용할 수 있습니다.
2.0 Pro
Gemini 2.0 Pro는 코딩 및 세계 지식에 가장 강력한 모델이며 200만 개의 긴 컨텍스트 윈도우를 제공합니다. Gemini 2.0 Pro는 Vertex AI에서 실험 버전 모델로 제공되며, 더 나은 품질을 원하는 1.5 Pro 사용자 또는 특히 긴 컨텍스트와 코드에 투자하는 사용자를 위한 업그레이드 경로입니다.
Gemini 2.0 Pro 기능:
- 멀티모달 입력
- 텍스트 출력
- 프롬프트 옵티마이저
- 제어 생성
- 함수 호출 (조합 함수 호출 제외)
- Google 검색으로 그라운딩
- 코드 실행
- 토큰 수
Gen AI SDK에서 Gemini 2.0 Pro를 사용하려면 이 모델 ID를 사용하세요. gemini-2.0-pro-exp-02-05
할당량 및 제한사항
Gemini 2.0 Pro는 실험 기간 동안 분당 10개의 쿼리 수(QPM)로 제한됩니다.
Gemini 2.0 Pro에서 Google 검색으로 그라운딩하는 경우 비율 제한이 적용됩니다.
Google Gen AI SDK
Gen AI SDK는 Vertex AI의 Gemini Developer API와 Gemini API를 통해 Gemini 2.0에 통합된 인터페이스를 제공합니다. 몇 가지 예외를 제외하고 한 플랫폼에서 실행되는 코드는 두 플랫폼에서 모두 실행됩니다. 즉, Developer API를 사용하여 애플리케이션의 프로토타입을 만든 다음 코드를 다시 작성하지 않고도 애플리케이션을 Vertex AI로 이전할 수 있습니다.
Gen AI SDK는 Gemini 1.5 모델도 지원합니다.
이 SDK는 Python에서 정식 버전으로 제공됩니다. Go 지원은 미리보기 버전이며 Java 및 JavaScript 지원은 곧 제공될 예정입니다.
표시된 대로 SDK를 사용할 수 있습니다.
Python용 생성형 AI SDK
Python용 Google Gen AI SDK를 설치하거나 업데이트하는 방법을 알아보세요.
자세한 내용은
Python용 Gen AI SDK API 참고 문서 또는
python-genai
GitHub 저장소를 참고하세요.
Vertex AI에서 Gen AI SDK를 사용하도록 환경 변수를 설정합니다.
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True