Gemini는 텍스트, 이미지, 오디오, 동영상 등 여러 형식의 정보를 처리하는 모델 제품군입니다. Gemini는 방대한 양의 정보를 탐색하고 분석하여 이러한 멀티모달 데이터 유형을 원활하게 이해하고 처리할 수 있습니다. 자세한 내용은 Gemini 개요를 참고하세요.
Gemini 1.5 Flash는 Gemini 모델 제품군의 경량 버전으로, 빠르고 비용 효율적입니다. Gemini 1.5 Pro는 더 강력하게 설계되었습니다.
이 페이지에서는 Google Distributed Cloud (GDC) 에어 갭에서 사용할 수 있는 Gemini 모델의 사양을 설명합니다.
모델 사용 사례
다음 표에는 Gemini API에서 사용할 수 있는 모델 사용 사례가 요약되어 있습니다.
| 모델 | 입력 | 결과 | 사용 사례 |
|---|---|---|---|
| Gemini 1.5 Pro | 텍스트, 코드, 이미지, 오디오, 동영상, 오디오가 포함된 동영상, 문서 | 텍스트 | 향상된 대답 품질이 필요한 애플리케이션을 지원합니다. |
| Gemini 1.5 Flash | 텍스트, 코드, 이미지, 오디오, 동영상, 오디오가 포함된 동영상, 문서 | 텍스트 | 비용 효율적인 애플리케이션을 위한 속도와 효율성을 제공합니다. |
다음 정보는 각 Gemini 모델에 대한 세부정보를 제공합니다.
| 기능 | Gemini 1.5 Pro | Gemini 1.5 Flash |
|---|---|---|
| 설명 | 멀티모달 사용 사례를 위한 범용 모델입니다. 많은 수의 요청과 긴 컨텍스트 이해를 처리할 수 있는 모델이 필요한 경우 사용합니다. | 멀티모달 사용 사례를 위해 설계된 경량의 빠르고 비용 효율적인 버전입니다. 많은 요청을 처리할 수 있고 비용 효율적인 모델이 필요한 경우 사용합니다. |
| 기능 |
|
|
| 컨텍스트 윈도우 | 최대 32,000개 토큰 | 최대 32,000개 토큰 |
| 프롬프트당 최대 이미지 수 | 100 | 100 |
| 최대 원시 이미지 크기 | 20MB | 20MB |
| base64로 인코딩된 최대 이미지 크기 | 7 MB | 7 MB |
| 프롬프트당 최대 오디오 파일 수 | 제한 없음 | 제한 없음 |
| 최대 오디오 길이 | 15분 | 9분 |
| 프롬프트당 최대 동영상 수 | 10 | 10 |
| 최대 동영상 길이 (프레임만 해당) | 120초 | 120초 |
| 최대 동영상 길이 (프레임 및 오디오) | 100초 | 100초 |
| 최대 문서 파일 크기 | 50MB | 50MB |
| 요청당 최대 문서 파일 수 | 100 | 100 |
| 문서당 최대 페이지 수 | 100 | 100 |
모델 선택 및 프롬프트 작성
콘텐츠 생성 요청에서 응답을 생성할 모델을 선택해야 합니다. 선택한 모델은 출력에 영향을 미치며 비용에 영향을 줍니다.
GDC의 Gemini 모델 엔드포인트 ID는 다음과 같습니다.
| 이름 | 모델 엔드포인트 ID |
|---|---|
| Gemini Flash | gemini-1.5-flash |
| Gemini Pro | gemini-1.5-pro |
그런 다음 모델에서 출력을 얻기 위해 프롬프트를 작성해야 합니다. 모델에 정확한 안내, 예시, 필요한 컨텍스트 또는 전문 정보를 제공하여 출력을 개선할 수 있습니다. 프롬프트에 대한 자세한 내용은 프롬프트 소개를 참고하세요.