사용 가능한 Gemini 모델

Gemini는 텍스트, 이미지, 오디오, 동영상 등 여러 형식의 정보를 처리하는 모델 제품군입니다. Gemini는 방대한 양의 정보를 탐색하고 분석하여 이러한 멀티모달 데이터 유형을 원활하게 이해하고 처리할 수 있습니다. 자세한 내용은 Gemini 개요를 참고하세요.

Gemini 1.5 Flash는 Gemini 모델 제품군의 경량 버전으로, 빠르고 비용 효율적입니다. Gemini 1.5 Pro는 더 강력하게 설계되었습니다.

이 페이지에서는 Google Distributed Cloud (GDC) 에어 갭에서 사용할 수 있는 Gemini 모델의 사양을 설명합니다.

모델 사용 사례

다음 표에는 Gemini API에서 사용할 수 있는 모델 사용 사례가 요약되어 있습니다.

모델 입력 결과 사용 사례
Gemini 1.5 Pro 텍스트, 코드, 이미지, 오디오, 동영상, 오디오가 포함된 동영상, 문서 텍스트 향상된 대답 품질이 필요한 애플리케이션을 지원합니다.
Gemini 1.5 Flash 텍스트, 코드, 이미지, 오디오, 동영상, 오디오가 포함된 동영상, 문서 텍스트 비용 효율적인 애플리케이션을 위한 속도와 효율성을 제공합니다.

다음 정보는 각 Gemini 모델에 대한 세부정보를 제공합니다.

기능 Gemini 1.5 Pro Gemini 1.5 Flash
설명 멀티모달 사용 사례를 위한 범용 모델입니다. 많은 수의 요청과 긴 컨텍스트 이해를 처리할 수 있는 모델이 필요한 경우 사용합니다. 멀티모달 사용 사례를 위해 설계된 경량의 빠르고 비용 효율적인 버전입니다. 많은 요청을 처리할 수 있고 비용 효율적인 모델이 필요한 경우 사용합니다.
기능
  • 텍스트 프롬프트
  • 멀티모달 프롬프트:
    • 이미지
    • 오디오
    • 동영상
    • 문서
  • 텍스트 프롬프트
  • 멀티모달 프롬프트:
    • 이미지
    • 오디오
    • 동영상
    • 문서
컨텍스트 윈도우 최대 32,000개 토큰 최대 32,000개 토큰
프롬프트당 최대 이미지 수 100 100
최대 원시 이미지 크기 20MB 20MB
base64로 인코딩된 최대 이미지 크기 7 MB 7 MB
프롬프트당 최대 오디오 파일 수 제한 없음 제한 없음
최대 오디오 길이 15분 9분
프롬프트당 최대 동영상 수 10 10
최대 동영상 길이 (프레임만 해당) 120초 120초
최대 동영상 길이 (프레임 및 오디오) 100초 100초
최대 문서 파일 크기 50MB 50MB
요청당 최대 문서 파일 수 100 100
문서당 최대 페이지 수 100 100

모델 선택 및 프롬프트 작성

콘텐츠 생성 요청에서 응답을 생성할 모델을 선택해야 합니다. 선택한 모델은 출력에 영향을 미치며 비용에 영향을 줍니다.

GDC의 Gemini 모델 엔드포인트 ID는 다음과 같습니다.

이름 모델 엔드포인트 ID
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

그런 다음 모델에서 출력을 얻기 위해 프롬프트를 작성해야 합니다. 모델에 정확한 안내, 예시, 필요한 컨텍스트 또는 전문 정보를 제공하여 출력을 개선할 수 있습니다. 프롬프트에 대한 자세한 내용은 프롬프트 소개를 참고하세요.