Gemini 2.5 Flash

Gemini 2.5 Flash는 가격과 성능 면에서 최고의 모델이며 다양한 기능을 제공합니다. Gemini 2.5 Flash는 사고 능력을 갖춘 첫 번째 Flash 모델로, 모델이 대답을 생성할 때 거치는 사고 과정을 확인할 수 있습니다.

Gemini 2.5 Flash에 관한 자세한 기술 정보 (예: 성능 벤치마크, 학습 데이터 세트 정보, 지속가능성 관련 노력, 의도된 사용 및 제한사항, 윤리 및 안전에 대한 Google의 접근 방식)는 Gemini 2.5 모델에 관한 기술 보고서Gemini 2.5 Flash 모델 카드를 참고하세요.

2.5 Flash

Vertex AI에서 사용해 보기 Model Garden에서 보기 (미리보기) 예시 앱 배포

참고: '예시 앱 배포' 기능을 사용하려면 결제 및 Vertex AI API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.
모델 ID gemini-2.5-flash
지원되는 입력 및 출력
  • 입력:
    텍스트, 코드, 이미지, 오디오, 동영상
  • 출력:
    텍스트
토큰 한도
  • 최대 입력 토큰 수: 1,048,576
  • 최대 출력 토큰: 65,535개 (기본값)
기능
사용량 유형
입력 크기 한도 500MB
기술 사양
이미지
  • 프롬프트당 최대 이미지 수: 3,000
  • 최대 이미지 크기: 7MB
  • 지원되는 MIME 유형:
    image/png, image/jpeg, image/webp
문서
  • 프롬프트당 최대 파일 수: 3,000
  • 파일당 최대 페이지 수: 1,000
  • API 또는 Cloud Storage 가져오기의 파일당 최대 파일 크기: 50MB
  • 콘솔을 통한 직접 업로드의 파일당 최대 파일 크기: 7MB
  • 지원되는 MIME 유형:
    application/pdf, text/plain
동영상
  • 최대 동영상 길이(오디오 포함): 약 45분
  • 최대 동영상 길이(오디오 제외): 약 1시간
  • 프롬프트당 최대 동영상 수: 10
  • 지원되는 MIME 유형:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
오디오
  • 프롬프트당 최대 오디오 길이: 최대 8.4시간 또는 토큰 최대 100만 개
  • 프롬프트당 최대 오디오 파일 수: 1
  • 음성 이해: 오디오 요약, 스크립트 작성, 번역
  • 지원되는 MIME 유형:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
파라미터 기본값
  • 온도: 0.0~2.0(기본값 1.0)
  • topP: 0.0~1.0(기본값 0.95)
  • topK: 64(고정)
  • candidateCount: 1~8(기본값 1)
지원되는 리전

모델 가용성

(동적 공유 할당량 및 프로비저닝된 처리량 포함)

  • Global
    • 전역
  • 미국
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • 유럽
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9+

ML 처리

  • 미국
    • 멀티 리전
  • 캐나다
    • northamerica-northeast1
  • 유럽
    • 멀티 리전
    • europe-west2*
  • 아시아 태평양
    • asia-northeast1*
    • asia-northeast3*
    • asia-south1*
    • asia-southeast1
    • australia-southeast1*
자세한 내용은 데이터 저장 위치를 참고하세요.
지식 단절 날짜 2025년 1월
버전
  • gemini-2.5-flash
    • 출시 단계: 정식 버전
    • 출시일: 2025년 6월 17일
    • 중단일: 2026년 6월 17일
  • gemini-live-2.5-flash
    • 출시 단계: 비공개 정식 버전
    • 출시일: 2025년 6월 17일
  • gemini-2.5-flash-preview-05-20
    • 출시 단계: 공개 프리뷰
    • 출시일: 2025년 5월 20일
    • 중단일: 2025년 7월 15일
  • gemini-2.5-flash-preview-04-17
    • 출시 단계: 공개 프리뷰
    • 출시일: 2025년 4월 17일
    • 중단일: 2025년 7월 15일
보안 제어
자세한 내용은 보안 제어를 참조하세요.
가격 책정 가격 책정을 참조하세요.
+ 지도 기반 세부 조정 미지원
* 128,000 컨텍스트 윈도우에서만 사용 가능

이미지

Vertex AI에서 사용해 보기 (미리보기) 예시 앱 배포

참고: '예시 앱 배포' 기능을 사용하려면 결제 및 Vertex AI API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.
모델 ID gemini-2.5-flash-image-preview
지원되는 입력 및 출력
  • 입력:
    텍스트, 이미지
  • 출력:
    텍스트 및 이미지
토큰 한도
  • 최대 입력 토큰 수: 32,768
  • 최대 출력 토큰: 32,768
기능
사용량 유형
입력 크기 한도 500MB
기술 사양
이미지
  • 프롬프트당 최대 이미지 수: 3
  • 최대 이미지 크기: 7MB
  • 프롬프트당 최대 출력 이미지 수: 10
  • 지원되는 MIME 유형:
    image/png, image/jpeg, image/webp
문서
  • 프롬프트당 최대 파일 수: 3
  • 파일당 최대 페이지 수: 3
  • 파일당 최대 파일 크기: 50MB
  • 지원되는 MIME 유형:
    application/pdf, text/plain
파라미터 기본값
  • 온도: 0.0~2.0(기본값 1.0)
  • topP: 0.0~1.0(기본값 0.95)
  • topK: 64(고정)
  • candidateCount: 1~8(기본값 1)
지원되는 리전

모델 가용성

  • Global
    • 전역
자세한 내용은 데이터 저장 위치를 참고하세요.
지식 단절 날짜 2025년 6월
버전
  • gemini-2.5-flash-image-preview
    • 출시 단계: 공개 프리뷰
    • 출시일: 2025년 8월 26일
보안 제어
자세한 내용은 보안 제어를 참조하세요.
가격 책정 가격 책정을 참조하세요.

Live API 네이티브 오디오

Gemini 2.5 Flash는 Live API를 위한 최첨단 네이티브 오디오 기능을 제공합니다. 이 미리보기 모델에는 표준 Live API 기능 외에도 다음이 포함됩니다.

  • 향상된 음성 품질 및 적응성: Live API 네이티브 오디오는 24개 언어30개 HD 음성을 통해 더 풍부하고 자연스러운 음성 상호작용을 제공합니다.
  • 선제적 오디오 소개: 선제적 오디오가 사용 설정되면 모델은 관련성이 있을 때만 응답합니다. 모델은 기기로 향하는 쿼리에 대해서만 텍스트 스크립트와 오디오 응답을 선제적으로 생성하며, 기기로 향하지 않는 쿼리에는 응답하지 않습니다.
  • 정서적 대화 소개: Live API 네이티브 오디오를 사용하는 모델은 사용자의 감정 표현을 이해하고 적절하게 응답하여 더 미묘한 대화를 나눌 수 있습니다.

Live API에 대한 자세한 내용은 독립형 Live API 문서를 참고하세요.

Vertex AI에서 사용해 보기

모델 ID gemini-live-2.5-flash-preview-native-audio
지원되는 입력 및 출력
  • 입력:
    오디오, 동영상
  • 출력:
    오디오
토큰 한도
  • 최대 입력 토큰 수: 1,048,576
  • 최대 출력 토큰: 128,000개 (기본값)
기능
사용량 유형
입력 크기 한도 500MB
기술 사양
동영상
  • 최대 화면 공유 길이: 약 10분
  • 지원되는 MIME 유형:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
오디오
  • 최대 대화 길이: 약 10분
  • 음성 이해: 오디오 요약, 스크립트 작성, 번역
  • 지원되는 MIME 유형:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
파라미터 기본값
  • 온도: 0.0~2.0(기본값 1.0)
  • topP: 0.0~1.0(기본값 0.95)
  • topK: 64(고정)
  • candidateCount: 1~8(기본값 1)
지원되는 리전

모델 가용성

  • 미국
    • us-central1
자세한 내용은 데이터 저장 위치를 참고하세요.
지식 단절 날짜 2025년 1월
버전
  • gemini-live-2.5-flash-preview-native-audio
    • 출시 단계: 공개 프리뷰
    • 출시일: 2025년 6월 17일
보안 제어
자세한 내용은 보안 제어를 참조하세요.
가격 책정 가격 책정을 참조하세요.