Google 모델

Vertex 생성형 AI는 AI 기반 애플리케이션에서 사용하기 위해 테스트, 배포, 맞춤설정할 수 있는 점점 더 많은 기반 모델 목록을 제공합니다. 기반 모델은 특정 사용 사례에 맞게 조정되며 여러 가격대로 제공됩니다. 이 페이지에서는 다양한 API에서 제공하는 모델을 요약하고 사용 사례별로 선택할 수 있는 모델을 안내합니다.

Vertex 생성형 AI의 모든 AI 모델과 API를 자세히 알아보려면 AI 모델 및 API 살펴보기를 참조하세요.

Gemini 모델

다음 표에는 Gemini API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 사양
Gemini 1.5 Flash
(gemini-1.5-flash)
경제적인 대용량 애플리케이션을 위해 설계된 멀티모달 모델입니다. Gemini 1.5 Flash는 품질 저하 없이 빠르고 저렴한 애플리케이션을 빌드할 수 있도록 속도와 효율성을 제공합니다. 최대 총 토큰 수(입력 및 출력): 100만 개
최대 출력 토큰 수: 8,192개
최대 원시 이미지 크기: 20MB
base64로 인코딩된 최대 이미지 크기: 7MB
프롬프트당 최대 이미지 수: 3,000개
최대 동영상 길이: 1시간
프롬프트당 최대 동영상 수: 10개
최대 오디오 길이: 약 8.4시간
프롬프트당 최대 오디오 수: 1개
최대 PDF 크기: 30MB
학습 데이터: 2024년 5월까지
Gemini 1.5 Pro
(gemini-1.5-pro)
텍스트 또는 코드 응답에 대한 텍스트 또는 채팅 프롬프트에서 이미지, 오디오, 동영상, PDF 파일 추가를 지원하는 멀티모달 모델입니다. Gemini 1.5 Pro는 최대 100만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다. 최대 총 토큰 수(입력 및 출력): 100만 개
최대 출력 토큰 수: 8,192개
프롬프트당 최대 이미지 수: 3,000개
최대 동영상 길이(프레임만): 약 1시간
최대 동영상 길이(프레임 및 오디오): 약 45분
프롬프트당 최대 동영상 수: 10개
최대 오디오 길이: 약 8.4시간
프롬프트당 최대 오디오 수: 1개
최대 PDF 크기: 30MB
학습 데이터: 2024년 5월까지
Gemini 1.0 Pro
(gemini-1.0-pro)
다양한 텍스트 전용 태스크를 지원하는 기능이 있는 최고 성능 모델입니다.

입력으로 텍스트만 지원합니다.
지도 조정을 지원합니다.
총 최대 토큰 수(입력 및 출력): 32,760
최대 출력 토큰 수: 8,192
학습 데이터: 2023년 2월까지
Gemini 1.0 Pro Vision
(gemini-1.0-pro-vision)
다양한 애플리케이션을 처리할 수 있는 성능이 가장 우수한 이미지/동영상 이해 모델입니다.

입력으로 텍스트, 이미지, 동영상을 지원합니다.
최대 총 토큰 수(입력 및 출력): 16,384개
최대 출력 토큰 수: 2,048개
프롬프트당 최대 이미지 수: 16개
최대 동영상 길이: 2분
프롬프트당 최대 동영상 수: 1개
학습 데이터: 2023년 2월까지
Gemini 1.0 Ultra(GA, 허용 목록 포함) 안내, 코드, 추론을 포함한 복잡한 태스크에 최적화되어 있는 Google에서 가장 뛰어난 텍스트 모델입니다.

입력으로 텍스트만 지원합니다.
최대 토큰 입력: 8,192
최대 토큰 출력: 2,048
Gemini 1.0 Ultra Vision
(정식 버전, 허용 목록 포함)
Google에서 가장 뛰어난 멀티모달 비전 모델로, 공동 텍스트, 이미지 및 비디오 입력을 지원하도록 최적화되어 있습니다. 최대 토큰 입력: 8,192
최대 토큰 출력: 2,048

Gemini 모델은 다음 언어를 지원합니다.
한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi).

Embeddings 모델

다음 표에는 Embeddings API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 사양
텍스트용 Embeddings
(textembedding-gecko@001,
textembedding-gecko@002,
textembedding-gecko@003,
text-embedding-004
)
영어 텍스트 입력의 임베딩을 반환합니다.

'text-embedding-gecko' 지도 조정을 지원하고 영어로만 제공됩니다.
최대 토큰 입력 수: 3,072개(textembedding-gecko@001),
2,048개(기타)

임베딩 측정기준: text-embedding-004: 768개 이하
기타: 768개
다국어 텍스트용 Embeddings
((textembedding-gecko-multilingual@001,
text-multilingual-embedding-002)
)
100개가 넘는 언어의 텍스트 입력에 대한 임베딩을 반환합니다.

text-multilingual-embedding-002 모델의 지도 조정을 지원합니다.
언어 100개 지원
최대 토큰 입력 수: 2,048개

임베딩 측정기준: text-multilingual-embedding-002: 768개 이하
기타: 768개.
멀티모달용 Embeddings
(multimodalembedding)
다양한 모델에서 콘텐츠를 비교할 수 있도록 텍스트, 이미지, 동영상 입력의 임베딩을 반환합니다.

텍스트, 이미지, 동영상을 동일한 벡터 공간으로 변환합니다. 비디오는 측정기준 1408개만 지원합니다.
영어로만 제공됩니다.
최대 토큰 입력 수: 32,
최대 이미지 크기: 20MB, 최대 동영상 길이: 2분,

임베딩 측정기준: 텍스트+이미지 입력의 경우 128, 256, 512 또는 1408개, 비디오 입력의 경우 1408개.

텍스트 다국어 임베딩 모델은 다음 언어를 지원합니다.
한국어, 아프리칸스어, 알바니아어, 암하릭어, 아랍어, 아르메니아어, 아제르바이잔어, 바스크어, 벨라루스어, 벵골어, 불가리아어, 버마어, 카탈로니아어, 세부어, 말라위어, 중국어, 코르시카어, 체코어, 덴마크어, 네덜란드어, 영어, 에스페란토, 에스토니아어, 필리핀어, 핀란드어, 프랑스어, 갈리시아어, 조지아어, 독일어, 그리스어, 구자라트어, 아이티 크리올어, 하우사어, 하와이어, 히브리어, 힌디어, 몽어, 헝가리어, 아이슬란드어, 이그보어, 인도네시아어, 아일랜드어, 이탈리아어, 일본어, 자바어, 칸나다어, 카자흐어, 크메르어, 쿠르드어, 키르기스어, 라오어, 라틴어, 라트비아어, 리투아니아어, 룩셈부르크어, 마케도니아어, 말라가시어, 말레이어, 말라얄람어, 몰타어, 마오리어 마라타어, 몽골어, 네팔어, 노르웨이어, 파슈토어, 페르시아어, 폴란드어, 포르투갈어, 펀자브어, 루마니아어, 러시아어, 사모아어, 스코틀랜드 게일어, 세르비아어, 쇼나어, 신디어, 싱할라어, 슬로바키아어, 슬로베니아어, 소말리어, 소토어, 스페인어, 순다어, 스와힐리어, 스웨덴어, 타지크, 타밀어, 텔루구어, 태국어, 튀르키예어, 우크라이나어, 우르두어, 우즈베크어, 베트남어, 웨일즈어, 서프리지아어, 코사어, 이디시어, 요루바어, 줄루어

Imagen 모델

다음 표에는 Imagen API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 사양
Imagen 2
(imagegeneration@006)
이 모델은 이미지 생성 및 편집을 지원하므로 고품질 이미지를 몇 초 만에 만들 수 있습니다.

편집 기능은 객체 삭제 및 삽입, 그림 확장, 제품 편집을 지원합니다.
최대 이미지 출력 수: 4개
가로세로 비율(생성용): 1:1, 9:16, 16:9, 3:4, 4:3

해상도: 최대 1,500픽셀(가로세로 비율에 따라 다름)

Imagen 모델은 다음 언어를 지원합니다.
한국어, 영어, 중국어(간체), 중국어(번체), 힌디어, 일본어, 포르투갈어, 스페인어

코드 완성 모델

다음 표에는 Codey API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 사양
코드 생성용 Codey
(code-bison)
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다.

지도 조정 지원
최대 입력 토큰 수: 6144
최대 출력 토큰 수: 1024
Code 생성용 Codey 32k
(code-bison-32k)
code-bison과 유사한 기능이지만 더 긴 컨텍스트 윈도우가 있습니다.

지도 조정 지원
최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
코드 채팅용 Codey
(codechat-bison)
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다.

지도 조정 지원
최대 입력 토큰 수: 6144
최대 출력 토큰 수: 1024
코드 채팅용 Codey 32k
(codechat-bison-32k)
codechat-bison과 유사한 기능이지만 더 긴 컨텍스트 윈도우가 있습니다.

지도 조정 지원
최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
코드 완성용 Codey
(code-gecko)
작성된 코드의 컨텍스트를 기반으로 코드 완성을 추천하도록 미세 조정된 모델입니다. 최대 입력 토큰 수: 2048
최대 출력 토큰 수: 64

MedLM 모델

다음 표에는 MedLM API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 사양
MedLM-medium(medlm-medium) HIPAA 규정 준수를 지원하는 의료 분야용 모델 제품군입니다.

이 모델은 의학적 질문 및 답변 태스크, 헬스케어 및 의약품 문서 요약 태스크를 수행하는 의료 실무자에게 도움이 됩니다.
최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
언어: 영어
MedLM-large (medlm-large) MedLM의 고품질 변형입니다. 최대 입력 토큰 수: 8,192
최대 출력 토큰 수: 1,024
언어: 영어

Model Garden의 모든 모델 살펴보기

Model Garden은 Google 독점 정보를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델 및 애셋을 선택할 수 있게 해주는 플랫폼입니다. Vertex 생성형 AI에서 사용할 수 있는 생성형 AI 모델과 API를 살펴보려면 Google Cloud 콘솔의 Model Garden으로 이동하세요.

Model Garden으로 이동

사용 가능한 모델 및 기능을 포함하여 Model Garden에 대해 자세히 알아보려면 Model Garden에서 AI 모델 살펴보기를 참조하세요.

다음 단계