Vertex AI는 AI 기반 애플리케이션에서 사용하기 위해 테스트, 배포, 맞춤설정할 수 있는 점점 더 많은 기반 모델 목록을 제공합니다. 기반 모델은 특정 사용 사례에 맞게 조정되며 여러 가격대로 제공됩니다. 이 페이지에서는 다양한 API에서 제공하는 모델을 요약하고 사용 사례별로 선택할 수 있는 모델을 안내합니다.
Vertex AI에서 모든 AI 모델 및 API에 대해 알아보려면 AI 모델 및 API 살펴보기를 참조하세요.
기반 모델 API
Vertex AI에는 다음과 같은 기반 모델 API가 있습니다.
- Gemini API(멀티모달 데이터, 텍스트, 코드, 채팅)
- PaLM API(텍스트, 채팅, 임베딩)
- Codey API(코드 생성, 코드 채팅, 코드 완성)
- Imagen API(이미지 생성, 이미지 수정, 이미지 캡션, 시각적 질의 응답, 멀티모달 임베딩)
Gemini API 모델
다음 표에는 Gemini API에서 사용할 수 있는 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
Gemini 1.0 Pro ( gemini-1.0-pro ) |
자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다. 텍스트만 포함된 프롬프트에 Gemini 1.0 Pro를 사용합니다. | 총 최대 토큰 수(입력 및 출력): 32,760 최대 출력 토큰 수: 8,192 학습 데이터: 2023년 2월까지 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
Gemini 1.0 Pro Vision ( gemini-1.0-pro-vision ) |
텍스트 또는 코드 응답에 대한 텍스트 또는 채팅 프롬프트에서 이미지 및 동영상 추가를 지원하는 멀티모달 모델입니다. Gemini 1.0 Pro Vision 멀티모달 프롬프트를 사용합니다. | 총 최대 토큰 수(입력 및 출력): 16,384 최대 출력 토큰 수: 2,048 최대 이미지 크기: 제한 없음 프롬프트당 최대 이미지 수: 16 최대 동영상 길이: 2분 프롬프트당 최대 동영상 수: 1 학습 데이터: 2023년 2월까지 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
Gemini 1.0 Ultra(GA, 허용 목록 포함) | 안내, 코드, 추론 등의 복잡한 작업에 최적화되어 있으며 여러 언어를 지원하는 Google의 가장 뛰어난 멀티모달 모델입니다. Gemini 1.0 Ultra는 일부 고객에게 정식 버전(GA)으로 제공됩니다. | 최대 토큰 입력: 8,192 최대 토큰 출력: 2,048 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
Gemini 1.0 Ultra Vision(GA, 허용 목록 포함) | Google의 가장 뛰어난 멀티모달 비전 모델로, 텍스트, 이미지, 동영상, 멀티턴 채팅을 지원하도록 최적화되어 있습니다. Gemini 1.0 Ultra Vision은 일부 고객에게 정식 버전(GA)으로 제공됩니다. | 최대 토큰 입력: 8,192 최대 토큰 출력: 2,048 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
Gemini 1.5 Pro(비공개 미리보기) | Google의 중간 규모 멀티모달 모델로서, 다양한 태스크에 걸친 확장에 최적화되어 있습니다. Gemini 1.5 Pro는 최대 100만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다. | 최대 토큰 입력: 1,000,000 최대 토큰 출력: 8,192 최대 이미지: 300 최대 동영상 프레임: 3,800 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
PaLM API 모델
다음 표에는 PaLM API에서 사용할 수 있는 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
텍스트용 PaLM 2 ( text-bison ) |
자연어 안내를 따르도록 미세 조정되며 분류, 요약, 추출과 같은 다양한 언어 태스크에 적합합니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 1,024 학습 데이터: 2023년 2월까지 |
감독 대상: 예 RLHF: 예 정제: 아니요 |
텍스트용 PaLM2(text-unicorn ) |
복잡한 자연어 태스크에 사용할 수 있는 PaLM 모델 제품군의 가장 발전된 텍스트 모델입니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 1,024 학습 데이터: 2023년 2월까지 |
감독 대상: 아니요 RLHF: 아니요 정제: 예 (미리보기) |
텍스트용 PaLM 2 32k ( text-bison-32k ) |
자연어 안내를 따르도록 미세 조정되며 다양한 언어 태스크에 적합합니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 학습 데이터: 2023년 8월까지 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
채팅용 PaLM 2 ( chat-bison ) |
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 2048 학습 데이터: 2023년 2월까지 최대 턴 수: 2,500 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
채팅용 PaLM 2 32k ( chat-bison-32k ) |
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 학습 데이터: 2023년 8월까지 최대 턴 수: 2,500 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
텍스트용 임베딩 ( textembedding-gecko ) |
텍스트 입력에 대한 모델 임베딩을 반환합니다. | 3072개의 입력 토큰을 수락하고 768 차원의 벡터 임베딩을 출력합니다. |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
다국어 텍스트용 임베딩 ( textembedding-gecko-multilingual ) |
텍스트 입력에 대해 100개 이상 언어를 지원하는 모델 임베딩을 반환합니다. | 3072개의 입력 토큰을 수락하고 768 차원의 벡터 임베딩을 출력합니다. |
감독 대상: 예(미리보기) RLHF: 아니요 정제: 아니요 |
Codey API 모델
다음 표에는 Codey API에서 사용할 수 있는 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
코드 생성용 Codey ( code-bison ) |
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. | 최대 입력 토큰 수: 6144 최대 출력 토큰 수: 1024 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
Code 생성용 Codey 32k ( code-bison-32k ) |
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
코드 채팅용 Codey ( codechat-bison ) |
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. | 최대 입력 토큰 수: 6144 최대 출력 토큰 수: 1024 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
코드 채팅용 Codey 32k ( codechat-bison-32k ) |
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
코드 완성용 Codey ( code-gecko ) |
작성된 코드의 컨텍스트를 기반으로 코드 완성을 추천하도록 미세 조정된 모델입니다. | 최대 입력 토큰 수: 2048 최대 출력 토큰 수: 64 |
감독 대상: 아니요 RLHF: 아니요 정제: 아니요 |
Imagen API 모델
다음 표에는 Imagen API에서 사용할 수 있는 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
이미지 생성용 Imagen ( imagegeneration ) | 이 모델은 이미지 생성을 지원하며 몇 초 이내에 고품질 시각적 애셋을 만들 수 있습니다. | 프로젝트별 분당 최대 요청 수: 100 최대 생성 이미지: 8 최대 기본 이미지(수정/업스케일링): 10 MB 생성된 이미지 해상도: 1024x1024픽셀 |
지도 대상: 아니요 RLHF: 아니요 |
멀티모달용 임베딩 ( multimodalembedding ) | 이 모델은 사용자가 제공한 입력을 기반으로 벡터를 생성합니다. 여기에는 이미지 및 텍스트 조합이 포함될 수 있습니다. | 프로젝트별 분당 최대 요청 수: 120 최대 텍스트 길이: 토큰 32개 언어: 영어 최대 이미지 크기: 20 MB |
지도 대상: 아니요 RLHF: 아니요 |
이미지 캡션 ( imagetext ) | 이미지 캡션을 지원하는 모델입니다. 이 모델은 지정한 언어를 기반으로 사용자가 제공하는 이미지에서 캡션을 생성합니다. | 프로젝트별 분당 최대 요청 수: 500 언어: 영어, 프랑스어, 독일어, 이탈리아어, 스페인어 최대 이미지 크기: 10 MB 최대 자막 수: 3 |
지도 대상: 아니요 RLHF: 아니요 |
시각적 질의 응답 - VQA ( imagetext ) | 이미지 질문 및 답변을 지원하는 모델입니다. | 프로젝트별 분당 최대 요청 수: 500 언어: 영어 최대 이미지 크기: 10 MB 최대 답변 수: 3 |
지도 대상: 아니요 RLHF: 아니요 |
MedLM API 모델
다음 표에는 MedLM API에서 사용할 수 있는 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
MedLM-medium(medlm-medium ) | Google 연구팀에서 제공하는 의료 업계에 맞춰 조정한 모델 및 API의 HIPAA 규정 준수 제품군입니다. 이러한 모델은 의료 실무자가 의료 질문 및 답변(Q&A)을 제공하고 헬스케어 및 의약품 문서를 요약하는 데 도움을 줍니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 언어: 영어 |
지도 대상: 아니요 RLHF: 아니요 |
MedLM-large (medlm-large ) | Google 연구팀에서 제공하는 의료 업계에 맞춰 조정한 모델 및 API의 HIPAA 규정 준수 제품군입니다. 이러한 모델은 의료 실무자가 의료 질문 및 답변(Q&A)을 제공하고 헬스케어 및 의약품 문서를 요약하는 데 도움을 줍니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 1,024 언어: 영어 |
지도 대상: 아니요 RLHF: 아니요 |
언어 지원
Vertex AI PaLM API 및 Vertex AI Gemini API는 다음 언어로 정식 버전(GA)으로 제공됩니다.
- 아랍어(
ar
) - 벵골어(
bn
) - 불가리아어(
bg
) - 중국어 간체 및 번체(
zh
) - 크로아티아어(
hr
) - 체코어(
cs
) - 덴마크어(
da
) - 네덜란드어(
nl
) - 영어(
en
) - 에스토니아어(
et
) - 핀란드어(
fi
) - 프랑스어(
fr
) - 독일어(
de
) - 그리스어(
el
) - 히브리어(
iw
) - 힌디어(
hi
) - 헝가리어(
hu
) - 인도네시아어(
id
) - 이탈리아어(
it
) - 일본어(
ja
) - 한국어(
ko
) - 라트비아어(
lv
) - 리투아니아어(
lt
) - 노르웨이어(
no
) - 폴란드어(
pl
) - 포르투갈어(
pt
) - 루마니아어(
ro
) - 러시아어(
ru
) - 세르비아어(
sr
) - 슬로바키아어(
sk
) - 슬로베니아어(
sl
) - 스페인어(
es
) - 스와힐리어(
sw
) - 스웨덴어(
sv
) - 태국어(
th
) - 터키어(
tr
) - 우크라이나어(
uk
) - 베트남어(
vi
)
다른 언어에 액세스하려면 Google Cloud 담당자에게 문의하세요.
Model Garden의 모든 모델 살펴보기
Model Garden은 Google 독점 정보를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델 및 애셋을 선택할 수 있게 해주는 플랫폼입니다. Vertex AI에서 사용할 수 있는 생성형 AI 모델 및 API를 살펴보려면 Google Cloud 콘솔의 Model Garden으로 이동합니다.
사용 가능한 모델 및 기능을 포함하여 Model Garden에 대해 자세히 알아보려면 Model Garden에서 AI 모델 살펴보기를 참조하세요.
다음 단계
- Vertex AI Studio 또는 Vertex AI API를 사용하여 빠른 시작 튜토리얼 사용해 보기
- 텍스트 프롬프트 테스트 방법 알아보기
- 채팅 프롬프트 테스트 방법 알아보기
- Model Garden의 미리 학습된 모델 살펴보기
- 기반 모델 조정 방법 알아보기
- 책임감 있는 AI 권장사항 및 Vertex AI 안전 필터 알아보기