모델 정보

Vertex AI는 AI 기반 애플리케이션에서 사용하기 위해 테스트, 배포, 맞춤설정할 수 있는 점점 더 많은 기반 모델 목록을 제공합니다. 기반 모델은 특정 사용 사례에 맞게 조정되며 여러 가격대로 제공됩니다. 이 페이지에서는 다양한 API에서 제공하는 모델을 요약하고 사용 사례별로 선택할 수 있는 모델을 안내합니다.

Vertex AI에서 모든 AI 모델 및 API에 대해 알아보려면 AI 모델 및 API 살펴보기를 참조하세요.

기반 모델 API

Vertex AI에는 다음과 같은 기반 모델 API가 있습니다.

  • Gemini API(멀티모달 데이터, 텍스트, 코드, 채팅)
  • PaLM API(텍스트, 채팅, 임베딩)
  • Codey API(코드 생성, 코드 채팅, 코드 완성)
  • Imagen API(이미지 생성, 이미지 수정, 이미지 캡션, 시각적 질의 응답, 멀티모달 임베딩)

Gemini API 모델

다음 표에는 Gemini API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 모델 속성 조정 지원
Gemini 1.0 Pro
(gemini-1.0-pro)
자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다. 텍스트만 포함된 프롬프트에 Gemini 1.0 Pro를 사용합니다. 총 최대 토큰 수(입력 및 출력): 32,760
최대 출력 토큰 수: 8,192
학습 데이터: 2023년 2월까지
감독 대상: 아니요
RLHF: 아니요
정제: 아니요
Gemini 1.0 Pro Vision
(gemini-1.0-pro-vision)
텍스트 또는 코드 응답에 대한 텍스트 또는 채팅 프롬프트에서 이미지 및 동영상 추가를 지원하는 멀티모달 모델입니다. Gemini 1.0 Pro Vision 멀티모달 프롬프트를 사용합니다. 총 최대 토큰 수(입력 및 출력): 16,384
최대 출력 토큰 수: 2,048
최대 이미지 크기: 제한 없음
프롬프트당 최대 이미지 수: 16
최대 동영상 길이: 2분
프롬프트당 최대 동영상 수: 1
학습 데이터: 2023년 2월까지
감독 대상: 아니요
RLHF: 아니요
정제: 아니요
Gemini 1.0 Ultra(GA, 허용 목록 포함) 안내, 코드, 추론 등의 복잡한 작업에 최적화되어 있으며 여러 언어를 지원하는 Google의 가장 뛰어난 멀티모달 모델입니다. Gemini 1.0 Ultra는 일부 고객에게 정식 버전(GA)으로 제공됩니다. 최대 토큰 입력: 8,192
최대 토큰 출력: 2,048
감독 대상: 아니요
RLHF: 아니요
정제: 아니요
Gemini 1.0 Ultra Vision(GA, 허용 목록 포함) Google의 가장 뛰어난 멀티모달 비전 모델로, 텍스트, 이미지, 동영상, 멀티턴 채팅을 지원하도록 최적화되어 있습니다. Gemini 1.0 Ultra Vision은 일부 고객에게 정식 버전(GA)으로 제공됩니다. 최대 토큰 입력: 8,192
최대 토큰 출력: 2,048
감독 대상: 아니요
RLHF: 아니요
정제: 아니요
Gemini 1.5 Pro(비공개 미리보기) Google의 중간 규모 멀티모달 모델로서, 다양한 태스크에 걸친 확장에 최적화되어 있습니다. Gemini 1.5 Pro는 최대 100만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다. 최대 토큰 입력: 1,000,000
최대 토큰 출력: 8,192
최대 이미지: 300
최대 동영상 프레임: 3,800
감독 대상: 아니요
RLHF: 아니요
정제: 아니요

PaLM API 모델

다음 표에는 PaLM API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 모델 속성 조정 지원
텍스트용 PaLM 2
(text-bison)
자연어 안내를 따르도록 미세 조정되며 분류, 요약, 추출과 같은 다양한 언어 태스크에 적합합니다. 최대 입력 토큰 수: 8,192
최대 출력 토큰 수: 1,024
학습 데이터: 2023년 2월까지
감독 대상:
RLHF:
정제: 아니요
텍스트용 PaLM2(text-unicorn) 복잡한 자연어 태스크에 사용할 수 있는 PaLM 모델 제품군의 가장 발전된 텍스트 모델입니다. 최대 입력 토큰 수: 8,192
최대 출력 토큰 수: 1,024
학습 데이터: 2023년 2월까지
감독 대상: 아니요
RLHF: 아니요
정제: (미리보기)
텍스트용 PaLM 2 32k
(text-bison-32k)
자연어 안내를 따르도록 미세 조정되며 다양한 언어 태스크에 적합합니다. 최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
학습 데이터: 2023년 8월까지
감독 대상:
RLHF: 아니요
정제: 아니요
채팅용 PaLM 2
(chat-bison)
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. 최대 입력 토큰 수: 8,192
최대 출력 토큰 수: 2048
학습 데이터: 2023년 2월까지
최대 턴 수: 2,500
감독 대상:
RLHF: 아니요
정제: 아니요
채팅용 PaLM 2 32k
(chat-bison-32k)
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. 최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
학습 데이터: 2023년 8월까지
최대 턴 수: 2,500
감독 대상:
RLHF: 아니요
정제: 아니요
텍스트용 임베딩
(textembedding-gecko)
텍스트 입력에 대한 모델 임베딩을 반환합니다. 3072개의 입력 토큰을 수락하고 768 차원의 벡터 임베딩을 출력합니다. 감독 대상:
RLHF: 아니요
정제: 아니요
다국어 텍스트용 임베딩
(textembedding-gecko-multilingual)
텍스트 입력에 대해 100개 이상 언어를 지원하는 모델 임베딩을 반환합니다. 3072개의 입력 토큰을 수락하고 768 차원의 벡터 임베딩을 출력합니다. 감독 대상: (미리보기)
RLHF: 아니요
정제: 아니요

Codey API 모델

다음 표에는 Codey API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 모델 속성 조정 지원
코드 생성용 Codey
(code-bison)
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. 최대 입력 토큰 수: 6144
최대 출력 토큰 수: 1024
감독 대상:
RLHF: 아니요
정제: 아니요
Code 생성용 Codey 32k
(code-bison-32k)
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. 최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
감독 대상:
RLHF: 아니요
정제: 아니요
코드 채팅용 Codey
(codechat-bison)
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. 최대 입력 토큰 수: 6144
최대 출력 토큰 수: 1024
감독 대상:
RLHF: 아니요
정제: 아니요
코드 채팅용 Codey 32k
(codechat-bison-32k)
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. 최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
감독 대상:
RLHF: 아니요
정제: 아니요
코드 완성용 Codey
(code-gecko)
작성된 코드의 컨텍스트를 기반으로 코드 완성을 추천하도록 미세 조정된 모델입니다. 최대 입력 토큰 수: 2048
최대 출력 토큰 수: 64
감독 대상: 아니요
RLHF: 아니요
정제: 아니요

Imagen API 모델

다음 표에는 Imagen API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 모델 속성 조정 지원
이미지 생성용 Imagen
(imagegeneration)
이 모델은 이미지 생성을 지원하며 몇 초 이내에 고품질 시각적 애셋을 만들 수 있습니다. 프로젝트별 분당 최대 요청 수: 100
최대 생성 이미지: 8
최대 기본 이미지(수정/업스케일링): 10 MB
생성된 이미지 해상도: 1024x1024픽셀
지도 대상: 아니요
RLHF: 아니요
멀티모달용 임베딩
(multimodalembedding)
이 모델은 사용자가 제공한 입력을 기반으로 벡터를 생성합니다. 여기에는 이미지 및 텍스트 조합이 포함될 수 있습니다. 프로젝트별 분당 최대 요청 수: 120
최대 텍스트 길이: 토큰 32개
언어: 영어
최대 이미지 크기: 20 MB
지도 대상: 아니요
RLHF: 아니요
이미지 캡션
(imagetext)
이미지 캡션을 지원하는 모델입니다. 이 모델은 지정한 언어를 기반으로 사용자가 제공하는 이미지에서 캡션을 생성합니다. 프로젝트별 분당 최대 요청 수: 500
언어: 영어, 프랑스어, 독일어, 이탈리아어, 스페인어
최대 이미지 크기: 10 MB
최대 자막 수: 3
지도 대상: 아니요
RLHF: 아니요
시각적 질의 응답 - VQA
(imagetext)
이미지 질문 및 답변을 지원하는 모델입니다. 프로젝트별 분당 최대 요청 수: 500
언어: 영어
최대 이미지 크기: 10 MB
최대 답변 수: 3
지도 대상: 아니요
RLHF: 아니요

MedLM API 모델

다음 표에는 MedLM API에서 사용할 수 있는 모델이 요약되어 있습니다.

모델 이름 설명 모델 속성 조정 지원
MedLM-medium(medlm-medium) Google 연구팀에서 제공하는 의료 업계에 맞춰 조정한 모델 및 API의 HIPAA 규정 준수 제품군입니다. 이러한 모델은 의료 실무자가 의료 질문 및 답변(Q&A)을 제공하고 헬스케어 및 의약품 문서를 요약하는 데 도움을 줍니다. 최대 토큰 수(입력 + 출력): 32,768
최대 출력 토큰 수: 8,192
언어: 영어
지도 대상: 아니요
RLHF: 아니요
MedLM-large (medlm-large) Google 연구팀에서 제공하는 의료 업계에 맞춰 조정한 모델 및 API의 HIPAA 규정 준수 제품군입니다. 이러한 모델은 의료 실무자가 의료 질문 및 답변(Q&A)을 제공하고 헬스케어 및 의약품 문서를 요약하는 데 도움을 줍니다. 최대 입력 토큰 수: 8,192
최대 출력 토큰 수: 1,024
언어: 영어
지도 대상: 아니요
RLHF: 아니요

언어 지원

Vertex AI PaLM APIVertex AI Gemini API는 다음 언어로 정식 버전(GA)으로 제공됩니다.

  • 아랍어(ar)
  • 벵골어(bn)
  • 불가리아어(bg)
  • 중국어 간체 및 번체(zh)
  • 크로아티아어(hr)
  • 체코어(cs)
  • 덴마크어(da)
  • 네덜란드어(nl)
  • 영어(en)
  • 에스토니아어(et)
  • 핀란드어(fi)
  • 프랑스어(fr)
  • 독일어(de)
  • 그리스어(el)
  • 히브리어(iw)
  • 힌디어(hi)
  • 헝가리어(hu)
  • 인도네시아어(id)
  • 이탈리아어(it)
  • 일본어(ja)
  • 한국어(ko)
  • 라트비아어(lv)
  • 리투아니아어(lt)
  • 노르웨이어(no)
  • 폴란드어(pl)
  • 포르투갈어(pt)
  • 루마니아어(ro)
  • 러시아어(ru)
  • 세르비아어(sr)
  • 슬로바키아어(sk)
  • 슬로베니아어(sl)
  • 스페인어(es)
  • 스와힐리어(sw)
  • 스웨덴어(sv)
  • 태국어(th)
  • 터키어(tr)
  • 우크라이나어(uk)
  • 베트남어(vi)

다른 언어에 액세스하려면 Google Cloud 담당자에게 문의하세요.

Model Garden의 모든 모델 살펴보기

Model Garden은 Google 독점 정보를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델 및 애셋을 선택할 수 있게 해주는 플랫폼입니다. Vertex AI에서 사용할 수 있는 생성형 AI 모델 및 API를 살펴보려면 Google Cloud 콘솔의 Model Garden으로 이동합니다.

Model Garden으로 이동

사용 가능한 모델 및 기능을 포함하여 Model Garden에 대해 자세히 알아보려면 Model Garden에서 AI 모델 살펴보기를 참조하세요.

다음 단계