이 페이지에서는 Vertex AI의 레거시 생성 AI 모델에 대한 정보를 제공합니다. 레거시 모델 계열의 모델은 더 이상 새로운 안정화 버전으로 업데이트되지 않습니다. 레거시 모델의 모든 안정화 버전이 지원 중단 날짜에 도달하면 해당 모델 제품군은 더 이상 지원되지 않습니다.
PaLM API 모델
다음 표에는 PaLM API 레거시 모델이 요약되어 있습니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
텍스트용 PaLM 2 ( text-bison ) |
자연어 안내를 따르도록 미세 조정되며 분류, 요약, 추출과 같은 다양한 언어 태스크에 적합합니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 1,024 학습 데이터: 2023년 2월까지 |
감독 대상: 예 RLHF: 예 (미리보기) 정제: 아니요 |
텍스트용 PaLM 2(text-unicorn ) |
복잡한 자연어 태스크에 사용할 수 있는 PaLM 모델 제품군의 가장 발전된 텍스트 모델입니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 1,024 학습 데이터: 2023년 2월까지 |
감독 대상: 아니요 RLHF: 아니요 정제: 예 (미리보기) |
텍스트용 PaLM 2 32k ( text-bison-32k ) |
자연어 안내를 따르도록 미세 조정되며 다양한 언어 태스크에 적합합니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 학습 데이터: 2023년 8월까지 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
채팅용 PaLM 2 ( chat-bison ) |
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. | 최대 입력 토큰 수: 8,192 최대 출력 토큰 수: 2048 학습 데이터: 2023년 2월까지 최대 턴 수: 2,500 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
채팅용 PaLM 2 32k ( chat-bison-32k ) |
멀티턴 대화 사용 사례에 맞게 미세 조정됩니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 학습 데이터: 2023년 8월까지 최대 턴 수: 2,500 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
Codey API 모델
다음 표에는 Codey API 레거시 모델이 요약되어 있습니다. 참고:
code-gecko
코드 완성 모델은 레거시 모델이 아닙니다.
모델 이름 | 설명 | 모델 속성 | 조정 지원 |
---|---|---|---|
코드 생성용 Codey ( code-bison ) |
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. | 최대 입력 토큰 수: 6144 최대 출력 토큰 수: 1024 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
Code 생성용 Codey 32k ( code-bison-32k ) |
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
코드 채팅용 Codey ( codechat-bison ) |
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. | 최대 입력 토큰 수: 6144 최대 출력 토큰 수: 1024 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
코드 채팅용 Codey 32k ( codechat-bison-32k ) |
코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다. | 최대 토큰 수(입력 + 출력): 32,768 최대 출력 토큰 수: 8,192 |
감독 대상: 예 RLHF: 아니요 정제: 아니요 |
언어 지원
Vertex AI PaLM API 및 Codey API 레거시 모델은 다음 언어를 지원합니다.
- 아랍어(
ar
) - 벵골어(
bn
) - 불가리아어(
bg
) - 중국어 간체 및 번체(
zh
) - 크로아티아어(
hr
) - 체코어(
cs
) - 덴마크어(
da
) - 네덜란드어(
nl
) - 영어(
en
) - 에스토니아어(
et
) - 핀란드어(
fi
) - 프랑스어(
fr
) - 독일어(
de
) - 그리스어(
el
) - 히브리어(
iw
) - 힌디어(
hi
) - 헝가리어(
hu
) - 인도네시아어(
id
) - 이탈리아어(
it
) - 일본어(
ja
) - 한국어(
ko
) - 라트비아어(
lv
) - 리투아니아어(
lt
) - 노르웨이어(
no
) - 폴란드어(
pl
) - 포르투갈어(
pt
) - 루마니아어(
ro
) - 러시아어(
ru
) - 세르비아어(
sr
) - 슬로바키아어(
sk
) - 슬로베니아어(
sl
) - 스페인어(
es
) - 스와힐리어(
sw
) - 스웨덴어(
sv
) - 태국어(
th
) - 터키어(
tr
) - 우크라이나어(
uk
) - 베트남어(
vi
)
레거시 모델 지원 중단 날짜
다음 표는 레거시 모델의 지원 중단 날짜를 보여줍니다.
chat-bison 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
chat-bison@002 | 2023년 12월 6일 | 2025년 4월 9일 |
chat-bison-32k 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
chat-bison-32k@002 | 2023년 12월 4일 | 2025년 4월 9일 |
code-bison 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
code-bison@002 | 2023년 12월 6일 | 2025년 4월 9일 |
code-bison-32k 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
code-bison-32k@002 | 2023년 12월 4일 | 2025년 4월 9일 |
codechat-bison 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
codechat-bison@002 | 2023년 12월 6일 | 2025년 4월 9일 |
codechat-bison-32k 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
codechat-bison-32k@002 | 2023년 12월 4일 | 2025년 4월 9일 |
text-bison 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
text-bison@002 | 2023년 12월 6일 | 2025년 4월 9일 |
text-bison-32k 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
text-bison-32k@002 | 2023년 12월 4일 | 2025년 4월 9일 |
text-unicorn 모델 | 출시일 | 지원 중단 날짜 |
---|---|---|
text-unicorn@001 | 2023년 11월 30일 | 2025년 4월 9일 |
프로비저닝된 처리량을 지원하는 기존 모델
이 표에는 초당 문자로 측정되는 프로비저닝된 처리량, 최소 구매 증분, 소진율을 지원하는 기존 모델이 나와 있습니다.
모델 | GSU당 처리량 | 최소 GSU 구매 증분 | 소진율 |
---|---|---|---|
text-bison , chat-bison ,
code-bison , codechat-bison |
4,000 | 1 | 입력 문자 1자 = 문자 1자 출력 문자 1자 = 문자 2자 |
text-unicorn |
400 | 1 | 입력 문자 1자 = 문자 1자 출력 문자 1자 = 문자 3자 |