이 페이지에서는 Vertex AI의 생성형 AI 및 Vertex AI Model Garden에 대한 프로덕션 업데이트 정보를 설명합니다. 이 페이지를 정기적으로 확인하여 새로운 기능이나 업데이트된 기능, 버그 수정, 알려진 문제, 지원 중단된 기능에 대한 공지를 볼 수 있습니다.
2024년 3월 22일
이제 PDF가 Gemini 1.0 Pro Vision 멀티모달 언어 모델에 대한 입력으로 지원됩니다. PDF로 API를 직접 호출하거나 Vertex AI Studio에서 사용해 볼 수 있습니다. 자세한 내용은 이미지나 PDF가 있는 멀티모달 프롬프트 요청 보내기를 참조하세요.
2024년 3월 19일
Vertex AI의 Anthropic Claude 3 Sonnet 및 Claude 3 Haiku 모델은 Vertex AI 정식 버전으로 제공됩니다.
Anthropic의 관리형 모델 Claude 3 Haiku 및 Claude 3 Sonnet을 Vertex AI에서 사용할 수 있습니다. Vertex AI에서 Claude 모델을 사용하려면 요청을 Vertex AI API 엔드포인트로 직접 보냅니다. 자세한 내용은 Anthropic의 Claude 모델 사용 및 Model Garden의 Claude 모델 카드를 참조하세요.
2024년 2월 21일
Gemma 개방형 모델이 제공됩니다.
Gemini 모델을 만드는 데 사용된 것과 동일한 연구 및 기술로 빌드된 경량형 개방형 모델 제품군인 Gemma 모델을 하드웨어, 휴대기기 또는 호스팅 서비스에서 실행할 수 있습니다. 자세한 내용은 Gemma 개방형 모델 사용 및 Gemma Model Garden 카드를 참조하세요.
2024년 2월 15일
Vertex AI Gemini 1.0 Pro 및 Gemini 1.0 Pro Vision 모델
Vertex AI Gemini 1.0 Pro 및 Gemini 1.0 Pro Vision 멀티모달 언어 모델의 정식 버전(GA)이 출시되었습니다. europe-west1, europe-west2, europe-west3, europe-west4, europe-west9 리전에서도 제공됩니다.
자세한 내용은 다음 항목을 참조하세요.
2024년 2월 9일
멀티모달 임베딩 동영상 지원이 정식 버전으로 제공됩니다.
동영상 데이터의 임베딩이 이제 멀티모달 임베딩 모델(multimodalembedding
)을 사용하여 정식 버전으로 제공됩니다. 자세한 내용은 제품 문서를 참조하세요.
이 기능은 사용하는 모드에 따라 가격이 책정됩니다. 자세한 내용은 가격 책정을 참조하세요.
2024년 2월 7일
Model Garden 업데이트:
특성
다음 모델이 추가되었습니다.
- Stable Diffusion XL LCM: LCM(Latent Consistency Model)은 더 적은 단계로 빠른 고품질 이미지를 생성함으로써 잠재 확산 모델(Latent Diffusion Models)에서 텍스트-이미지 변환을 향상합니다.
- LLaVA 1.5: LLaVA 1.5 모델 배포
- PyTorch-ZipNeRF: Pytorch-ZipNeRF 모델은 Pytorch 프레임워크에서 ZipNeRF 알고리즘을 최첨단 방식으로 구현한 것으로, 2D 이미지에서 효율적이고 정확한 3D 재구성을 위해 설계되었습니다.
- LLaMA 2(양자화): Meta Llama 2 모델의 양자화 버전입니다.
- WizardLM: WizardLM은 Microsoft에서 개발한 대규모 언어 모델(LLM)이며, Evol-Instruct 메서드를 조율하여 복잡한 안내에 따라 미세 조정됩니다.
- WizardCoder: WizardCoder는 Microsoft에서 개발한 대규모 언어 모델(LLM)로, Evol-Instruct 메서드를 코드 도메인에 맞춰 조율하여 복잡한 안내에 따라 미세 조정됩니다.
- AutoGluon: AutoGluon을 사용하면 테이블 형식 데이터에 대한 정확성이 높은 머신러닝 및 딥 러닝 모델을 학습하고 배포할 수 있습니다.
- Lama(Large mask inpainting): 고속 Fourier 컨볼루션(FFC), 수용성이 높은 현장 지각 손실 및 해상도가 높은 이미지 인페인팅을 지원하는 대형 훈련 마스크가 포함된 Large Mask Inpainting을 사용합니다.
변경됨
- 원클릭 조정 버튼과 Llama 2를 위한 전용 배포, 조정, 양자화 및 평가 노트북이 추가되었습니다.
Salesforce/blip-image-captioning-base
및timbrooks/instruct-pix2pix
등 선행 학습된 OSS 아티팩트가 있는 20개 이상의 모델에 대한 원클릭 배포 버튼이 추가되었습니다.- 노트북 및 원클릭 배포 버튼을 사용하여 CodeLlaMA70b를 지원합니다.
- Mistral 모델에 대한 조정 노트북이 추가되었습니다.
- Stable Video Diffusion Img2Vid XT용 서빙 노트북이 추가되었습니다(연구용).
2024년 1월 12일
textembedding-gecko
및 textembedding-gecko-multilingual
모델의 모델 조정은 GA로 제공됩니다. 지도 미세 조정을 사용하여 textembedding-gecko
모델을 조정할 수 있습니다.
자세한 내용은 텍스트 임베딩 조정을 참조하세요.
2024년 1월 8일
AutoSxS로 LLM 병렬 평가
LLM 또는 사전 생성된 예측의 성능을 A/B 테스트할 수 있는 자동 병렬(AutoSxS) 평가 도구가 미리보기로 제공됩니다. 인간 평가자에 비해 더 빠르고 주문형으로 이용 가능하며 더 비용 효율적입니다.
2024년 1월 5일
Vertex AI의 생성형 AI 리전 확장
일괄 예측 및 모델 평가용으로 Vertex AI의 생성형 AI 기능을 사용할 수 있는 Google Cloud 리전이 12개 더 추가됩니다.
2023년 12월 18일
Model Garden 업데이트:
- Vertex AI의 지도 조정에서 사용하는 데이터 세트 형식을 사용하는 OpenLLaMA 모델의 초매개변수 조정 및 맞춤설정된 데이터 세트를 지원합니다.
- falcon-instruct 모델에 대한 GPTQ 변환 지원
- 안정적인 지연 분산형 노트북에 지연된 일관된 모델 및 연구 목적 전용 SDXL-Turbo 모델을 추가합니다.
- Mistral 노트북에 Mixtral 8x7B 모델을 추가합니다.
2023년 12월 13일
Vertex AI Gemini Pro 및 Gemini Pro Vision 모델
Vertex AI Gemini Pro 및 Gemini Pro Vision 멀티모달 언어 모델은 프리뷰 버전으로 사용할 수 있습니다. 자세한 내용은 다음 항목을 참조하세요.
Imagen 2 정식 버전
Imagen의 이미지 생성 모델(imagegeneration@005
)의 005 버전이 이미지 생성 작업에 정식 버전으로 제공됩니다. 이 모델 버전은 이미지 생성 태스크의 기본값입니다. 자세한 내용은 제품 문서를 참조하세요.
Imagen 모델 및 버전에 대한 일반적인 정보는 Imagen 모델 버전 및 수명 주기를 참조하세요.
2023년 12월 12일
텍스트 임베딩 모델 003(textembedding-gecko@003
) 사용 가능
텍스트 임베딩 기반 모델 textembedding-gecko@003
의 업데이트된 안정화 버전을 사용할 수 있습니다. textembedding-gecko@003
기능은 이전 안정화 버전인 textembedding-gecko@001
및 textembedding-gecko@002
에 비해 품질이 향상되었습니다.
모델 버전에 대한 자세한 내용은 모델 버전 및 수명 주기를 참조하세요.
2023년 12월 8일
Vertex AI의 생성형 AI 보안 제어 업데이트
액세스 투명성(AXT) 보안 제어를 다음 기능에서 사용할 수 있습니다.
- 멀티모달 온라인 예측을 위한 임베딩
- Vertex AI의 이미전 온라인 예측
- Vertex AI의 이미전 튜닝
2023년 12월 6일
업데이트된 텍스트 모델
텍스트, 채팅, 코드, 코드 채팅 모델 버전 @002
를 사용할 수 있습니다. @002
모델 버전에는 개선된 프롬프트 응답이 포함됩니다.
@002
모델의 특징은 다음과 같습니다.
text-bison@002
chat-bison@002
code-bison@002
codechat-bison@002
항상 안정화 모델 버전을 사용하려면 버전 번호를 포함한 모델 식별자를 지정합니다. 예를 들면 text-bison@002
입니다. 자세한 내용은 모델 버전 및 수명 주기를 참조하세요.
2023년 12월 5일
특성
모델 그라운딩은 미리보기로 제공됩니다. 그라운딩을 사용하여 text-bison
및 chat-bison
모델을 Vertex AI Search의 구조화되지 않은 데이터 스토어에 연결합니다.
모델은 그라운딩을 통해 데이터 저장소의 정보에 액세스하고 정보를 사용하여 개선된 섬세한 응답을 생성할 수 있습니다.
자세한 내용은 그라운딩 개요를 참조하세요.
2023년 12월 1일
변경
다음 model_garden_name 업데이트를 사용할 수 있습니다.
- LLaMA2, falcon-instruct, openllama, Stable Diffusion 1.5, 2.1, XL 모델과 같은 L4 GPU로 업데이트된 기본 모델 배포 설정
- Vertex AI의 지도 조정에서 사용하는 데이터 세트 형식을 사용하는 LLaMA2 모델의 초매개변수 조정 및 맞춤설정된 데이터 세트 지원
- Vertex AI의 대규모 언어 모델 조정에 권장되는 LoRA 및 QLoRA 설정. 자세한 내용은 LLM의 LoRA 및 QLoRA 권장사항을 참조하세요.
- LLaMA2 및 OpenLLaMA 모델에 대한 AWQ 및 GPTQ 전환 지원
- ViT pytorch 및 JAX 학습, Openllama7b 조정, OpenLLaMA 3b/7b/13b 초매개변수 조정, 안정적인 분산 1.5 조정 및 서빙에 대한 벤치마크 보고서
2023년 11월 30일
특성
텍스트용 PaLM2의 모델 크기가 정식 버전(GA)으로 제공됩니다. text-unicorn
모델은 text-bison
모델보다 복잡한 추론 태스크 집합에 향상된 응답 품질을 제공합니다. 자세한 내용은 모델 정보를 참조하세요.
2023년 11월 17일
ComputeToken API가 미리보기 버전으로 제공됨
ComputeToken API가 미리보기 상태로 제공됩니다. 이 API를 사용하여 지정된 프롬프트의 토큰 목록을 가져올 수 있습니다. 토큰은 텍스트 입력에서 발견되는 일반적인 문자 시퀀스를 표현하는 방법입니다. 자세한 내용은 토큰 목록 가져오기를 참조하세요.
2023년 11월 10일
Vertex AI의 생성형 AI
보안 제어는 Vertex AI 기능의 추가 생성형 AI에 사용할 수 있습니다.
2023년 11월 3일
Model Garden 업데이트
특성
다음 모델이 Model Garden에 추가되었습니다.
- ImageBind: 멀티모달 임베딩 모델
- Vicuna v1.5: llama2를 기반으로 미세 조정된 LLM
- OWL-ViT v2: SoTA 개방형 어휘 객체 감지 모델
- DITO: SoTA 개방형 어휘 객체 감지 모델
- NLLB: 다국어 번역 모델
- Mitral-7B: 작은 크기의 SoTA LLM
- BioGPT: 생물 의학 분야에 맞게 미세 조정된 LLM
- BiomedCILP: 생물 의학 분야에 맞게 미세 조정된 멀티모달 기반 모델
사용 가능한 모든 모델 목록을 보려면 Model Garden의 모델 살펴보기를 참조하세요.
변경됨
- 언어 모델 서빙 처리량이 개선되었습니다. 자세한 내용은 Model Garden에서 오픈소스 대규모 언어 모델을 효율적으로 서빙을 참조하세요. 관련 모델 카드의 노트북이 그에 따라 업데이트되었습니다.
- 추론 속도는 Stable Diffusion 1.5, 2.1, XL 모델의 원래 구현보다 최대 2배 더 빠릅니다.
- 지원되는 모든 모델 카드에서 배포 버튼의 워크플로가 개선되었습니다.
- 모델 서빙을 위한 추천 머신 사양 및 모델 평가를 위한 EleutherAI의 평가 하네스 Docker를 포함하여 Llama2, OpenLlama, Falcon Instruct의 노트북이 업데이트되었습니다.
새로운 textembedding-gecko
및 textembedding-gecko-multilingual
안정적 모델 버전
Vertex AI의 생성형 AI에서는 다음과 같은 안정적 모델 버전을 사용할 수 있습니다.
textembedding-gecko@002
textembedding-gecko-multilingual@001
모델 버전에 대한 자세한 내용은 모델 버전 및 수명 주기를 참조하세요.
2023년 11월 2일
Vertex AI의 생성형 AI는 북미, 유럽, 아시아의 12개 리전 API를 통해 액세스할 수 있습니다. 리전 API를 통해 고객은 데이터를 저장하는 위치를 제어할 수 있습니다.
2023년 11월 3일
chat-bison@001
에 대한 모델 미세 조정이 정식 버전(GA)으로 제공됩니다.
chat-bison@001
조정이 텐서보드 측정항목 시각화를 지원합니다. 자세한 내용은 측정항목 조정 및 평가를 참조하세요.
2023년 10월 4일
textembedding-gecko
에 대한 모델 조정이 미리보기로 제공됩니다.
지도 조정을 사용해서 textembedding-gecko
모델을 조정할 수 있습니다. 이 기능은 미리보기 상태입니다.
자세한 내용은 텍스트 임베딩 조정을 참조하세요.
2023년 9월 1일
가격 업데이트
text-bison
의 가격은 입력 및 출력 문자 1,000개당 $0.0005로 감소했습니다. 자세한 내용은 Vertex AI 가격 책정을 참조하세요.
2023년 8월 29일
새로운 Vertex AI의 생성형 AI 모델과 확장된 언어 지원
Vertex AI의 생성형 AI가 새로운 언어 모델 후보(최신 모델), 최대 32,000개까지 입력 및 출력 토큰을 지원하는 언어 모델, 추가 지원 언어를 포함하도록 업데이트되었습니다. 자세한 내용은 사용 가능한 모델 및 모델 버전과 수명 주기를 참조하세요.
생성형 AI 모델의 응답 스트리밍
생성형 AI 모델 스트리밍 지원이 정식 버전(GA)으로 제공됩니다. 사용자가 프롬프트를 전송하면 모델이 전체 출력을 사용할 수 있을 때까지 기다리는 대신 생성되는 대로 응답 토큰을 반환합니다.
지원되는 모델은 다음과 같습니다.
text-bison
chat-bison
code-bison
codechat-bison
자세한 내용은 생성형 AI 모델에서 응답 스트리밍을 참조하세요.
text-bison
모델 감독 조정이 정식 버전(GA)으로 제공됩니다.
text-bison
모델의 감독 조정이 정식 버전(GA)으로 제공됩니다.
chat-bison
모델의 모델 조정이 미리보기로 제공됩니다.
지도 조정을 사용해서 chat-bison
모델을 조정할 수 있습니다. 이 기능은 미리보기 상태입니다.
자세한 내용은 텍스트 모델 조정을 참조하세요.
미리보기로 제공되는 새로운 임베딩 모델
Vertex AI의 생성형 AI 사용자가 다양한 비영어권 언어로 학습된 새로운 모델을 사용해서 임베딩을 만들 수 있습니다. 이 모델은 미리보기 상태입니다.
textembedding-gecko-multilingual
자세한 내용은 텍스트 임베딩 가져오기를 참조하세요.
정식 버전(GA)으로 제공되는 Imagen 주제 조정 및 스타일 조정
Vertex AI의 Imagen에 다음과 같은 정식 버전 기능이 제공됩니다.
- 주제 모델 조정(표준 조정)*
- 스타일 모델 조정*
* 제한된 액세스 기능.
Vertex AI의 Imagen 또는 제한된 GA 액세스 방법에 대한 자세한 내용은 Vertex AI의 Imagen 개요를 참조하세요.
text-bison
에 대한 인간 피드백 강화 학습(RLHF) 조정
Vertex AI의 생성형 AI 텍스트 생성 기반 모델(text-bison
)에서 RLHF 조정이 지원됩니다. RLHF 조정 기능은 미리보기 상태입니다.
자세한 내용은 RLHF 모델 조정 사용을 참조하세요.
Vertex AI Codey API 언어 지원
Vertex AI Codey API에서 추가적인 프로그래밍 언어가 지원됩니다. 자세한 내용은 지원되는 코딩 언어를 참조하세요.
Vertex AI Codey API의 지도 조정 지원
Vertex AI Codey API 모델인 코드 채팅(codechat-bison
) 및 코드 생성(code-bison
)에서 지도 조정이 지원됩니다. Vertex AI Codey API 모델 특성에 대한 지도 조정은 미리보기 버전입니다. 자세한 내용은 코드 모델 조정을 참조하세요.
측정항목 기반 모델 평가
분류, 요약, 질의 응답, 일반 텍스트 생성을 위해 평가 데이터 세트를 기반으로 기반 모델 및 조정된 모델의 성능을 평가할 수 있습니다. 이 기능은 미리보기 상태로 제공됩니다.
자세한 내용은 모델 성능 평가를 참조하세요.
미리보기에서 CountToken API 사용 가능
CountToken API가 미리보기 상태로 제공됩니다. 이 API를 사용하여 토큰 수와 프롬프트에 대한 청구 가능한 문자 수를 가져올 수 있습니다. 자세한 내용은 토큰 수 가져오기를 참조하세요.
2023년 8월 9일
GA로 제공되는 Imagen 멀티모달 임베딩
Vertex AI의 Imagen에 다음과 같은 정식 버전 기능이 제공됩니다.
- 멀티모달 임베딩
이 기능은 이미지 입력 또는 텍스트 입력을 사용하는지에 따라 다른 가격 책정이 적용됩니다. 자세한 내용은 멀티모달 임베딩 기능 페이지를 참조하세요.
2023년 8월 21일
모델 조정 매개변수 업데이트
모델 조정 작업에 모델 평가 및 Vertex AI 텐서보드 통합을 위한 선택적 매개변수가 허용됩니다. 이를 통해 모델을 평가하고 단일 명령어로 시각화를 생성할 수 있습니다. 자세한 내용은 모델 조정 작업 만들기를 참조하세요.
2023년 7월 28일
모델 조정 매개변수 업데이트
모델 조정의 learning_rate
매개변수는 learning_rate_multiplier
입니다.
모델 또는 조정 모델의 기본 학습률을 사용하려면 1.0
의 learning_rate_multiplier
기본값을 사용합니다.
이전에 learning_rate
를 구성하지 않았으면 별도의 조치를 취할 필요가 없습니다.
v2.0.0 파이프라인 템플릿(Python SDK v1.28.1+)과 함께 tuning_method=tune_v2
를 사용하는 경우 권장되는 학습률은 0.0002입니다. 커스텀 learning_rate
를 learning_rate_multiplier
로 변환하려면 다음과 같이 계산합니다.
learing_rate_multiplier = custom_learning_rate_value / 0.0002
2023년 7월 18일
text-bison의 모델 조정 업데이트
- 업그레이드된 조정 파이프라인이 text-bison에 대해 더 효율적인 조정과 더 나은 성능을 제공합니다.
- GPU 지원과 함께 제공되는 새로운 조정 리전(
us-central1
) - 새로운
learning_rate
매개변수를 사용하면 각 반복 시 보폭을 조정할 수 있습니다.
자세한 내용은 언어 기반 모델 조정을 참조하세요.
Chirp GA
Cherp의 정식 버전(GA)이 제공됩니다. 자세한 내용은 다음 페이지를 참조하세요.
2023년 7월 17일
Vertex AI 정식 버전의 Imagen 기능
Vertex AI의 Imagen에 다음과 같은 정식 버전 기능이 제공됩니다.
* 제한된 액세스 기능.
Imagen 또는 제한된 GA 또는 미리보기 기능에 액세스하는 방법에 대한 자세한 내용은 Vertex AI의 Imagen 개요를 참조하세요.
사람 얼굴 생성 지원
Imagen에서 다음 기능에 대한 사람 얼굴 생성이 지원됩니다.
* 제한된 액세스 기능.
사람 또는 유명인이 있는 이미지를 제외하고 사람 얼굴 생성은 기본으로 사용 설정되어 있습니다. 자세한 내용은 사용 가이드라인을 참조하세요.
추가 언어 지원
Vertex AI PaLM API에 다음 언어에 대한 지원이 추가되었습니다.
- 스페인어(es)
- 한국어(ko)
- 힌디어(hi)
- 중국어(zh)
지원되는 전체 언어 목록은 지원되는 언어를 참조하세요.
2023년 7월 13일
텍스트용 PaLM 2 일괄 지원
일괄 텍스트(text-bison
) 요청에 대한 지원이 정식 버전으로 제공됩니다.
Vertex AI 가격 책정 페이지에서 chat-bison
모델에 대한 가격 책정을 검토할 수 있습니다.
2023년 7월 10일
채팅용 PaLM 2
채팅(chat-bison
)이 정식 버전으로 제공됩니다.
Vertex AI 가격 책정 페이지에서 chat-bison
모델에 대한 가격 책정을 검토할 수 있습니다.
2023년 6월 29일
Vertex AI Codey API
Vertex AI Codey API가 정식 버전(GA)으로 제공됩니다. Vertex AI Codey API를 사용해서 코드 생성, 코드 완성, 코드 채팅 기능으로 솔루션을 만들 수 있습니다. Vertex AI Codey API가 GA 상태이므로 이를 사용하면 사용 비용이 발생합니다. 가격 책정에 대한 자세한 내용은 Vertex AI의 생성형 AI 가격 책정 페이지를 참조하세요.
이 출시 버전의 모델에는 다음이 포함됩니다.
code-bison
(코드 생성)codechat-bison
(코드 채팅)code-gecko
(코드 완성)
더 긴 프롬프트 및 채팅 기록을 허용하기 위해 code-bison
및 codechat-bison
에 대한 최대 입력 토큰 수가 4,096개에서 6,144개로 증가했습니다. 더 긴 응답을 허용하기 위해 code-bison
및 codechat-bison
에 대한 최대 출력 토큰 수는 1,024개에서 2,048개로 증가했습니다.
추가 프로그래밍 언어가 지원됩니다. 자세한 내용은 지원되는 코딩 언어를 참조하세요.
다음 개선 사항을 구현하기 위해 code-bison
및 codechat-bison
모델에서 몇 가지 미세 조정 데이터 세트가 삭제되었습니다.
- 과도한 채팅 응답 생성
- NBSP(줄바꿈하지 않는 공백) 문자와 같은 아티팩트 생성
- 저품질 코드 응답
클라우드 수평 요소에 대해 자세히 알아보려면 Vertex AI 인증을 참조하세요.
2023년 6월 15일
채팅용 PaLM 2
chat-bison
모델이 context
필드의 안내를 더 잘 따를 수 있도록 업데이트되었습니다. chat-bison
에 대해 채팅 프롬프트를 만드는 방법은 채팅 프롬프트 설계를 참조하세요.
2023년 6월 7일
PaLM 텍스트와 임베딩 API, Vertex AI Studio
Vertex AI의 생성형 AI 지원이 정식 버전으로 제공됩니다.
이 기능 출시 덕분에 Vertex AI PaLM API를 사용해서 AI 기반 애플리케이션에서 테스트, 조정, 배포할 수 있는 AI 모델을 생성할 수 있습니다.
이러한 기능은 GA 상태이므로 text-bison
및 textembedding-gecko
PaLM API를 사용하면 사용 비용이 발생합니다. 가격 책정에 대한 자세한 내용은 Vertex AI 가격 책정 페이지를 참조하세요.
이 출시 버전의 기능 및 모델에는 다음이 포함됩니다.
- 텍스트용 PaLM 2:
text-bison
- 텍스트용 임베딩:
textembedding-gecko
- 언어용 Vertex AI Studio
Model Garden
Model Garden이 이제 정식 버전으로 제공됩니다. Model Garden은 Vertex AI를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델을 선택할 수 있게 해주는 플랫폼입니다. 이러한 모델은 조정 가능한 모델부터 태스크별로 달라지는 모델까지 다양하며 Google Cloud 콘솔의 Model Garden 페이지에서 모두 제공됩니다.
시작하려면 Model Garden의 AI 모델 및 API 살펴보기를 참조하세요.
Vertex AI Codey API
Vertex AI Codey API가 미리보기 상태로 제공됩니다.
Codey API에서는 허용 목록 없이도 모든 Google Cloud 프로젝트에서 코드 생성, 코드 완성, 코드 채팅 API를 사용할 수 있습니다. 이러한 API는 us-central1
리전에서 액세스할 수 있습니다. Codey API는 Vertex AI Studio에서 또는 REST 명령어로 프로그래매틱 방식으로 사용할 수 있습니다.
시작하려면 코드 모델 개요를 참조하세요.
2023년 5월 10일
Vertex AI의 생성형 AI
Vertex AI의 생성형 AI가 미리보기 버전으로 제공됩니다. 이 기능 출시 덕분에 Vertex AI PaLM API를 사용해서 AI 기반 애플리케이션에서 테스트, 조정, 배포할 수 있는 AI 모델을 생성할 수 있습니다.
이 출시 버전의 기능 및 모델에는 다음이 포함됩니다.
- 텍스트용 PaLM 2:
text-bison
- 채팅용 PaLM 2:
chat-bison
- 텍스트용 임베딩:
textembedding-gecko
- 언어용 Vertex AI Studio
- PaLM 2용 조정
- TextGenerationModel(
text-bison
), ChatModel(chat-bison
), TextEmbeddingModel(textembedding-gecko@001
)과 같은 새로운 기능을 포함하는 Vertex AI SDK v1.25
Google Cloud 콘솔, Vertex AI API, Python용 Vertex AI SDK에서 Vertex AI Studio를 사용하여 Vertex AI에서 생성형 AI 기능을 사용할 수 있습니다.
- Vertex AI의 생성형 AI에 대해 자세히 알아보세요.
- Vertex AI Studio 소개를 참조하세요.
- Vertex AI Studio 빠른 시작으로 시작하세요.
Model Garden
Model Garden이 미리보기 상태로 제공됩니다. Model Garden은 Vertex AI를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델을 선택할 수 있게 해주는 플랫폼입니다. 이러한 모델은 조정 가능한 모델부터 태스크별로 달라지는 모델까지 다양하며 Google Cloud 콘솔의 Model Garden 페이지에서 모두 제공됩니다.