MaaS용 Vertex AI 관리형 모델

Vertex AI는 선별된 파트너 및 개방형 모델 목록을 관리형 모델로 지원합니다. 이러한 모델은 Vertex AI를 MaaS(model as a service)로 함께 사용할 수 있으며 관리형 API로 제공됩니다. 관리형 모델을 사용하는 경우 요청을 Vertex AI 엔드포인트로 계속 전송합니다. 관리형 모델은 서버리스이므로 인프라를 프로비저닝하거나 관리할 필요가 없습니다.

Model Garden을 사용하여 관리형 모델을 검색할 수 있습니다. Model Garden을 사용하여 모델을 배포할 수도 있습니다. 자세한 내용은 Model Garden의 AI 모델 살펴보기를 참조하세요.

파트너 모델

다음 파트너 모델은 Vertex AI Model Garden(MaaS)에서 관리형 API로 제공됩니다.

모델 이름 형식 설명 빠른 시작
Claude Sonnet 4.5 언어, 비전 코딩, 컴퓨터 사용, 사이버 보안, 스프레드시트와 같은 사무실 파일 작업 기능을 갖춘 실제 에이전트를 지원하는 Anthropic의 중간 규모 모델입니다. 모델 카드
Claude Opus 4.1 언어, 비전 업계 선도적인 코딩 모델입니다. 수천 단계에 이르는 집중적인 작업과 장기 실행 태스크에서 안정적인 성능을 제공하여 AI 에이전트가 해결할 수 있는 범위를 크게 확장합니다. 최첨단 에이전트 제품과 기능을 지원하는 데 적합합니다. 모델 카드
Claude Haiku 4.5 언어, 비전 Claude Haiku 4.5는 다양한 사용 사례에서 최첨단에 가까운 성능을 제공하며, 무료 제품과 대규모 사용자 환경을 지원하는 적절한 속도와 비용을 갖춘 세계 최고의 코딩 모델 중 하나로 돋보입니다. 모델 카드
Claude Opus 4 언어, 비전 Claude Opus 4는 집중적인 노력과 수천 단계가 필요한 장기 실행 태스크에서 지속적인 성능을 제공하여 AI 에이전트가 해결할 수 있는 범위를 크게 확장합니다. 모델 카드
Claude Sonnet 4 언어, 비전 코딩, 심층 조사, 에이전트와 같은 대량 사용을 위한 우수한 지능을 갖춘 Anthropic의 중간 규모 모델입니다. 모델 카드
Anthropic의 Claude 3.7 Sonnet 언어, 비전 AI 에이전트를 코딩하고 지원하는 업계를 선도하는 모델로, 확장된 사고를 제공하는 최초의 Claude 모델입니다. 모델 카드
Anthropic의 Claude 3.5 Sonnet v2 언어, 비전 업그레이드된 Claude 3.5 Sonnet은 실제 소프트웨어 엔지니어링 태스크와 에이전트 기능을 위한 최첨단 모델입니다. Claude 3.5 Sonnet은 이전 모델과 동일한 가격과 속도로 향상된 기능을 제공합니다. 모델 카드
Anthropic의 Claude 3.5 Haiku 언어, 비전 Anthropic의 차세대 모델인 Claude 3.5 Haiku는 가장 빠르고 경제적인 모델로, 속도와 경제성이 중요한 사용 사례에 적합합니다. 모델 카드
Anthropic의 Claude 3 Haiku 언어 기본 쿼리에 즉각적으로 응답할 수 있는 Anthropic에서 가장 빠른 비전 및 텍스트 모델로, 인간의 상호작용을 모방하는 원활한 AI 경험을 지원합니다. 모델 카드
Anthropic의 Claude 3.5 Sonnet 언어 Claude 3.5 Sonnet은 Anthropic의 중간 등급 모델인 Claude 3 Sonnet의 속도와 비용으로 광범위한 Anthropic 평가에서 Anthropic의 Claude 3 Opus를 능가합니다. 모델 카드
Jamba 1.5 Large(미리보기) 언어 AI21 Labs의 Jamba 1.5 Large는 우수한 품질의 응답, 높은 처리량, 동급의 다른 모델에 비해 경쟁력 있는 가격을 제공할 수 있도록 설계되었습니다. 모델 카드
Jamba 1.5 Mini(프리뷰) 언어 AI21 Labs의 Jamba 1.5 Mini는 품질, 처리량, 저렴한 비용 전반에 걸쳐 균형이 잘 잡혀 있습니다. 모델 카드
Mistral Medium 3 언어 Mistral Medium 3은 프로그래밍, 수학적 추론, 긴 문서 이해, 요약, 대화 등 다양한 작업을 위해 설계된 다목적 모델입니다. 모델 카드
Mistral OCR(25.05) 언어, 비전 Mistral OCR(25.05)은 문서 이해를 위한 광학 문자 인식 API입니다. 모델은 미디어, 텍스트, 표, 방정식과 같은 문서의 각 요소를 이해합니다. 모델 카드
Mistral Small 3.1(25.03) 언어 Mistral Small 3.1(25.03)은 Mistral의 Small 모델 최신 버전으로, 멀티모달 기능과 확장된 컨텍스트 길이가 특징입니다. 모델 카드
Mistral Large(24.11) 언어 Mistral Large(24.11)는 Mistral Large(24.07) 모델의 다음 버전으로, 추론 및 함수 호출 기능이 향상되었습니다. 모델 카드
Codestral 2 언어, 코드 Codestral 2는 Mistral의 코드 생성 전문 모델로, 개발자가 공유된 명령 및 완성 API 엔드포인트를 통해 코드를 작성하고 상호작용할 수 있도록 지원하는 고정밀 fill-in-the-middle (FIM) 완성을 위해 특별히 빌드되었습니다. 모델 카드
Codestral(25.01) 코드 fill-in-the-middle 및 코드 완성을 포함한 코드 생성을 위해 설계된 최신 모델입니다. 모델 카드

개방형 모델

다음 개방형 모델은 Vertex AI Model Garden(MaaS)에서 관리형 API로 제공됩니다.

모델 이름 형식 설명 빠른 시작
gpt-oss 120B 언어 추론 태스크에서 높은 성능을 제공하는 120B 모델입니다. 모델 카드
gpt-oss 20B 언어 소비자 및 에지 하드웨어의 효율성과 배포에 최적화된 20B 모델입니다. 모델 카드
Qwen3-Next-80B Thinking 언어, 코드 복잡한 문제 해결과 심층적인 추론에 특화된 Qwen3-Next 모델 제품군의 모델입니다. 모델 카드
Qwen3-Next-80B Instruct 언어, 코드 특정 명령어를 따르는 데 특화된 Qwen3-Next 모델 제품군의 모델입니다. 모델 카드
Qwen3 Coder 언어, 코드 고급 소프트웨어 개발 태스크를 위해 개발된 오픈-웨이트 모델입니다. 모델 카드
Qwen3 235B 언어 체계적인 추론과 빠른 대화 사이를 전환할 수 있는 '하이브리드 사고' 기능이 있는 오픈-웨이트 모델입니다. 모델 카드
DeepSeek-V3.1 언어 사고 모드와 비사고 모드를 모두 지원하는 DeepSeek의 하이브리드 모델입니다. 모델 카드
DeepSeek R1(0528) 언어 DeepSeek의 최신 버전인 DeepSeek R1 모델입니다. 모델 카드
Llama 4 Maverick 17B-128E 언어, 비전 코딩, 추론, 이미지 기능을 갖춘 가장 크고 기능이 뛰어난 Llama 4 모델입니다. Llama 4 Maverick 17B-128E는 전문가 망(MoE) 아키텍처와 조기 융합을 사용하는 멀티모달 모델입니다. 모델 카드
Llama 4 Scout 17B-16E 언어, 비전 Llama 4 Scout 17B-16E는 여러 벤치마크에서 이전 Llama 세대 및 기타 오픈 및 독점 모델보다 우수한 성능을 제공하는 최신 크기 클래스 결과를 제공합니다. Llama 4 Scout 17B-16E는 전문가 망(MoE) 아키텍처와 조기 융합을 사용하는 멀티모달 모델입니다. 모델 카드
Llama 3.3 언어 Llama 3.3은 텍스트 전용 70B 요청 사항 조정 모델로, 텍스트 전용 애플리케이션에 사용될 때 Llama 3.1 70B 및 Llama 3.2 90B에 비해 향상된 성능을 제공합니다. 또한 일부 애플리케이션의 경우 Llama 3.3 70B가 Llama 3.1 405B의 성능에 근접합니다. 모델 카드
Llama 3.2(미리보기) 언어, 비전 차트 및 그래프 분석, 이미지 캡션과 같은 이미지 추론을 지원할 수 있는 중형 90B 멀티모달 모델입니다. 모델 카드
Llama 3.1 언어

다국어 대화 사용 사례에 최적화된 다국어 LLM 모음으로, 일반적인 업계 벤치마크에서 사용할 수 있는 여러 오픈소스와 비공개 채팅 모델보다 우수한 성능을 발휘합니다.

Llama 3.1 405B는 정식 버전(GA)입니다.

Llama 3.1 8B 및 Llama 3.1 70B는 프리뷰 버전으로 제공됩니다.

모델 카드

다음 단계