Vertex AI는 선별된 파트너 및 개방형 모델 목록을 관리형 모델로 지원합니다. 이러한 모델은 Vertex AI를 MaaS(model as a service)로 함께 사용할 수 있으며 관리형 API로 제공됩니다. 관리형 모델을 사용하는 경우 요청을 Vertex AI 엔드포인트로 계속 전송합니다. 관리형 모델은 서버리스이므로 인프라를 프로비저닝하거나 관리할 필요가 없습니다.
Model Garden을 사용하여 관리형 모델을 검색할 수 있습니다. Model Garden을 사용하여 모델을 배포할 수도 있습니다. 자세한 내용은 Model Garden의 AI 모델 살펴보기를 참조하세요.
파트너 모델
다음 파트너 모델은 Vertex AI Model Garden(MaaS)에서 관리형 API로 제공됩니다.
모델 이름 | 형식 | 설명 | 빠른 시작 |
---|---|---|---|
Claude Sonnet 4.5 | 언어, 비전 | 코딩, 컴퓨터 사용, 사이버 보안, 스프레드시트와 같은 사무실 파일 작업 기능을 갖춘 실제 에이전트를 지원하는 Anthropic의 중간 규모 모델입니다. | 모델 카드 |
Claude Opus 4.1 | 언어, 비전 | 업계 선도적인 코딩 모델입니다. 수천 단계에 이르는 집중적인 작업과 장기 실행 태스크에서 안정적인 성능을 제공하여 AI 에이전트가 해결할 수 있는 범위를 크게 확장합니다. 최첨단 에이전트 제품과 기능을 지원하는 데 적합합니다. | 모델 카드 |
Claude Haiku 4.5 | 언어, 비전 | Claude Haiku 4.5는 다양한 사용 사례에서 최첨단에 가까운 성능을 제공하며, 무료 제품과 대규모 사용자 환경을 지원하는 적절한 속도와 비용을 갖춘 세계 최고의 코딩 모델 중 하나로 돋보입니다. | 모델 카드 |
Claude Opus 4 | 언어, 비전 | Claude Opus 4는 집중적인 노력과 수천 단계가 필요한 장기 실행 태스크에서 지속적인 성능을 제공하여 AI 에이전트가 해결할 수 있는 범위를 크게 확장합니다. | 모델 카드 |
Claude Sonnet 4 | 언어, 비전 | 코딩, 심층 조사, 에이전트와 같은 대량 사용을 위한 우수한 지능을 갖춘 Anthropic의 중간 규모 모델입니다. | 모델 카드 |
Anthropic의 Claude 3.7 Sonnet | 언어, 비전 | AI 에이전트를 코딩하고 지원하는 업계를 선도하는 모델로, 확장된 사고를 제공하는 최초의 Claude 모델입니다. | 모델 카드 |
Anthropic의 Claude 3.5 Sonnet v2 | 언어, 비전 | 업그레이드된 Claude 3.5 Sonnet은 실제 소프트웨어 엔지니어링 태스크와 에이전트 기능을 위한 최첨단 모델입니다. Claude 3.5 Sonnet은 이전 모델과 동일한 가격과 속도로 향상된 기능을 제공합니다. | 모델 카드 |
Anthropic의 Claude 3.5 Haiku | 언어, 비전 | Anthropic의 차세대 모델인 Claude 3.5 Haiku는 가장 빠르고 경제적인 모델로, 속도와 경제성이 중요한 사용 사례에 적합합니다. | 모델 카드 |
Anthropic의 Claude 3 Haiku | 언어 | 기본 쿼리에 즉각적으로 응답할 수 있는 Anthropic에서 가장 빠른 비전 및 텍스트 모델로, 인간의 상호작용을 모방하는 원활한 AI 경험을 지원합니다. | 모델 카드 |
Anthropic의 Claude 3.5 Sonnet | 언어 | Claude 3.5 Sonnet은 Anthropic의 중간 등급 모델인 Claude 3 Sonnet의 속도와 비용으로 광범위한 Anthropic 평가에서 Anthropic의 Claude 3 Opus를 능가합니다. | 모델 카드 |
Jamba 1.5 Large(미리보기) | 언어 | AI21 Labs의 Jamba 1.5 Large는 우수한 품질의 응답, 높은 처리량, 동급의 다른 모델에 비해 경쟁력 있는 가격을 제공할 수 있도록 설계되었습니다. | 모델 카드 |
Jamba 1.5 Mini(프리뷰) | 언어 | AI21 Labs의 Jamba 1.5 Mini는 품질, 처리량, 저렴한 비용 전반에 걸쳐 균형이 잘 잡혀 있습니다. | 모델 카드 |
Mistral Medium 3 | 언어 | Mistral Medium 3은 프로그래밍, 수학적 추론, 긴 문서 이해, 요약, 대화 등 다양한 작업을 위해 설계된 다목적 모델입니다. | 모델 카드 |
Mistral OCR(25.05) | 언어, 비전 | Mistral OCR(25.05)은 문서 이해를 위한 광학 문자 인식 API입니다. 모델은 미디어, 텍스트, 표, 방정식과 같은 문서의 각 요소를 이해합니다. | 모델 카드 |
Mistral Small 3.1(25.03) | 언어 | Mistral Small 3.1(25.03)은 Mistral의 Small 모델 최신 버전으로, 멀티모달 기능과 확장된 컨텍스트 길이가 특징입니다. | 모델 카드 |
Mistral Large(24.11) | 언어 | Mistral Large(24.11)는 Mistral Large(24.07) 모델의 다음 버전으로, 추론 및 함수 호출 기능이 향상되었습니다. | 모델 카드 |
Codestral 2 | 언어, 코드 | Codestral 2는 Mistral의 코드 생성 전문 모델로, 개발자가 공유된 명령 및 완성 API 엔드포인트를 통해 코드를 작성하고 상호작용할 수 있도록 지원하는 고정밀 fill-in-the-middle (FIM) 완성을 위해 특별히 빌드되었습니다. | 모델 카드 |
Codestral(25.01) | 코드 | fill-in-the-middle 및 코드 완성을 포함한 코드 생성을 위해 설계된 최신 모델입니다. | 모델 카드 |
개방형 모델
다음 개방형 모델은 Vertex AI Model Garden(MaaS)에서 관리형 API로 제공됩니다.
모델 이름 | 형식 | 설명 | 빠른 시작 |
---|---|---|---|
gpt-oss 120B | 언어 | 추론 태스크에서 높은 성능을 제공하는 120B 모델입니다. | 모델 카드 |
gpt-oss 20B | 언어 | 소비자 및 에지 하드웨어의 효율성과 배포에 최적화된 20B 모델입니다. | 모델 카드 |
Qwen3-Next-80B Thinking | 언어, 코드 | 복잡한 문제 해결과 심층적인 추론에 특화된 Qwen3-Next 모델 제품군의 모델입니다. | 모델 카드 |
Qwen3-Next-80B Instruct | 언어, 코드 | 특정 명령어를 따르는 데 특화된 Qwen3-Next 모델 제품군의 모델입니다. | 모델 카드 |
Qwen3 Coder | 언어, 코드 | 고급 소프트웨어 개발 태스크를 위해 개발된 오픈-웨이트 모델입니다. | 모델 카드 |
Qwen3 235B | 언어 | 체계적인 추론과 빠른 대화 사이를 전환할 수 있는 '하이브리드 사고' 기능이 있는 오픈-웨이트 모델입니다. | 모델 카드 |
DeepSeek-V3.1 | 언어 | 사고 모드와 비사고 모드를 모두 지원하는 DeepSeek의 하이브리드 모델입니다. | 모델 카드 |
DeepSeek R1(0528) | 언어 | DeepSeek의 최신 버전인 DeepSeek R1 모델입니다. | 모델 카드 |
Llama 4 Maverick 17B-128E | 언어, 비전 | 코딩, 추론, 이미지 기능을 갖춘 가장 크고 기능이 뛰어난 Llama 4 모델입니다. Llama 4 Maverick 17B-128E는 전문가 망(MoE) 아키텍처와 조기 융합을 사용하는 멀티모달 모델입니다. | 모델 카드 |
Llama 4 Scout 17B-16E | 언어, 비전 | Llama 4 Scout 17B-16E는 여러 벤치마크에서 이전 Llama 세대 및 기타 오픈 및 독점 모델보다 우수한 성능을 제공하는 최신 크기 클래스 결과를 제공합니다. Llama 4 Scout 17B-16E는 전문가 망(MoE) 아키텍처와 조기 융합을 사용하는 멀티모달 모델입니다. | 모델 카드 |
Llama 3.3 | 언어 | Llama 3.3은 텍스트 전용 70B 요청 사항 조정 모델로, 텍스트 전용 애플리케이션에 사용될 때 Llama 3.1 70B 및 Llama 3.2 90B에 비해 향상된 성능을 제공합니다. 또한 일부 애플리케이션의 경우 Llama 3.3 70B가 Llama 3.1 405B의 성능에 근접합니다. | 모델 카드 |
Llama 3.2(미리보기) | 언어, 비전 | 차트 및 그래프 분석, 이미지 캡션과 같은 이미지 추론을 지원할 수 있는 중형 90B 멀티모달 모델입니다. | 모델 카드 |
Llama 3.1 | 언어 |
다국어 대화 사용 사례에 최적화된 다국어 LLM 모음으로, 일반적인 업계 벤치마크에서 사용할 수 있는 여러 오픈소스와 비공개 채팅 모델보다 우수한 성능을 발휘합니다. Llama 3.1 405B는 정식 버전(GA)입니다. Llama 3.1 8B 및 Llama 3.1 70B는 프리뷰 버전으로 제공됩니다. |
모델 카드 |
다음 단계
- MaaS용 Vertex AI 오픈 모델에 대해 자세히 알아보세요.
- 개방형 모델 API를 호출하는 방법을 알아보세요.