Qwen 모델

Vertex AI 기반 Qwen 모델은 완전 관리형 서버리스 모델을 API로 제공합니다. Vertex AI에서 Qwen 모델을 사용하려면 요청을 Vertex AI API 엔드포인트로 직접 보냅니다. Qwen 모델은 관리형 API를 사용하므로 인프라를 프로비저닝하거나 관리할 필요가 없습니다.

대답을 스트리밍하여 최종 사용자의 지연 시간 인식을 줄일 수 있습니다. 스트리밍된 응답은 서버 전송 이벤트 (SSE)를 사용하여 응답을 점진적으로 스트리밍합니다.

사용 가능한 Qwen 모델

Vertex AI에서 사용할 수 있는 Qwen의 모델은 다음과 같습니다. Qwen 모델에 액세스하려면 Model Garden 모델 카드로 이동합니다.

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder)는 고급 소프트웨어 개발 작업을 위해 개발된 대규모 오픈 가중치 모델입니다. 이 모델의 주요 기능은 대규모 컨텍스트 윈도우로, 이를 통해 대규모 코드베이스를 포괄적으로 처리하고 이해할 수 있습니다.

Qwen3 Coder 모델 카드로 이동

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B)는 2,350억 개의 매개변수가 있는 대형 모델입니다. 이 모델은 사용자가 수학적 추론 및 코딩과 같은 복잡한 작업을 위한 체계적이고 단계적인 '사고' 모드와 범용 대화를 위한 빠른 '비사고' 모드 간에 동적으로 전환할 수 있는 '하이브리드 사고' 기능이 특징입니다. 컨텍스트 윈도우가 커서 심층적인 추론과 긴 형식의 이해가 필요한 사용 사례에 적합합니다.

Qwen3 235B 모델 카드로 이동

시작하기 전에

Vertex AI에서 Qwen 모델을 사용하려면 다음 단계를 실행해야 합니다. Vertex AI를 사용하려면 Vertex AI API(aiplatform.googleapis.com)를 사용 설정해야 합니다. Vertex AI API가 사용 설정된 기존 프로젝트가 이미 있는 경우 새 프로젝트를 만드는 대신 해당 프로젝트를 사용할 수 있습니다.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. 다음 Model Garden 모델 카드 중 하나로 이동한 다음 사용 설정을 클릭합니다.