OpenAI 모델

Vertex AI 기반 OpenAI 모델은 완전 관리형 서버리스 모델을 API로 제공합니다. Vertex AI에서 OpenAI 모델을 사용하려면 요청을 Vertex AI API 엔드포인트로 직접 보냅니다. OpenAI 모델은 관리형 API를 사용하므로 인프라를 프로비저닝하거나 관리할 필요가 없습니다.

대답을 스트리밍하여 최종 사용자의 지연 시간 인식을 줄일 수 있습니다. 스트리밍된 응답은 서버 전송 이벤트 (SSE)를 사용하여 응답을 점진적으로 스트리밍합니다.

사용 가능한 OpenAI 모델

Vertex AI에 사용할 수 있는 OpenAI의 모델은 다음과 같습니다. OpenAI 모델에 액세스하려면 Model Garden 모델 카드로 이동합니다.

gpt-oss 120B

OpenAI gpt-oss 120B는 Apache 2.0 라이선스에 따라 출시된 1,200억 개의 가중치를 가진 언어 모델입니다. 추론 및 함수 호출 사용 사례에 적합합니다. 이 모델은 소비자 하드웨어에 배포하도록 최적화되어 있습니다.

120B 모델은 80GB GPU 하나에서 실행되면서 핵심 추론 벤치마크에서 OpenAI o4-mini와 거의 동등한 성능을 달성합니다.

gpt-oss 120B 모델 카드로 이동

gpt-oss 20B

OpenAI gpt-oss 20B는 Apache 2.0 라이선스에 따라 출시된 200억 개의 가중치를 가진 오픈소스 언어 모델입니다. 추론 및 함수 호출 사용 사례에 적합합니다. 이 모델은 소비자 하드웨어에 배포하도록 최적화되어 있습니다.

20B 모델은 일반적인 벤치마크에서 OpenAI o3-mini와 유사한 결과를 제공하며 메모리가 16GB인 에지 기기에서 실행할 수 있으므로 온디바이스 사용 사례, 로컬 추론 또는 비용이 많이 드는 인프라 없이 빠른 반복에 적합합니다.

gpt-oss 20B 모델 카드로 이동

시작하기 전에

Vertex AI에서 OpenAI 모델을 사용하려면 다음 단계를 실행해야 합니다. Vertex AI를 사용하려면 Vertex AI API(aiplatform.googleapis.com)를 사용 설정해야 합니다. Vertex AI API가 사용 설정된 기존 프로젝트가 이미 있는 경우 새 프로젝트를 만드는 대신 해당 프로젝트를 사용할 수 있습니다.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. 다음 Model Garden 모델 카드 중 하나로 이동한 다음 사용 설정을 클릭합니다.