GPU 프로비저닝 및 Vertex AI 사전 학습된 API 사용 설정

각 Vertex AI 서비스에는 용량 계획 및 컴퓨팅 요구사항에 설명된 대로 그래픽 처리 장치 (GPU)를 비롯한 다양한 컴퓨팅 리소스가 필요합니다. 이 페이지에서는 GPU 환경에서 인공지능 (AI) 및 머신러닝 (ML) 워크로드를 실행하기 위해 GPU 리소스를 프로비저닝하는 방법을 설명합니다. 또한 이 페이지에서는 Vertex AI 기능을 구현할 수 있도록 Google Distributed Cloud (GDC) 에어 갭 어플라이언스에서 Vertex AI 사전 학습 API를 사용 설정하는 방법을 안내합니다.

GPU 리소스를 구성하고 Vertex AI 사전 학습 API를 사용 설정하거나 비활성화하는 대부분의 작업에는 관리자 액세스 권한이 필요합니다. 필요한 권한이 없는 경우 관리자에게 GPU와 Vertex AI 사전 학습된 API를 대신 사용 설정해 달라고 요청하세요.

GDC 에어갭 어플라이언스의 Vertex AI에는 선행 학습된 모델별로 하나씩 세 개의 API가 포함되어 있습니다. 이러한 사전 학습된 모델에 대해 자세히 알아보려면 다음 문서를 참고하세요.

GDC 콘솔을 사용하여 Vertex AI 사전 학습된 API의 엔드포인트를 사용 설정, 비활성화, 조회합니다.

시작하기 전에

사전 학습된 API를 사용 설정하는 데 필요한 권한을 얻으려면 조직 IAM 관리자 또는 프로젝트 IAM 관리자에게 프로젝트 네임스페이스에서 AI Platform 관리자(ai-platform-admin) 역할을 부여해 달라고 요청하세요.

이 역할에 대한 자세한 내용은 IAM 권한 준비를 참고하세요. 주체에 권한을 부여하는 방법을 알아보려면 액세스 권한 부여 및 취소를 참고하세요.

사전 학습된 API를 사용 설정하기 전에 다음 단계에 따라 GPU를 프로비저닝하세요.

  1. Vertex AI를 사용하도록 프로젝트를 설정합니다.
  2. 프로젝트에 적절한 인그레스 통신이 구성되어 있는지 확인합니다.
  3. GPU 워크로드 관리
  4. GDC 콘솔에 로그인합니다. 로그인할 수 없는 경우 ID 공급업체를 사용할 수 없는 경우 기기 복구하기를 참고하세요.

사전 학습된 API 사용 설정

GDC 콘솔을 사용하여 OCR, Speech-to-Text, Vertex AI Translation 사전 학습 API를 사용 설정할 수 있습니다.

기본 요건을 충족한 후 다음 단계에 따라 사전 학습된 API를 사용 설정합니다.

  1. GDC 콘솔에 로그인합니다.
  2. 탐색 메뉴에서 Vertex AI > 사전 학습된 API를 클릭합니다.
  3. 사전 학습된 API 페이지에서 특정 서비스의 사용 설정을 클릭하여 해당 API를 사용 설정합니다.

  4. 확인 대화상자에서 사용 설정을 클릭합니다. 진행 상황 메시지가 표시됩니다.

사용 설정 기간은 다를 수 있습니다. 완료하는 데 15~45분 정도 걸릴 수 있습니다.

사전 학습된 API의 상태를 보려면 서비스 상태 및 엔드포인트를 확인하세요.

사전 학습된 API 비활성화

GDC 콘솔을 사용하여 OCR, Speech-to-Text, Vertex AI Translation 사전 학습 API를 비활성화할 수 있습니다.

기본 요건을 충족한 후 다음 단계에 따라 사전 학습된 API를 비활성화합니다.

  1. GDC 콘솔에 로그인합니다.
  2. 탐색 메뉴에서 Vertex AI > 사전 학습된 API를 클릭합니다.
  3. 사전 학습된 API 페이지에서 특정 서비스의 사용 중지를 클릭하여 해당 API를 비활성화합니다.

  4. 확인 대화상자에서 텍스트 필드에 disable를 입력하여 해당 작업을 수행할지 확인합니다. 그런 다음 사용 중지를 클릭합니다. 진행 메시지가 표시됩니다.

사전 학습된 API의 상태를 보려면 서비스 상태 및 엔드포인트를 확인하세요.