AutoML을 사용하는 대신 자체 학습 코드를 작성하는 경우 커스텀 학습을 수행하는 몇 가지 방법이 있습니다. 이 주제에서는 커스텀 학습을 실행할 수 있는 다양한 방법의 간략한 개요와 비교를 제공합니다.
Vertex AI의 커스텀 학습 리소스
Vertex AI에서 커스텀 모델을 학습시키는 데 사용할 수 있는 Vertex AI 리소스에는 세 가지 유형이 있습니다.
커스텀 작업을 만들 때는 Vertex AI가 다음과 같은 학습 코드를 실행하는 데 필요한 설정을 지정해 주어야 합니다.
- 단일 노드 학습을 위한 작업자 풀 하나(
WorkerPoolSpec
) 또는 분산형 학습을 위한 여러 작업자 풀 - (선택 사항) 작업 예약 구성을 위한 설정(
Scheduling
), 학습 코드를 위한 특정 환경 변수 설정, 서비스 계정 사용, VPC 네트워크 피어링 사용
작업자 풀 내에서 다음 설정을 지정할 수 있습니다.
- 머신 유형 및 가속기
- 작업자 풀이 실행하는 학습 코드 유형의 구성: Python 학습 애플리케이션(
PythonPackageSpec
) 또는 커스텀 컨테이너(ContainerSpec
)
초매개변수 조정 작업에는 측정항목과 같이 구성할 추가 설정이 있습니다. 초매개변수 조정에 대해 자세히 알아보세요.
학습 파이프라인은 학습 작업이 성공적으로 완료된 후 데이터 세트를 로드하거나 Vertex AI에 모델을 업로드하는 등의 추가 단계를 통해 커스텀 학습 작업 또는 초매개변수 조정 작업을 조정합니다.
커스텀 학습 리소스
프로젝트의 기존 학습 파이프라인을 보려면 Google Cloud 콘솔의 Vertex AI 섹션에 있는 학습 파이프라인 페이지로 이동합니다.
프로젝트의 기존 커스텀 작업을 보려면 커스텀 작업 페이지로 이동합니다.
프로젝트의 기존 초매개변수 조정 작업을 보려면 초매개변수 조정 페이지로 이동하세요.
사전 빌드된 컨테이너 및 커스텀 컨테이너
커스텀 학습 작업, 초매개변수 조정 작업 또는 학습 파이프라인을 Vertex AI에 제출하기 전에 Python 학습 애플리케이션 또는 커스텀 컨테이너를 만들어 Vertex AI에서 실행하려는 학습 코드 및 종속 항목을 정의해야 합니다. TensorFlow, PyTorch, scikit-learn 또는 XGBoost를 사용하여 Python 학습 애플리케이션을 만드는 경우에는 사전 빌드된 컨테이너를 사용하여 코드를 실행할 수 있습니다. 어떤 옵션을 선택해야 할지 잘 모르겠다면 학습 코드 요구사항을 참조하세요.
분산형 학습
여러 작업자 풀을 지정하여 커스텀 학습 작업, 초매개변수 조정 작업 또는 분산 학습을 위한 학습 파이프라인을 구성할 수 있습니다.
- 첫 번째 작업자 풀을 사용하여 기본 복제본을 구성하고 복제본 카운트를 1로 설정합니다.
- 머신러닝 프레임워크가 분산형 학습에 이러한 추가 클러스터 작업을 지원하는 경우 작업자 복제본, 매개변수 서버 복제본 또는 평가자 복제본을 구성하는 작업자 풀을 추가합니다.
분산형 학습 사용에 대해 자세히 알아보세요.
다음 단계
- 커스텀 학습 작업을 실행하기 위해 영구 리소스를 만드는 방법을 알아봅니다.
- Vertex AI에서 커스텀 학습 애플리케이션을 실행하기 위한 커스텀 학습 작업을 만드는 방법은 커스텀 학습 작업 만들기를 참조하세요.
- Vertex AI에서 커스텀 학습 애플리케이션을 실행하기 위한 학습 파이프라인을 만드는 방법을 알아보려면 학습 파이프라인 만들기를 참조하세요.
- 초매개변수 조정 검색에 대한 자세한 내용은 초매개변수 조정 사용을 참조하세요.