클라우드 데이터로 효율적인 PyTorch 학습 수행

Vertex AI 신경망 아키텍처 검색에는 트레이너를 설계하는 방법을 설명하는 요구 사항이 없습니다. 따라서 학습 프레임워크를 아무거나 선택하여 학습기를 빌드합니다.

대용량 데이터를 사용하는 PyTorch 학습의 경우 분산 학습 패러다임을 사용하고 Cloud Storage에서 데이터를 읽는 것이 좋습니다. 학습 성능을 향상시키는 방법은 Vertex AI로 효율적인 PyTorch 학습 블로그 게시물을 참조하세요. WebDataset를 사용하고 DistributedDataParallel 또는 FullyShardedDataParallel 분산 학습 전략을 선택하면 Cloud Storage에서 데이터 성능이 전반적으로 6배 향상될 수 있습니다. Cloud Storage의 데이터를 사용한 학습 성능은 로컬 디스크의 데이터를 사용한 학습 성능과 유사합니다.

사전 빌드된 MNasNet 분류 예시는 이러한 메서드를 학습 파이프라인에 통합했습니다.

달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.

최종 업데이트: 2025-10-19(UTC)