이 페이지에서는 Batch를 사용하는 동안 발생할 수 있는 알려진 문제를 설명합니다.
Batch 사용에 대한 추가 도움이 필요한 경우 문제 해결 문서 또는 지원 받기를 참조하세요.
작업을 나열할 때 지연 시간이 발생할 수 있음
프로젝트에 10,000개가 넘는 작업이 포함된 경우 Google Cloud 콘솔, gcloud CLI 또는 Batch API의 일괄 작업 목록 페이지를 사용하여 작업을 나열할 때 지연 시간이 발생할 수 있습니다. 이 문제는 특정 작업을 보는 데 영향을 주지 않습니다.
이 문제를 해결하려면 프로젝트의 작업 수를 줄이거나 BigQuery에 저장한 작업 정보를 보고 쿼리합니다. BigQuery에 작업 정보를 저장하려면 다음 옵션을 하나 이상 사용하세요.
작업 상태 정보를 BigQuery로 자동으로 스트리밍하려면 작업 생성 중 Pub/Sub 알림을 사용 설정합니다. 자세한 내용은 알림을 사용하여 작업 모니터링을 참조하세요.
완료된 작업의 모든 정보를 BigQuery로 내보내려면
export-to-bigquery-delete-batch-jobs
샘플 스크립트를 실행합니다. 자세한 내용은 작업 삭제 및 내보내기를 참조하세요.
오래된 커널이 있는 Compute Engine(또는 커스텀) VM OS 이미지를 지정할 때 작업이 실패할 수 있음
최신 커널 버전이 없는 Compute Engine VM OS 이미지를 지정하면 작업이 실패할 수 있습니다. 이 문제는 Compute Engine VM OS 이미지를 기반으로 하는 커스텀 이미지에도 영향을 줍니다. 이 문제의 원인인 Compute Engine 공개 이미지는 쉽게 식별되지 않으며 언제든지 변경될 수 있습니다.
이 문제는 특정 오류 메시지로 표시되지 않습니다. 대신 작업이 예기치 않게 실패하고 Compute Engine VM OS 이미지 또는 유사한 커스텀 이미지를 지정하는 경우 이 문제를 고려하세요.
이 문제를 방지하거나 해결하려면 다음을 수행하면 됩니다.
- 가능한 경우 이 문제의 영향을 받지 않는 Batch 이미지를 기반으로 하는 Batch 이미지 또는 커스텀 이미지를 사용하세요.
- Batch 이미지를 사용할 수 없는 경우 원하는 Compute Engine 이미지의 최신 버전을 사용해 보세요. 일반적으로 최신 버전의 Compute Engine 이미지는 이전 버전보다 최신 커널 버전일 가능성이 더 높습니다.
- 최신 버전의 특정 이미지가 작동하지 않으면 다른 OS를 사용해 보거나 커스텀 이미지를 만들어야 할 수 있습니다. 예를 들어 최신 버전의 Debian 11이 작동하지 않으면 Debian 11을 실행하고 최신 커널 버전을 사용하도록 업데이트한 Compute Engine VM에서 커스텀 이미지를 만들어 볼 수 있습니다.
이 문제는 VM OS 이미지의 오래된 커널 버전으로 인해 VM이 재부팅되어 발생합니다. 작업이 Batch에서 시작되지 않거나 Batch 이미지를 기반으로 VM OS 이미지를 지정할 경우 Batch는 작업 시작 후 VM에 필요한 패키지를 설치합니다. 필요한 패키지는 작업마다 다르며 시간이 지남에 따라 변경될 수 있고, VM OS 이미지가 최신 커널 버전을 필요로 할 수 있습니다. 이 문제는 커널 버전 업데이트 시 VM을 재부팅해야 할 때 발생합니다. 이로 인해 패키지 설치 및 작업이 실패합니다.
VM OS 이미지에 대한 자세한 내용은 작업 VM의 OS 환경 개요를 참조하세요.
오래된 커널의 GPU 및 VM OS 이미지를 사용하는 작업은 드라이버를 자동으로 설치할 때만 실패할 수 있음
이 문제는 오래된 커널이 있는 Compute Engine(또는 커스텀) VM OS 이미지를 지정할 때 작업이 실패할 수 있음과 밀접한 관련이 있습니다. 특히 최신 커널 없이 Compute Engine(또는 커스텀) VM OS 이미지를 지정하고 GPU를 사용하는 작업은 GPU 드라이버를 자동으로 설치하려고 시도하는 경우에만 실패할 수 있습니다. 이러한 작업의 경우 GPU 드라이버를 수동으로 설치하여 오류를 해결할 수도 있습니다.
GPU에 대한 자세한 내용은 GPU를 사용하는 작업 만들기 및 실행을 참조하세요.