이 페이지는 Cloud Translation API를 통해 번역되었습니다.

스토리지 일괄 작업

이 문서에서는 서버리스 방식으로 수십억 개의 객체에 작업을 실행할 수 있는 Cloud Storage 기능인 스토리지 일괄 작업을 설명합니다. 스토리지 일괄 작업을 사용하면 수십억 개의 객체에 대한 대규모 API 작업을 자동화하여 각 요청에 대한 스크립트를 작성하고 유지하는 데 필요한 개발 시간을 줄일 수 있습니다.

스토리지 일괄 작업을 만드는 방법을 알아보려면 스토리지 일괄 작업 만들기 및 관리를 참조하세요.

개요

스토리지 일괄 작업을 사용하면 객체 유지, 객체 삭제, 객체 메타데이터 업데이트, 객체 재작성과 같은 네 가지 변환 중 하나를 여러 객체에 한 번에 실행할 수 있습니다. 스토리지 일괄 작업을 사용하려면 어떤 객체에 어떤 변환을 적용해야 하는지 정의하는 작업 구성을 만듭니다.

일괄 작업을 만들면 요청의 상태를 나타내는 장기 실행 작업(LRO)이 반환됩니다. 요청에 지정된 모든 객체에 변환이 적용되었는지 여부를 나타냅니다.

이점

확장성: 단일 스토리지 일괄 작업으로 수백만 개의 객체에서 변환을 실행합니다.
서버리스 실행: 서버리스 환경에서 일괄 작업을 실행하여 인프라를 관리할 필요가 없습니다.
자동화: 복잡하고 반복적인 작업을 자동화하여 운영 효율성을 개선합니다.
개발 시간 단축: 복잡한 커스텀 스크립트를 작성하고 유지하지 않아도 됩니다.
성능: 필요한 시간 내에 신속히 처리해야 하는 작업을 완료합니다. 버킷에서 여러 일괄 작업을 동시에 실행하면 3시간 이내에 최대 10억 개의 객체를 처리할 수 있습니다.
자동 재시도: 실패한 작업을 자동으로 재시도합니다.
작업 모니터링: 모든 작업의 상태와 완료를 모니터링하기 위한 자세한 진행 상황을 추적합니다.

사용 사례

Storage Insights 데이터 세트와 함께 사용되는 스토리지 일괄 작업을 사용하면 다음 작업을 수행할 수 있습니다.

보안 관리
- 객체 재작성 메서드를 사용하여 여러 객체에 암호화 키를 설정합니다.
- 객체 보존 조치를 적용하거나 삭제하여 객체 불변성을 제어합니다.
규정 준수
- 객체 보존 조치를 사용하여 규정 준수를 위한 데이터 보관 요구사항을 충족합니다.
- 와이프아웃 규정 준수 요구사항을 충족하기 위해 특정 기간의 데이터를 삭제합니다.
데이터 변환: 객체 메타데이터를 일괄 업데이트합니다.
비용 최적화: Cloud Storage 버킷에서 객체를 일괄 삭제하여 스토리지 비용을 절감합니다.

작업 구성

스토리지 일괄 작업을 만들려면 다음 작업 구성을 설정해야 합니다. 작업 구성은 다양한 처리 요구사항에 따라 작업이 정의되는 방식을 제어하는 매개변수입니다.

작업 이름: 스토리지 일괄 작업을 식별하는 고유한 이름입니다. 작업을 추적, 모니터링, 참조하는 데 사용됩니다. 작업 이름은 영숫자입니다(예: job-01).
작업 설명(선택사항): 작업의 목적에 관한 간단한 설명입니다. 이렇게 하면 작업 세부정보를 이해하고 문서화하는 데 도움이 됩니다. 예를 들면 Deletes all objects in a bucket입니다.
버킷 이름: 처리할 객체가 포함된 스토리지 버킷의 이름입니다. 이는 입력 데이터를 찾는 데 필수적입니다. 예를 들면 my-bucket입니다. 작업에는 버킷 이름을 하나만 지정할 수 있습니다.
객체 선택: 처리할 객체를 정의하는 선택 기준입니다. 다음 옵션 중 하나를 사용하여 기준을 지정할 수 있습니다.
- 매니페스트: 스토리지 일괄 작업을 만들 때 매니페스트를 만들고 위치를 지정합니다. 매니페스트는 Google Cloud에 업로드되는 CSV 파일로, 처리할 객체 하나 또는 객체 목록이 포함됩니다. 매니페스트의 각 행에는 객체의 bucket 및 name이 포함되어야 합니다. 원하는 경우 객체의 generation을 지정할 수 있습니다. generation을 지정하지 않으면 객체의 현재 버전이 사용됩니다.
  
  파일에는 다음 형식의 헤더 행이 포함되어야 합니다.
  
  bucket,name,generation
  
  다음은 매니페스트의 예입니다.
```
bucket,name,generation
bucket_1,object_1,generation_1
bucket_1,object_2,generation_2
bucket_1,object_3,generation_3
```
  주의: 매니페스트에 스토리지 일괄 작업에 제공된 버킷의 객체만 포함되어 있는지 확인합니다. 다른 버킷을 참조하는 행은 무시됩니다.
  
  Storage Insights 데이터 세트를 사용하여 매니페스트를 만들 수도 있습니다. 자세한 내용은 Storage Insights 데이터 세트를 사용하여 매니페스트 만들기를 참고하세요.
- 객체 접두사: 버킷 내 객체를 필터링할 접두사 목록을 지정합니다. 이러한 접두사가 있는 객체만 처리됩니다. 비어 있으면 버킷의 모든 객체가 처리됩니다.
작업 유형: 스토리지 일괄 작업은 일괄 작업당 단일 작업을 실행하는 다음 작업 유형을 지원합니다.
- 객체 삭제: 버킷 내에서 객체를 삭제할 수 있습니다. 이는 비용 최적화, 데이터 수명 주기 관리, 데이터 삭제 정책 준수에 매우 중요합니다.
  
  주의: 기본적으로 Cloud Storage에서는 소프트 삭제된 객체가 7일 동안 보관됩니다. 객체를 실수로 삭제한 경우 이 기간 동안 소프트 삭제된 객체를 복원할 수 있습니다. 하지만 버킷에 대해 소프트 삭제를 사용 중지한 경우에는 삭제된 객체를 복구할 수 없습니다
- 메타데이터 업데이트: 객체 메타데이터를 수정할 수 있습니다. 여기에는 커스텀 메타데이터, 스토리지 클래스, 기타 객체 속성 업데이트가 포함됩니다.
- 객체 보존 조치 업데이트: 객체 보존 조치를 사용 설정하거나 중지할 수 있습니다. 객체 보존 조치는 객체가 삭제되거나 수정되지 않도록 방지하므로 규정 준수 및 데이터 보관 목적에 필수적입니다.
- 객체 암호화 키 업데이트: 하나 이상의 객체의 고객 관리 암호화 키를 관리할 수 있습니다. 여기에는 객체 재작성 메서드를 사용하여 암호화 키를 적용하거나 변경하는 것이 포함됩니다.

제한사항

스토리지 일괄 작업에는 다음과 같은 제한사항이 있습니다.

스토리지 일괄 작업의 최대 전체 기간은 14일입니다. 생성 후 14일 이내에 완료되지 않은 진행 중인 작업은 자동으로 취소됩니다.
동일한 버킷에서 일괄 작업을 20개 이상 동시에 실행하지 않는 것이 좋습니다.
스토리지 일괄 작업은 다음 버킷에서 지원되지 않습니다.
- 요청자 지불이 사용 설정된 버킷
- us-west8 리전에 있는 버킷

다음 단계

스토리지 일괄 작업 만들기 및 관리