항목 내보내기 및 가져오기

이 페이지에서는 관리형 내보내기/가져오기 서비스를 사용하여 Datastore 모드의 Firestore 항목을 내보내고 가져오는 방법을 설명합니다. 관리형 내보내기 및 가져오기 서비스는 Cloud Console, gcloud 명령줄 도구, Datastore Admin API(REST, RPC)를 통해 사용할 수 있습니다.

관리형 내보내기/가져오기 서비스를 사용하면 실수로 삭제된 데이터를 복원하고 오프라인 처리에 필요한 데이터를 내보낼 수 있습니다. 모든 항목 또는 특정 종류의 항목만 지정하여 내보낼 수 있습니다. 마찬가지로 내보내기한 모든 데이터를 가져오거나 특정 종류만 지정하여 가져오는 것도 가능합니다. 내보내기/가져오기 관리 서비스를 사용할 때는 다음 사항을 고려하세요.

  • 내보내기 서비스에서는 eventual consistency를 가지는 읽기를 사용합니다. 따라서 내보내기가 동일한 시점에 이루어졌다고 추측할 수 없습니다. 내보내기를 시작한 이후에 작성된 항목은 포함하고 내보내기 시작 전에 작성된 항목은 제외할 수도 있습니다.

  • 내보내기에는 어떠한 색인도 포함되지 않습니다. 데이터를 가져오면 필수 색인이 데이터베이스의 현재 색인 정의를 사용하여 자동으로 다시 구축됩니다. 항목당 속성 값 색인 설정은 내보내기에 포함되고 가져올 때도 반영됩니다.

  • 가져오기를 수행하면 항목에 새로운 ID가 할당되지 않고, 내보낸 시점에 있던 ID를 사용하여 동일한 ID의 기존 항목을 덮어씁니다. 항목을 가져오는 동안에는 ID가 예약됩니다. 이 기능은 가져오기를 실행하는 동안 쓰기가 사용 설정된 경우 새 항목과 ID의 충돌을 방지합니다.

  • 가져오기의 영향을 받지 않는 데이터베이스 내 항목은 가져오기 후에도 데이터베이스에 유지됩니다.

  • 하나의 Datastore 모드 데이터베이스에서 내보낸 데이터를 다른 Datastore 모드 데이터베이스(다른 프로젝트에 있는 경우도 해당)로 가져올 수 있습니다.

  • 관리형 내보내기 및 가져오기 서비스는 동시 실행되는 내보내기와 가져오기 횟수를 50회로 제한하며 한 프로젝트의 내보내기 및 가져오기 요청을 분당 최대 20개까지 허용합니다. 각 요청에 대해 서비스는 항목 필터 조합 수를 100개로 제한합니다.

  • 관리형 내보내기의 출력은 LevelDB 로그 형식을 사용합니다.

  • 항목의 하위 집합을 가져오거나 BigQuery로 데이터를 가져오려면 내보낼 때 항목 필터를 지정해야 합니다.

시작하기 전에

관리형 내보내기 및 가져오기 서비스를 사용하려면 먼저 다음 작업을 완료해야 합니다.

  1. Google Cloud 프로젝트에 결제를 사용 설정합니다. 결제가 사용 설정된 Google Cloud 프로젝트만 내보내기 및 가져오기 기능을 사용할 수 있습니다.

  2. Datastore 모드의 Firestore 데이터베이스와 동일한 위치에 Cloud Storage 버킷을 만듭니다. 내보내기/가져오기 작업에는 요청자 지불 버킷을 사용할 수 없습니다.

  3. 데이터를 내보내는 경우에는 datastore.databases.export 권한을 부여하고 데이터를 가져오는 경우에는 datastore.databases.import 권한을 부여하는 IAM 역할을 사용자 계정에 할당합니다. 예를 들어 Datastore Import Export Admin 역할은 두 권한을 모두 부여합니다.

  4. Cloud Storage 버킷이 다른 프로젝트에 있으면 프로젝트의 기본 서비스 계정에 버킷에 대한 액세스 권한을 부여합니다.

프로젝트에 gcloud 설정

gcloud를 사용하여 가져오기 및 내보내기 작업을 시작하려면 gcloud를 설정하고 다음 방법 중 하나를 사용하여 프로젝트에 연결합니다.

관리형 내보내기 및 가져오기 작업 시작

이 섹션에서는 관리형 내보내기 또는 가져오기 작업을 시작하는 방법을 설명합니다.

모든 항목 내보내기

Console

  1. Google Cloud Console에서 Datastore 항목 내보내기 페이지로 이동합니다.

    Datastore 내보내기 페이지로 이동

  2. 네임스페이스 필드를 All Namespaces로 설정하고, 종류 필드를 All Kinds로 설정합니다.

  3. 대상 아래에 Cloud Storage 버킷의 이름을 입력합니다.

  4. 내보내기를 클릭합니다.

Console이 항목 페이지를 열고 관리형 내보내기 요청의 성공 또는 실패를 보고합니다.

Console에 상태 보기 버튼도 표시됩니다. 작업 상태를 보는 데 필요한 gcloud 명령어가 미리 채워진 Cloud Shell 터미널을 열려면 이 버튼을 클릭합니다.

작업 상태를 보려고 할 때마다 이 명령어를 실행합니다.

gcloud

gcloud datastore export 명령어를 사용하여 데이터베이스의 모든 항목을 내보낼 수 있습니다.

 gcloud datastore export gs://bucket-name --async

여기서 bucket-name은 Cloud Storage 버킷의 이름이며 선택사항인 프리픽스입니다(예: bucket-name/firestore-exports/export-name). 동일한 프리픽스를 다른 내보내기 작업에 다시 사용할 수 없습니다. 파일 프리픽스를 제공하지 않으면 관리형 내보내기 서비스는 현재 시간을 기준으로 프리픽스를 만듭니다.

작업이 완료될 때까지 gcloud가 대기하는 것을 방지하려면 --async 플래그를 사용하세요. --async 플래그를 생략하는 경우 Ctrl+c를 입력하여 작업 대기를 중지할 수 있습니다. 이렇게 해도 작업이 취소되지는 않습니다.

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID
  • bucket-name: Cloud Storage 버킷 이름

HTTP 메서드 및 URL:

POST https://datastore.googleapis.com/v1/projects/project-id:export

JSON 요청 본문:

{
  "outputUrlPrefix": "gs://bucket-name",
}

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/project-id/operations/operation-id",
  "metadata": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesMetadata",
    "common": {
      "startTime": "2019-09-18T18:42:26.591949Z",
      "operationType": "EXPORT_ENTITIES",
      "state": "PROCESSING"
    },
    "entityFilter": {},
    "outputUrlPrefix": "gs://bucket-name/2019-09-18T18:42:26_85726"
  }
}
응답은 완료 여부를 확인할 수 있는 장기 실행 작업입니다.

특정 종류 또는 네임스페이스 내보내기

특정 종류 또는 네임스페이스의 하위 집합을 내보내려면 종류 및 네임스페이스 ID의 값을 지정한 항목 필터를 제공합니다. 각 요청은 100개의 항목 필터 조합으로 제한되며, 필터링된 종류와 네임스페이스의 각 조합은 이 한도에서 개별 필터로 집계됩니다.

Console

Console에서 모든 종류 또는 특정 종류를 선택할 수 있습니다. 마찬가지로 모든 네임스페이스 또는 특정 네임스페이스를 선택할 수 있습니다.

내보낼 네임스페이스 및 종류 목록을 지정하려면 대신 gcloud를 사용하세요.

  1. Google Cloud Console에서 Datastore 내보내기 페이지로 이동합니다.

    Datastore 내보내기 페이지로 이동

  2. 네임스페이스 필드를 All Namespaces 또는 네임스페이스 중 하나의 이름으로 설정합니다.

  3. 종류 필드를 All Kinds 또는 종류의 이름으로 설정합니다.

  4. 대상 아래에 Cloud Storage 버킷의 이름을 입력합니다.

  5. 내보내기를 클릭합니다.

Console이 항목 페이지를 열고 관리형 내보내기 요청의 성공 또는 실패를 보고합니다.

Console에 상태 보기 버튼도 표시됩니다. 작업 상태를 보는 데 필요한 gcloud 명령어가 미리 채워진 Cloud Shell 터미널을 열려면 이 버튼을 클릭합니다.

작업 상태를 보려고 할 때마다 이 명령어를 실행합니다.

gcloud

gcloud datastore export --kinds="KIND1,KIND2" --namespaces="(default),NAMESPACE2" gs://bucket-name --async

여기서 bucket-name은 Cloud Storage 버킷의 이름이며 선택사항인 프리픽스입니다(예: bucket-name/firestore-exports/export-name). 동일한 프리픽스를 다른 내보내기 작업에 다시 사용할 수 없습니다. 파일 프리픽스를 제공하지 않으면 관리형 내보내기 서비스는 현재 시간을 기준으로 프리픽스를 만듭니다.

작업이 완료될 때까지 gcloud가 대기하는 것을 방지하려면 --async 플래그를 사용하세요. --async 플래그를 생략하는 경우 Ctrl+c를 입력하여 작업 대기를 중지할 수 있습니다. 이렇게 해도 작업이 취소되지는 않습니다.

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID
  • bucket-name: Cloud Storage 버킷 이름
  • kind: 항목 종류
  • namespace: 네임스페이스 ID(기본 네임스페이스 ID로 "" 사용)

HTTP 메서드 및 URL:

POST https://datastore.googleapis.com/v1/projects/project-id:export

JSON 요청 본문:

{
  "outputUrlPrefix": "gs://bucket-name",
  "entityFilter": {
    "kinds": ["kind"],
    "namespaceIds": ["namespace"],
  },
}

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/project-id/operations/operation-id",
  "metadata": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesMetadata",
    "common": {
      "startTime": "2019-09-18T21:17:36.232704Z",
      "operationType": "EXPORT_ENTITIES",
      "state": "PROCESSING"
    },
    "entityFilter": {
      "kinds": [
        "Task"
      ],
      "namespaceIds": [
        ""
      ]
    },
    "outputUrlPrefix": "gs://bucket-name/2019-09-18T21:17:36_82974"
  }
}
응답은 완료 여부를 확인할 수 있는 장기 실행 작업입니다.

메타데이터 파일

내보내기 작업은 지정된 각 네임스페이스-종류 쌍에 메타데이터 파일을 만듭니다. 일반적으로 메타데이터 파일의 이름은 NAMESPACE_NAME_KIND_NAME.export_metadata입니다. 하지만 네임스페이스 또는 종류가 잘못된 Cloud Storage 객체 이름을 만드는 경우 파일 이름은 export[NUM].export_metadata입니다.

메타데이터 파일은 프로토콜 버퍼이며 protoc 프로토콜 컴파일러로 디코딩될 수 있습니다. 예를 들어 메타데이터 파일을 디코딩하면 내보내기 파일에 포함된 네임스페이스와 종류를 확인할 수 있습니다.

protoc --decode_raw < export0.export_metadata

모든 항목 가져오기

Console

  1. Google Cloud Console에서 Datastore 가져오기 페이지로 이동합니다.

    Datastore 가져오기 페이지로 이동

  2. File 필드에서 찾아보기를 클릭하고 overall_export_metadata 파일을 선택합니다.

  3. 네임스페이스 필드를 All Namespaces로 설정하고, 종류 필드를 All Kinds로 설정합니다.

  4. 가져오기를 클릭합니다.

Console이 항목 페이지를 열고 관리형 가져오기 요청의 성공 또는 실패를 보고합니다.

Console에 상태 보기 버튼도 표시됩니다. 작업 상태를 보는 데 필요한 gcloud 명령어가 미리 채워진 Cloud Shell 터미널을 열려면 이 버튼을 클릭합니다.

작업 상태를 보려고 할 때마다 이 명령어를 실행합니다.

gcloud

gcloud datastore import 명령어를 사용하면 관리형 내보내기 서비스로 이전에 내보낸 모든 항목을 가져올 수 있습니다.

gcloud datastore import gs://bucket-name/file-path/file-name.overall_export_metadata --async

여기서 bucket-name/file-path/file-name은 Cloud Storage 버킷 내의 overall_export_metadata 파일 경로입니다.

작업이 완료될 때까지 gcloud가 대기하는 것을 방지하려면 --async 플래그를 사용하세요. --async 플래그를 생략하는 경우 Ctrl+c를 입력하여 작업 대기를 중지할 수 있습니다. 이렇게 해도 작업이 취소되지는 않습니다.

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID
  • bucket-name: Cloud Storage 버킷 이름
  • object-name: Cloud Storage 객체 이름(예: 2017-05-25T23:54:39_76544/2017-05-25T23:54:39_76544.overall_export_metadata

HTTP 메서드 및 URL:

POST https://datastore.googleapis.com/v1/projects/project-id:import

JSON 요청 본문:

{
  "inputUrl": "gs://bucket-name/object-name",
}

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/project-id/operations/operation-id",
  "metadata": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ImportEntitiesMetadata",
    "common": {
      "startTime": "2019-09-18T21:25:02.863621Z",
      "operationType": "IMPORT_ENTITIES",
      "state": "PROCESSING"
    },
    "entityFilter": {},
    "inputUrl": "gs://bucket-name/2019-09-18T18:42:26_85726/2019-09-18T18:42:26_85726.overall_export_metadata"
  }
}
응답은 완료 여부를 확인할 수 있는 장기 실행 작업입니다.

overall_export_metadata 파일 찾기

Google Cloud Console에서 Cloud Storage 브라우저를 사용하여 가져오기 위치에 사용할 값을 결정할 수 있습니다.

Cloud Storage 브라우저 열기

완료된 작업을 나열하고 설명할 수도 있습니다. outputURL 필드는 overall_export_metadata 파일의 이름을 보여 줍니다.

"outputUrl": "gs://bucket-name/2017-05-25T23:54:39_76544/2017-05-25T23:54:39_76544.overall_export_metadata",

특정 종류 또는 네임스페이스 가져오기

종류 또는 네임스페이스의 하위 집합을 가져오려면 종류 및 네임스페이스 ID의 값을 항목 필터에 제공합니다.

항목 필터를 사용하여 내보내기 파일을 만든 경우에만 종류 및 네임스페이스를 지정할 수 있습니다. 모든 항목 내보내기에서 종류 및 네임스페이스의 하위 집합을 가져올 수 없습니다.

Console

Console에서 모든 종류 또는 특정 종류를 선택할 수 있습니다. 마찬가지로 모든 네임스페이스 또는 특정 네임스페이스를 선택할 수 있습니다.

가져올 네임스페이스 및 종류 목록을 지정하려면 대신 gcloud를 사용하세요.

  1. Google Cloud Console에서 Datastore 가져오기 페이지로 이동합니다.

    Datastore 가져오기 페이지로 이동

  2. File 필드에서 찾아보기를 클릭하고 overall_export_metadata 파일을 선택합니다.

  3. 네임스페이스 필드를 All Namespaces 또는 특정 네임스페이스로 설정합니다.

  4. 종류 필드를 All Kinds 또는 특정 종류로 설정합니다.

  5. 가져오기를 클릭합니다.

Console이 항목 페이지를 열고 관리형 가져오기 요청의 성공 또는 실패를 보고합니다.

Console에 상태 보기 버튼도 표시됩니다. 작업 상태를 보는 데 필요한 gcloud 명령어가 미리 채워진 Cloud Shell 터미널을 열려면 이 버튼을 클릭합니다.

작업 상태를 보려고 할 때마다 이 명령어를 실행합니다.

gcloud

gcloud datastore import --kinds="KIND1,KIND2" --namespaces="(default),NAMESPACE2" gs://bucket-name/file-path/file-name.overall_export_metadata --async

여기서 bucket-name/file-path/file-name은 Cloud Storage 버킷 내의 overall_export_metadata 파일 경로입니다.

작업이 완료될 때까지 gcloud가 대기하는 것을 방지하려면 --async 플래그를 사용하세요. --async 플래그를 생략하는 경우 Ctrl+c를 입력하여 작업 대기를 중지할 수 있습니다. 이렇게 해도 작업이 취소되지는 않습니다.

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID
  • bucket-name: Cloud Storage 버킷 이름
  • object-name: Cloud Storage 객체 이름(예: 2017-05-25T23:54:39_76544/2017-05-25T23:54:39_76544.overall_export_metadata
  • kind: 항목 종류
  • namespace: 네임스페이스 ID(기본 네임스페이스 ID로 "" 사용)

HTTP 메서드 및 URL:

POST https://datastore.googleapis.com/v1/projects/project-id:import

JSON 요청 본문:

{
  "inputUrl": "gs://bucket-name/object-name",
  "entityFilter": {
    "kinds": ["kind"],
    "namespaceIds": ["namespace"],
  },
}

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/project-id/operations/operation-id",
  "metadata": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ImportEntitiesMetadata",
    "common": {
      "startTime": "2019-09-18T21:51:02.830608Z",
      "operationType": "IMPORT_ENTITIES",
      "state": "PROCESSING"
    },
    "entityFilter": {
      "kinds": [
        "Task"
      ],
      "namespaceIds": [
        ""
      ]
    },
    "inputUrl": "gs://bucket-name/2019-09-18T21:49:25_96833/2019-09-18T21:49:25_96833.overall_export_metadata"
  }
}
응답은 완료 여부를 확인할 수 있는 장기 실행 작업입니다.

변환 가져오기

가져오기 작업은 가져오기 데이터의 항목 키와 키 참조 속성을 대상 프로젝트의 프로젝트 ID로 업데이트합니다. 이 업데이트로 인해 항목 크기가 증가하면 가져오기 작업에 '항목이 너무 큽니다' 또는 '색인 항목이 너무 큽니다' 오류가 발생할 수 있습니다.

이 오류를 방지하려면 프로젝트 ID가 더 짧은 대상 프로젝트로 가져옵니다.

장기 실행 작업 관리

관리형 가져오기 및 내보내기 작업은 장기 실행 작업입니다. 이러한 메서드 호출은 완료하는 데 상당한 시간이 걸릴 수 있습니다.

내보내기 또는 가져오기 작업을 시작한 후 Datastore 모드는 작업에 고유한 이름을 할당합니다. 이 작업 이름을 사용하면 작업을 삭제 또는 취소하거나 상태를 확인할 수 있습니다.

작업 이름은 다음 예시와 같이 projects/[PROJECT_ID]/databases/(default)/operations/로 시작합니다.

projects/project-id/databases/(default)/operations/ASA1MTAwNDQxNAgadGx1YWZlZAcSeWx0aGdpbi1zYm9qLW5pbWRhEgopEg

describe, cancel, delete 명령어에 작업 이름을 지정할 때 프리픽스는 제외할 수 있습니다.

모든 장기 실행 작업 나열

장기 실행 작업을 나열하려면 gcloud datastore operations list 명령어를 사용합니다. 이 명령어는 진행 중인 작업과 최근에 완료된 작업을 나열합니다. 작업은 완료 후 며칠 동안 나열됩니다.

gcloud

gcloud datastore operations list

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID

HTTP 메서드 및 URL:

GET https://datastore.googleapis.com/v1/projects/project-id/operations

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

아래에서 응답에 대한 정보를 참조하세요.

예를 들어 최근에 완료된 내보내기 작업은 다음 정보를 보여줍니다.

{
  "operations": [
    {
      "name": "projects/project-id/operations/ASAyMDAwOTEzBxp0bHVhZmVkBxJsYXJ0bmVjc3Utc2Jvai1uaW1kYRQKKhI",
      "metadata": {
        "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesMetadata",
        "common": {
          "startTime": "2017-12-05T23:01:39.583780Z",
          "endTime": "2017-12-05T23:54:58.474750Z",
          "operationType": "EXPORT_ENTITIES"
        },
        "progressEntities": {
          "workCompleted": "21933027",
          "workEstimated": "21898182"
        },
        "progressBytes": {
          "workCompleted": "12421451292",
          "workEstimated": "9759724245"
        },
        "entityFilter": {
          "namespaceIds": [
            ""
          ]
        },
        "outputUrlPrefix": "gs://bucket-name"
      },
      "done": true,
      "response": {
        "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesResponse",
        "outputUrl": "gs://bucket-name/2017-05-25T23:54:39_76544/2017-05-25T23:54:39_76544.overall_export_metadata"
      }
    }
  ]
}

단일 작업 설명

장기 실행 작업을 모두 나열하는 대신 단일 작업의 세부정보를 나열할 수 있습니다.

gcloud

내보내기 또는 가져오기 작업의 상태를 표시하려면 operations describe 명령어를 사용합니다.

gcloud datastore operations describe operation-name

rest

아래의 요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • project-id: 프로젝트 ID
  • operation-name: 작업 이름

HTTP 메서드 및 URL:

GET https://datastore.googleapis.com/v1/projects/project-id/operations/operation-name

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/project-id/operations/ASA3ODAwMzQxNjIyChp0bHVhZmVkBxJsYXJ0bmVjc3Utc2Jvai1uaW1kYRQKLRI",
  "metadata": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesMetadata",
    "common": {
      "startTime": "2019-10-08T20:07:28.105236Z",
      "endTime": "2019-10-08T20:07:36.310653Z",
      "operationType": "EXPORT_ENTITIES",
      "state": "SUCCESSFUL"
    },
    "progressEntities": {
      "workCompleted": "21",
      "workEstimated": "21"
    },
    "progressBytes": {
      "workCompleted": "2272",
      "workEstimated": "2065"
    },
    "entityFilter": {},
    "outputUrlPrefix": "gs://bucket-name/2019-10-08T20:07:28_28481"
  },
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesResponse",
    "outputUrl": "gs://bucket-name/2019-10-08T20:07:28_28481/2019-10-08T20:07:28_28481.overall_export_metadata"
  }
}

완료 시간 예상

작업이 실행되면 state 필드 값을 통해 작업의 전체 상태를 확인할 수 있습니다.

또한 장기 실행 작업 상태를 요청하면 workEstimatedworkCompleted 측정항목이 반환됩니다. 이러한 각 측정항목은 바이트 수와 항목 수로 반환됩니다. workEstimated데이터베이스 통계를 기준으로 작업에서 처리할 것으로 예상되는 총 바이트 및 항목 수를 나타냅니다. workCompleted는 지금까지 처리된 바이트 및 항목 수를 나타냅니다. 작업이 완료되면 workCompleted에 실제로 처리된 총 바이트 및 총 항목 수가 반영되며, 이는 workEstimated 값보다 클 수 있습니다.

workCompletedworkEstimated로 나누면 예상 진행도를 대략적으로 추정할 수 있습니다. 이 예상치는 통계 수집 지연으로 인해 부정확할 수 있습니다.

예를 들어 내보내기 작업의 진행 상태는 다음과 같이 표시됩니다.

{
  "operations": [
    {
      "name": "projects/project-id/operations/ASAyMDAwOTEzBxp0bHVhZmVkBxJsYXJ0bmVjc3Utc2Jvai1uaW1kYRQKKhI",
      "metadata": {
        "@type": "type.googleapis.com/google.datastore.admin.v1.ExportEntitiesMetadata",
        ...
        "progressEntities": {
          "workCompleted": "1",
          "workEstimated": "3"
        },
        "progressBytes": {
          "workCompleted": "85",
          "workEstimated": "257"
        },
        ...

작업이 완료되면 작업 설명에 "done": true가 포함됩니다. 작업 결과는 state 필드의 값을 참조하세요. 응답에 done 필드가 설정되지 않으면 이 값은 false입니다 진행 중인 작업에 done 값을 사용해서는 안 됩니다.

작업 취소

operations cancel 명령어를 사용하면 진행 중인 작업을 중지할 수 있습니다.

gcloud datastore operations cancel operation-name

실행 중인 작업을 취소해도 작업이 실행취소되지는 않습니다. 취소된 내보내기 작업은 Cloud Storage에 이미 내보낸 문서를 그대로 두고, 취소된 가져오기 작업은 데이터베이스에 이미 수행된 업데이트를 그대로 둡니다. 일부만 완료된 내보내기는 가져올 수 없습니다.

작업 삭제

operations delete 명령어를 사용하면 operations list 출력에서 작업을 삭제할 수 있습니다. 이 명령어로 Cloud Storage에서 내보내기 파일이 삭제되지는 않습니다.

gcloud datastore operations delete operation-name

관리형 내보내기 및 가져오기 결제 및 가격 책정

관리형 내보내기 및 가져오기 서비스를 사용하기 전에 Google Cloud 프로젝트의 결제를 사용 설정해야 합니다. 내보내기 및 가져오기 작업은 다음과 같은 방식으로 Google Cloud 비용에 반영됩니다.

내보내기 및 가져오기 작업 비용은 App Engine 지출 한도에 합산되지 않습니다. 내보내기 또는 가져오기 작업은 완료 후까지 Google Cloud 예산 알림을 트리거하지 않습니다. 마찬가지로 내보내기 또는 가져오기 작업 중에 수행되는 읽기 및 쓰기는 작업 완료 후 일일 할당량에 반영됩니다.

내보내기 및 가져오기 비용 보기

내보내기 및 가져오기 작업은 청구 작업에 goog-firestoremanaged:exportimport 라벨을 적용합니다. Cloud Billing 보고서 페이지에서 이 라벨을 사용하여 가져오기 및 내보내기 작업과 관련된 비용을 볼 수 있습니다.

필터 메뉴에서 goog-firestoremanaged 라벨에 액세스합니다.

권한

내보내기 및 가져오기 작업을 실행하려면 사용자 계정과 프로젝트의 기본 서비스 계정에 아래 설명된 Identity and Access Management 권한이 있어야 합니다.

사용자 계정 권한

작업을 시작하는 사용자 계정 또는 서비스 계정에는 datastore.databases.exportdatastore.databases.import IAM 권한이 필요합니다. 프로젝트 소유자인 계정에는 필요한 권한이 있습니다. 그렇지 않으면 다음 IAM 역할이 필요한 권한을 부여합니다.

  • Datastore 소유자
  • Datastore 가져오기 내보내기 관리자

프로젝트 소유자는 액세스 권한 부여 단계를 따라 이러한 역할 중 하나를 부여할 수 있습니다.

기본 서비스 계정 권한

각 Google Cloud 프로젝트는 PROJECT_ID@appspot.gserviceaccount.com이라는 기본 서비스 계정을 자동으로 만듭니다. 내보내기 및 가져오기 작업은 이 서비스 계정을 사용하여 Cloud Storage 작업을 승인합니다.

프로젝트의 기본 서비스 계정은 내보내기 또는 가져오기 작업에 사용되는 Cloud Storage 버킷에 액세스할 수 있어야 합니다. Cloud Storage 버킷이 Datastore 모드 데이터베이스와 동일한 프로젝트에 있으면 기본적으로 기본 서비스 계정이 버킷에 액세스할 수 있습니다.

Cloud Storage 버킷이 다른 프로젝트에 있으면 기본 서비스 계정에 Cloud Storage 버킷에 대한 액세스 권한을 부여해야 합니다.

기본 서비스 계정에 역할 할당

gsutil 명령줄 도구를 사용하면 아래 역할 중 하나를 할당할 수 있습니다. 예를 들어 스토리지 관리자 역할을 기본 서비스 계정 실행에 할당하려면 다음을 실행합니다.

gsutil iam ch serviceAccount:[PROJECT_ID]@appspot.gserviceaccount.com:roles/storage.admin \
    gs://[BUCKET_NAME]

또는 Cloud Console을 사용하여 이 역할을 할당할 수 있습니다.

내보내기 작업

다른 프로젝트의 버킷과 관련된 내보내기 작업의 경우 버킷의 권한을 수정하여 Datastore 모드 데이터베이스가 포함된 프로젝트의 기본 서비스 계정에 다음 Cloud Storage 역할 중 하나를 할당합니다.

  • 스토리지 관리자
  • 스토리지 객체 관리자
  • 스토리지 기존 버킷 작성자

또한 위에 나열된 역할에 포함된 권한과 약간 다른 권한을 가진 IAM 커스텀 역할을 만들 수도 있습니다.

  • storage.buckets.get
  • storage.objects.create
  • storage.objects.list

가져오기 작업

다른 프로젝트의 Cloud Storage 버킷과 관련된 가져오기 작업의 경우 버킷의 권한을 수정하여 Datastore 모드 데이터베이스가 포함된 프로젝트의 기본 서비스 계정에 다음 Cloud Storage 역할 중 하나를 할당합니다.

  • 스토리지 관리자
  • 스토리지 객체 뷰어 및 스토리지 기존 버킷 리더

또한 다음 권한이 있는 IAM 커스텀 역할을 만들 수도 있습니다.

  • storage.buckets.get
  • storage.objects.get

사용 중지 또는 삭제된 기본 서비스 계정

App Engine 기본 서비스 계정을 사용 중지하거나 삭제하면 App Engine 앱은 Datastore 모드 데이터베이스에 대한 액세스 권한을 상실합니다. App Engine 서비스 계정을 사용 중지한 경우 다시 사용 설정할 수 있습니다. 서비스 계정 사용 설정을 참조하세요. 지난 30일 내에 App Engine 서비스 계정을 삭제한 경우, 서비스 계정을 복원할 수 있습니다. 서비스 계정 삭제 취소를 참조하세요.

Datastore 관리자 백업과의 차이점

Datastore 관리 콘솔을 사용하여 백업한 경우와의 차이점은 아래와 같습니다.

  • 관리형 내보내기로 생성된 내보내기가 Datastore 관리 콘솔에 표시되지 않습니다. 관리형 내보내기 및 가져오기는 Cloud Console을 통해 관리되는 App Engine의 백업 및 복원 기능과 데이터를 공유하지 않는 새로운 서비스입니다.

  • 관리형 내보내기 및 가져오기 서비스는 Datastore 관리자 백업과 동일한 메타데이터를 지원하지 않으며 진행 상태를 데이터베이스에 저장하지 않습니다. 내보내기 및 가져오기 작업 진행도 확인에 대한 자세한 내용은 장기 실행 작업 관리를 참조하세요.

  • 관리형 내보내기 및 가져오기 작업의 서비스 로그를 확인할 수 없습니다.

  • 관리형 가져오기 서비스는 Datastore 관리자 백업 파일과 하위 호환됩니다. 관리형 가져오기 서비스를 사용하여 Datastore 관리자 백업 파일을 가져올 수 있지만 Datastore 관리 콘솔을 사용하여 관리형 내보내기 출력을 가져올 수 없습니다.

감사 로그

Datastore 모드의 Firestore는 Cloud 감사 로그의 관리자 활동 감사 로그를 작성합니다. 관리자 활동 감사 로그에는 내보내기 작업, 가져오기 작업, 색인 생성 작업이 포함됩니다. Datastore 모드 데이터베이스의 관리자 활동 감사 로그를 보려면 감사 로그 보기를 참조하세요.

Datastore 모드 관리자 활동 감사 로그는 Cloud Datastore DatabaseCloud Datastore Index 리소스 유형 아래에 표시됩니다. Firestore 및 Datastore 관리자 활동 로그는 모두 이 리소스 유형 아래에 표시됩니다. Datastore 모드의 Firestore는 다음 작업을 로깅합니다.

감사 로그 카테고리 Datastore 모드 작업
관리자 활동 DatastoreAdmin.CreateIndex
DatastoreAdmin.DeleteIndex
DatastoreAdmin.ExportEntities
DatastoreAdmin.GetIndex
DatastoreAdmin.ImportEntities
DatastoreAdmin.ListIndexes

BigQuery로 가져오기

관리형 내보내기의 데이터를 BigQuery로 가져오려면 Datastore 내보내기 서비스 데이터 로드를 참조하세요.

항목 필터를 지정하지 않고 내보낸 데이터는 BigQuery에 로드될 수 없습니다. 데이터를 BigQuery로 가져오려면 내보내기 요청의 항목 필터에 종류 이름이 한 개 이상 포함되어야 합니다.

BigQuery 열 한도

BigQuery는 테이블당 열을 10,000개로 제한합니다. 내보내기 작업은 종류마다 BigQuery 테이블 스키마를 생성합니다. 이 스키마에서 종류의 항목 내 각 고유 속성은 스키마 열이 됩니다.

종류의 BigQuery 스키마 열이 10,000개를 초과하면 내보내기 작업은 포함된 항목을 blob으로 처리하여 열 한도를 넘지 않으려 합니다. 이 변환으로 스키마의 열 수가 10,000개 미만이 되면 BigQuery에 데이터를 로드할 수 있지만 포함된 항목 내에서 속성을 쿼리할 수 없습니다. 열의 수가 여전히 10,000개를 초과하는 경우 내보내기 작업은 종류의 BigQuery 스키마를 생성하지 않으며 데이터를 BigQuery에 로드할 수 없습니다.