공개 인스턴스 만들기

이 페이지에서는 Cloud Data Fusion 인스턴스를 만드는 방법을 설명합니다.

시작하기 전에

  • Cloud Data Fusion API를 사용 설정합니다.
  • Cloud Data Fusion 인스턴스를 만들려면 instances.create 권한이 필요합니다. 자세한 내용은 액세스 제어를 참조하세요.
  • Cloud Data Fusion 인스턴스는 Compute Engine 기본 서비스 계정으로 실행됩니다. 사용 가능한 유형 및 역할은 서비스 계정을 참조하세요.
  • 기본적으로 Cloud Data Fusion은 프로젝트의 Dataproc 클러스터를 사용하여 파이프라인을 실행합니다. 프로젝트가 Dataproc 네트워킹 요구사항을 충족하는지 확인합니다.
  • 새 프로젝트는 기본 네트워크로 시작합니다. 기본 네트워크는 default-allow-ssh 방화벽 규칙으로 자동 입력되어 TCP 포트 22를 통해 모든 소스에서 네트워크의 모든 인스턴스로 들어오는 연결을 허용합니다. 6.2.0 이하 버전에서 TCP 포트 22의 인그레스를 허용하는 이 규칙이 Cloud Data Fusion 인스턴스에서 사용하는 네트워크에 존재하지 않는 경우 이 규칙을 만들어야 합니다.

인스턴스 만들기

콘솔

API가 사용 설정된 경우 Google Cloud 콘솔의 Cloud Data Fusion 섹션에 Cloud Data Fusion 인스턴스를 관리할 수 있는 인스턴스 페이지가 표시됩니다.

  1. 콘솔에서 Cloud Data Fusion 페이지로 이동합니다.
  2. 인스턴스를 클릭한 후 인스턴스 만들기를 클릭합니다.

    인스턴스 만들기

  3. 인스턴스 이름을 입력합니다.
  4. 인스턴스의 설명을 입력합니다.
  5. 인스턴스를 만들 리전을 지정합니다.
  6. Cloud Data Fusion 버전을 지정합니다.
  7. 버전을 선택합니다. 기본값은 Basic입니다.
  8. 선택사항: 가속기 추가를 클릭하여 인스턴스에 사용할 가속기를 선택합니다.
  9. Dataproc에서 Cloud Data Fusion 파이프라인을 실행하는 데 사용할 Dataproc 서비스 계정을 지정합니다. 기본값은 Compute Engine 계정입니다. 버전에 관계없이 서비스 계정에 필요에 맞는 적절한 ID 및 액세스 관리 역할이 있는지 확인합니다. 자세한 내용은 서비스 계정 사용자 권한 부여를 참조하세요.
  10. 선택사항: 고급 옵션을 지정합니다. 아무 것도 지정하지 않으면 다음 기본값이 사용됩니다.

    카테고리 설정 설명 기본값
    비공개 IP 내부 IP 주소 사용 설정 내부 IP 주소로 Cloud Data Fusion 인스턴스를 만듭니다. 사용 중지됨
    로깅 및 모니터링 Cloud Logging 사용 설정 Cloud Logging에서 파이프라인 로그 보기 사용 중지됨
    Dataplex 데이터 계보 통합 Dataplex 데이터 계보와의 통합 사용 설정 또는 사용 중지 Dataplex에서 계보 보기 사용 중지됨
    암호화 고객 관리 암호화 키(CMEK) 사용 버전 6.5 이상에서 역할 기반 액세스 제어를 사용합니다. 사용 중지됨
    라벨 키-값 쌍 Compute Engine VM과 같은 관련 기본 리소스에 주석을 추가하는 데 사용할 인스턴스의 리소스 라벨입니다. 라벨 키 및 라벨 값에는 문자, 숫자, 대시, 밑줄만 포함할 수 있습니다. 라벨 키는 문자 또는 숫자로 시작해야 합니다. 없음
  11. 만들기를 클릭합니다. 인스턴스 생성 프로세스가 완료되는 데 최대 30분이 걸립니다.

Cloud Data Fusion이 인스턴스를 만드는 동안 인스턴스 페이지의 인스턴스 이름 옆에 진행률 휠이 표시됩니다. 완료되면 녹색 체크표시로 바뀌어 이제 인스턴스를 사용할 수 있음을 알립니다.

API

인스턴스를 만듭니다.

Cloud Data Fusion REST API로 Cloud Data Fusion 인스턴스를 만들려면 구성 정보를 Instance 리소스에 입력하고 instances.create API 요청을 작성합니다.

다음 단계