Cloud Datalab 빠른 시작

이 빠른 시작에서는 Cloud Datalab을 Monitoring 프로젝트에 사용할 수 있도록 설정하는 방법을 보여줍니다. Cloud Datalab의 동적 노트북을 사용하면 Monitoring의 현재 기능 범위를 넘어서 임시 분석 및 시각화 기능을 수행할 수 있습니다.

Cloud Datalab에서 Monitoring 가이드를 미리 보려면 Monitoring 가이드를 참조하세요. Cloud Datalab을 실행 중이 아니면 가이드와 상호작용할 수 없습니다.

시작하기 전에

  1. Google 계정에 로그인합니다.

    아직 계정이 없으면 새 계정을 등록하세요.

  2. Google Cloud Platform 프로젝트를 선택하거나 만듭니다.

    리소스 관리 페이지로 이동

  3. Google Cloud Platform 프로젝트에 결제가 사용 설정되어 있는지 확인하세요.

    결제 사용 설정 방법 알아보기

  4. Compute Engine and Cloud Source Repositories APIs를 사용 설정합니다.

    APIs 사용 설정

  5. Cloud SDK 설치 및 초기화.

Cloud Datalab 설정

로컬 머신의 터미널 창에서 다음 단계를 수행하세요.

  1. 최신 gcloud 명령어를 가져옵니다.
    gcloud components update
    
  2. gcloud datalab 구성요소를 설치합니다.
    gcloud components install datalab
    
  3. gcloud를 구성하여 GCP 프로젝트 ID에 연결하려면 [PROJECT_ID]를 GCP 프로젝트 ID로 바꾼 후 다음 명령어를 실행합니다.

    gcloud config set project [PROJECT_ID]
    

    다음 명령어를 실행하여 구성을 확인합니다.

    gcloud config get-value project
    

  4. Cloud Datalab 인스턴스를 만들려면 [DATALAB-INSTANCE-NAME]을 인스턴스 이름으로 바꾼 후 다음 명령어를 실행합니다. 인스턴스 이름은 소문자로 시작해야 하고 62자(영문 기준)를 넘지 않아야 합니다. 이름에 소문자, 숫자, 하이픈을 사용할 수 있으며 하이픈으로 끝나면 안됩니다.

    datalab create [DATALAB-INSTANCE-NAME]
    

    • 메시지가 나타나면 목록에서 영역을 선택합니다.
    • SSH 암호를 설정하라는 메시지가 나타나면 암호를 입력합니다. 이 암호는 저장해 두어야 합니다.
    • 잠시 후 아래와 비슷한 메시지가 표시됩니다.

      Created [https://www.googleapis.com/compute/v1/projects/[PROJECT_ID]/zones/[ZONE]/instances/[DATALAB-INSTANCE-NAME]].
      Connecting to [DATALAB-INSTANCE-NAME].
      This will create an SSH tunnel and may prompt you to create an rsa key pair. To manage these keys, see https://cloud.google.com/compute/docs/instances/adding-removing-ssh-keys
      Waiting for Datalab to be reachable at http://localhost:8081/
      

      메시지가 표시되면 암호를 입력합니다.

      Enter passphrase for key '[...]/.ssh/google_compute_engine':
      

      잠시 후 create 명령어가 성공적으로 완료되면 아래와 비슷한 메시지가 표시됩니다.

      The connection to Datalab is now open and will remain until this command is killed.
      You can connect to Datalab at http://localhost:8081/
      

  5. datalab 명령어가 활성 상태이면 Cloud Datalab 인스턴스 연결은 열린 상태로 유지됩니다. 터미널 명령어 창이 닫히거나 중단되면 연결이 종료됩니다. 연결을 다시 설정하려면 다음 명령어를 실행합니다.

    datalab connect [DATALAB-INSTANCE-NAME]
    

Cloud Datalab 인터페이스

Cloud Datalab 인터페이스를 보려면 URL http://127.0.0.1:8081/로 이동하거나 다음 버튼을 클릭합니다. Cloud Datalab을 처음 사용하는 경우에는 서비스 약관에 동의해야 합니다.

실행 중인 Cloud Datalab로 이동

Cloud Datalab 인터페이스

Cloud Datalab docs/ 폴더에서는 Stackdriver Monitoring용 노트북을 포함하여 몇 가지 Datalab 시작하기 노트북을 찾아볼 수 있습니다.

Cloud Datalab 및 Stackdriver Monitoring

Monitoring은 작업공간을 사용하여 하나 이상의 GCP 프로젝트에 포함된 리소스를 정리합니다. 특히 작업공간을 사용할 경우 알림 및 대시보드를 만들고 그룹을 구성할 수 있습니다. Cloud Datalab에 그룹을 사용하는 작업공간을 만들어야 합니다.

GCP 프로젝트에 대한 작업공간을 만드는 것이 좋습니다. 작업공간은 무료이며 간편하게 만들 수 있습니다. 자세한 내용은 작업공간 빠르게 표시를 참조하세요.

Monitoring 가이드

Cloud Datalab은 여러 Monitoring 대화형 가이드와 함께 설치됩니다.

시작하기
Python Stackdriver API를 Cloud Datalab으로 가져오고 기본 GCP 프로젝트 ID를 설정하는 방법을 보여줍니다. API를 호출하고 프로젝트에서 모니터링 데이터를 검색하는 샘플 코드가 제공됩니다.
그룹 측정항목
프로젝트에서 그룹 구조를 확인하고 그룹을 사용하여 측정항목 데이터를 필터링하고 집계하는 방법을 보여줍니다. 그룹 측정항목을 사용하려면 작업공간이 있어야 합니다. 작업공간에 그룹이 없는 경우 그룹이 포함된 다른 작업공간으로 바꿉니다. 작업공간을 만드는 방법에 대한 자세한 내용은 작업공간 빠르게 표시를 참조하세요.
타임시프트 데이터
시계열 데이터를 흥미로운 방식으로 변환하는 방법을 보여줍니다. 사용자 프로젝트에는 적절한 예로 사용할 만한 VM 인스턴스가 충분하지 않을 수 있기 때문에 이 가이드는 데모 프로젝트에서 이전에 추출한 데이터를 사용할 수 있도록 설정되어 있습니다.

가이드를 실행하고 원하는 경우 다음 섹션에 설명된 것처럼 수정할 수 있습니다.

가이드 실행

가이드를 실행하는 방법은 다음과 같습니다.

  1. Cloud Datalab 인터페이스에서 docs, tutorials, Stackdriver Monitoring을 클릭합니다. 다음 페이지가 표시됩니다.

    Stackdriver 가이드

  2. 가이드를 선택합니다. 실행하려는 가이드 이름을 클릭합니다.

  3. 프로젝트 ID를 설정합니다. set_datalab_project_id('my-project-id')이 포함된 셀을 다음과 같이 수정합니다.

    • 작업공간을 만들었으면 my-project-id를 작업공간 이름으로 바꿉니다. 그룹 측정항목을 사용하려면 작업공간이 있어야 합니다.
    • 작업공간이 없으면 my-project-id를 GCP 프로젝트 ID로 바꿉니다.
  4. 가이드 코드를 실행합니다. 인터페이스 위에 있는 메뉴 바에서 실행 > 모든 셀 실행을 선택합니다. 그러면 현재 프로젝트 ID를 사용해서 가이드의 모든 코드가 다시 실행됩니다.

가이드의 코드를 자유롭게 수정하고 변경사항을 시험해볼 수 있습니다. 셀을 클릭하고 셀 왼쪽의 메뉴에서 실행을 선택하여 단일 셀의 코드를 실행할 수 있습니다. 또한 사용자의 고유 노트북을 만들 수 있습니다.

삭제

이 빠른 시작에서 사용한 리소스 비용이 GCP 계정에 청구되지 않도록 다음을 수행합니다.

  1. Cloud Datalab 인터페이스의 오른쪽 위에 있는 실행 중인 세션 아이콘을 클릭하고 사용 중이 아닌 모든 노트북을 종료합니다. 나중에 필요하면 다시 시작할 수 있습니다. 연관된 브라우저 탭 또는 창을 닫습니다.

  2. Cloud Datalab이 실행 중인 창에서 CTRL-C를 입력하고 브라우저에서 Cloud Datalab 탭을 닫습니다.

  3. Cloud Datalab VM 인스턴스를 만들 때부터 삭제할 때까지 비용이 발생합니다(Cloud Datalab 가격 책정 참조). 노트북이 저장된 Persistent Disk에 대해서도 비용이 청구됩니다. Persistent Disk는 Cloud Datalab VM이 삭제된 후에도 사용자가 삭제할 때까지 유지됩니다.

    Cloud Datalab VM 인스턴스 및 Persistent Disk를 삭제하려면 다음 명령어를 실행합니다.

    datalab delete --delete-disk [DATALAB-INSTANCE-NAME]
    

  4. datalab create 명령어로 만든 추가 리소스가 제공되며, 이러한 리소스는 사용자가 만든 다른 Cloud Datalab 인스턴스에서 재사용됩니다. 더 생성되는 Cloud Datalab 인스턴스가 없을 것으로 예상되는 경우에는 다음 명령어를 실행하여 아래 나열된 추가 리소스를 삭제할 수 있습니다.

    • SSH를 통해 Cloud Datalab 인스턴스에 연결할 수 있는 datalab-network-allow-ssh 방화벽 규칙을 삭제합니다.
      gcloud compute firewall-rules delete datalab-network-allow-ssh
      
    • Datalab 인스턴스가 기본적으로 연결되는 datalab-network Virtual Private Cloud(VPC) 네트워크를 삭제합니다.
      gcloud compute networks delete datalab-network
      
    • 노트북 저장을 위해 설정한 datalab-notebooks Cloud Source Repositories를 삭제합니다(저장소를 삭제하기 전에 노트북을 백업하려면 노트북 다루기 참조).
      gcloud source repos delete datalab-notebooks
      
  5. 사용자가 만든 작업공간, 프로젝트 또는 VM 인스턴스를 유지하지 않으려면 삭제합니다.

다음 단계

다음 API 참조 자료를 확인하세요.

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

Stackdriver Monitoring
도움이 필요하시나요? 지원 페이지를 방문하세요.