VM 머신 유형 선택

이 페이지에서는 Cloud Datalab 가상 머신(VM) 인스턴스에 적합한 Google Compute Engine 머신 유형을 선택할 때 고려할 사항을 설명합니다.

VM 머신 유형을 선택할 때 고려할 사항

Datalab VM 인스턴스를 만들 때 Google Compute Engine 머신 유형을 지정할 수 있습니다. 사용하는 기본 머신 유형은 n1-standard-1입니다. 데이터 분석 요구에 맞게 성능 및 비용 특성에 따라 다른 머신 유형을 선택할 수 있습니다. 다음은 머신 유형을 선택할 때 고려할 몇 가지 주요 사항입니다.

  • 각 노트북은 Python 커널을 사용하여 자체 프로세스에서 코드를 실행합니다. 예를 들어 N개의 노트북이 열린 경우 이러한 노트북에 해당하는 프로세스가 최소한 N개 있습니다.
  • 각 커널은 단일 스레드입니다. 동시에 여러 노트북을 실행하는 경우가 아니면 다중 코어의 뛰어난 이점을 누리지 못할 수 있습니다.
  • 사용 패턴과 처리된 데이터 양에 따라 추가 메모리가 있는 머신을 선택하면 상당한 이점을 누릴 수 있습니다.
  • 실행은 누적 방식입니다. Cloud Datalab 메모장 셀 3개를 연속으로 실행하면 해당 셀에 사용된 데이터 구조에 할당된 메모리를 포함하여 해당 상태가 누적됩니다.
  • 메모리에서 다량의 데이터 처리(예: Pandas Dataframes 사용)는 메모리 할당과 비례합니다. 메모장 실행이 완료되면 상단 막대에서 실행 중인 세션 아이콘 sessions-icon을 클릭하고(아이콘을 보려면 브라우저 창 크기를 조정해야 할 수 있음) 세션을 종료하여 세션을 중지할 수 있습니다.
  • Cloud Datalab은 디스크 기반 스왑 파일을 활용하여 메모리를 추가로 요구하는 오버헤드를 제공합니다. 하지만 스왑 파일을 사용하면 처리 속도가 느려질 수 있습니다. 메모리 요구량을 예상한 후 예상 메모리 양이 최소인 머신 유형을 선택하는 것이 가장 좋습니다.

머신 유형 선택

인스턴스 생성 시 Cloud Datalab VM 인스턴스의 머신 유형을 선택합니다. 자세한 내용은 datalab create --machine-type을 참조하세요. 예를 들면 다음과 같습니다.

datalab create --machine-type n1-highmem-2 instance-name