Cloud Datalab 인스턴스에 Python 라이브러리 추가

이 가이드는 Cloud Datalab VM 인스턴스에 Python 라이브러리를 추가하여 Cloud Datalab을 맞춤설정하는 방법을 설명합니다.

Cloud Datalab 인스턴스에 Python 라이브러리 추가

Cloud Datalab에는 라이브러리 세트가 포함되어 있습니다. 포함된 라이브러리는 일반적인 데이터 분석, 변환, 시각화 상황을 지원합니다. 다음 세 가지 방법 중 하나를 사용하여 Python 라이브러리를 추가할 수 있습니다.

  • 선택사항 1: 메모장에 코드 셀을 추가한 후 lib-name을 대체하고 conda를 사용해서 코드 셀을 실행하여 라이브러리를 설치합니다.

    !conda install -y lib-name
    
    이 방법은 개별 요구 사항에 맞춤설정하는 가장 간편한 방법이며, 코드 셀 재실행이 쉬우므로 기본 Cloud Datalab 이미지가 업데이트되면서 유지보수가 최소화됩니다.

  • 선택사항 1.5: conda 대신 pip를 사용합니다. 가능한 conda를 통해 라이브러리를 설치해야 하지만 pip를 통해서만 일부 라이브러리를 사용할 수 있습니다. 이러한 경우, 위와 같이 코드 셀을 작성하되 콘텐츠를 다음과 같이 변경합니다.

    !pip install lib-name
    

  • 선택사항 2: 새 메모장을 만들고 다음 콘텐츠가 포함된 코드 셀을 추가하고 필요한 경우 conda를 pip로 바꾸고 lib-name로 대체합니다. pip를 사용하는 경우 -y를 삭제하는 것을 잊지 마세요.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    셀을 실행한 다음 브라우저의 Cloud Datalab 메모장이나 메모장 등록 페이지의 오른쪽 상단에서 아이콘user-icon을 클릭해 Cloud Datalab 인스턴스를 재시작하고, Datalab 정보,
    Google Cloud Datalab 정보 대화상자에서 서버 재시작 옵션을 클릭합니다.

  • 선택사항 3: Docker 맞춤설정 방법을 사용하여 Cloud Datalab Docker 컨테이너에서 상속합니다. 이 선택사항은 위에 나열된 다른 선택사항에 비해 훨씬 더 무겁습니다. 하지만 팀 또는 조직에서 사용하기 위해 컨테이너를 유의하게 맞춤설정할 경우에 최대 유연성을 제공합니다. 이 방법을 사용하려면 Docker 문서를 따라 'Dockerfile-extended-example'이라는 자체 컨테이너를 빌드해야 합니다. Cloud Datalab GitHub 저장소의 맞춤설정 예시도 참조하세요. Dockerfile-extended-example.in에서

    FROM datalab
    ...
    pip install lib-name
    ...
    
    이 접근 방식에서는 기본 datalab 컨테이너 발전에 따라 자신의 이미지를 빌드하고 유지 관리하는 추가 작업을 수행해야 합니다. 따라서 위에 설명된 다른 방법으로 요구 사항이 충족되지 않는 경우에만 이 방법을 사용하는 것이 좋습니다.