このガイドでは、Cloud Datalab VM インスタンスに Python ライブラリを追加して Cloud Datalab をカスタマイズする方法について説明します。
Cloud Datalab インスタンスに Python ライブラリを追加する
Cloud Datalab には一連のライブラリが含まれています。そのようなライブラリは、一般的なデータ分析、変換、可視化のシナリオをサポートすることを目的としています。Python ライブラリは、次の 3 つのいずれかの方法で追加できます。
オプション 1:ノートブックにコードセルを追加し、
lib-name
を置き換えてセルを実行することで、conda を使用してライブラリをインストールします。!conda install -y lib-name
コードセルの再実行は容易なので、この方法は、基礎となる Cloud Datalab イメージが更新されるにつれて個々のニーズに合わせてカスタマイズするための最も簡単な方法であり、最小限のメンテナンスで済みます。オプション 1.5: conda の代わりに pip を使用します。ライブラリは可能な限り conda 経由でインストールすべきですが、pip 経由でしか利用できないライブラリもあります。このような場合、上記のようにコードセルを作成しますが、内容を次のように変更します。
!pip install lib-name
オプション 2: 新しいノートブックを作成し、必要に応じて conda を pip に置き換え、
lib-name
を置き換えることで、次の内容のコードセルを追加します。pip を使用している場合、必ず-y
を削除します。%%bash echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh cat /content/datalab/.config/startup.sh
セルを実行し、Cloud Datalab インスタンスを再起動します。それには、ブラウザの Cloud Datalab ノートブックまたはノートブックの一覧ページの右上隅にあるアカウント アイコンをクリックし、[About Datalab] を選択します。
オプション 3: Docker カスタマイズ メカニズムを使用して Cloud Datalab Docker コンテナから継承することもできます。このオプションは、上記の他のオプションと比較してはるかに重たい方法です。ただし、チームや組織が使用する目的でコンテナを大幅にカスタマイズしようとする場合は、最大限の柔軟性が提供されます。このメカニズムを使用するには、以下の Docker ドキュメントに沿って、「Dockerfile-extended-example」という名前の独自のコンテナをビルドする必要があります。Cloud Datalab GitHub リポジトリのカスタマイズ例も参照してください。
Dockerfile-extended-example.in
:FROM datalab ... pip install lib-name ...
このアプローチでは、基礎となるdatalab
コンテナの発展に合わせて、独自のイメージを構築して維持するために追加作業を行う必要があります。したがって、上記の方法ではニーズが満たされない場合にのみ、このアプローチを使用することをおすすめします。