Cloud Datalab インスタンスに Python ライブラリを追加する

このガイドでは、Cloud Datalab VM インスタンスに Python ライブラリを追加して Cloud Datalab をカスタマイズする方法について説明します。

Cloud Datalab インスタンスに Python ライブラリを追加する

Cloud Datalab には一連のライブラリが含まれています。そのようなライブラリは、一般的なデータ分析、変換、可視化のシナリオをサポートすることを目的としています。Python ライブラリは、次の 3 つのいずれかの方法で追加できます。

  • オプション 1: ノートブックにコードセルを追加し、lib-name を置き換えてセルを実行することで、conda を使用してライブラリをインストールします。

    !conda install -y lib-name
    
    コードセルの再実行は容易なので、この方法は、基礎となる Cloud Datalab イメージが更新されるにつれて個々のニーズに合わせてカスタマイズするための最も簡単な方法であり、最小限のメンテナンスで済みます。

  • オプション 1.5: conda の代わりに pip を使用します。ライブラリは可能な限り conda 経由でインストールすべきですが、pip 経由でしか利用できないライブラリもあります。このような場合、上記のようにコードセルを作成しますが、内容を次のように変更します。

    !pip install lib-name
    

  • オプション 2: 新しいノートブックを作成し、必要に応じて conda を pip に置き換え、lib-name を置き換えることで、次の内容のコードセルを追加します。pip を使用している場合、必ず -y を削除します。

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    セルを実行して、Cloud Datalab インスタンスを再起動します。それには、ブラウザの Cloud Datalab ノートブックまたはノートブック一覧ページの右上隅にあるアカウント アイコン user-icon をクリックし、[About Datalab] を選択します。
    次に、[About Google Cloud Datalab] ダイアログで [Restart Server] オプションをクリックします。

  • オプション 3: Docker カスタマイズ メカニズムを使用して Cloud Datalab Docker コンテナから継承することもできます。このオプションは、上記の他のオプションと比較してはるかに重たい方法です。ただし、チームや組織が使用する目的でコンテナを大幅にカスタマイズしようとする場合は、最大限の柔軟性が提供されます。このメカニズムを使用するには、以下の Docker ドキュメントに沿って、「Dockerfile-extended-example」という名前の独自のコンテナをビルドする必要があります。Cloud Datalab GitHub リポジトリのカスタマイズ例も参照してください。

    Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    このアプローチでは、基礎となる datalab コンテナが発展するにつれて、独自のイメージを構築し維持するために追加作業を行う必要があります。したがって、上記の方法ではニーズが満たされない場合にのみ、このアプローチを使用することをおすすめします。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Datalab ドキュメント
ご不明な点がありましたら、Google のサポートページをご覧ください。