Cloud Datalab インスタンスのライフサイクルを管理する

コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

このページでは、Cloud Datalab インスタンスのライフサイクルと、コンピューティング リソースの管理と保存に使用できるオプションについて説明します。

Cloud Datalab は、Google Compute Engine VM の内部で実行され、ノートブックの保存に使用される永続ディスクが接続されています。Cloud Datalab VM は datalab-network. というプロジェクト内の特別なネットワークに接続されています。このネットワークのデフォルト構成では、受信接続が SSH 接続に制限されます。

前提条件

以下で説明するコマンドを使用するには、次の操作が必要です。

  1. Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Cloud プロジェクトに対して課金が有効になっていることを確認します。詳しくは、プロジェクトで課金が有効になっているかどうかを確認する方法をご覧ください。

  4. Google Compute Engine and Cloud Source Repositories API を有効にします。

    API を有効にする

  5. Google Cloud CLI をインストールします。
  6. gcloud CLI を初期化するには:

    gcloud init
  7. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  8. Cloud プロジェクトに対して課金が有効になっていることを確認します。詳しくは、プロジェクトで課金が有効になっているかどうかを確認する方法をご覧ください。

  9. Google Compute Engine and Cloud Source Repositories API を有効にします。

    API を有効にする

  10. Google Cloud CLI をインストールします。
  11. gcloud CLI を初期化するには:

    gcloud init

インスタンスの作成

datalab create コマンドを使用して Cloud Datalab インスタンスを作成します。

datalab create instance-name

このコマンドでは、いくつかのコマンドライン オプションを使用できます。たとえば、デフォルトよりも多くのメモリを持つインスタンスを作成する場合、--machine-type フラグを渡します。

datalab create --machine-type n1-highmem-2 instance-name

使用可能なすべてのオプションを一覧表示するには、次のコマンドを実行します。

datalab create --help

デフォルトでは、datalab create コマンドは新しく作成されたインスタンスに接続します。インスタンスを作成するものの、それに接続しない場合は、--no-connect フラグを渡します。

datalab create --no-connect instance-name

datalab create コマンドは、次の Google Cloud Platform リソースも作成します(まだ存在しない場合)。

  • datalab-network ネットワーク
  • 受信 SSH 接続を許可する datalab-network 上のファイアウォール ルール
  • datalab-notebooks Google Cloud Source Repository
  • Cloud Datalab ノートブックを格納する永続ディスク

上記の手順の一部では、オーナーの権限が必要な場合があります(チーム環境で Cloud Datalab を使用するを参照)。

インスタンスへの接続

datalab ツールは Cloud Datalab インスタンスへの永続的な SSH トンネルを作成し、Cloud Datalab がローカルマシン上で実行されているかのようにローカル ブラウザからインスタンスに接続できるようにします。

この接続を作成するには、datalab connect コマンドを使用します。

datalab connect instance-name

インスタンスが実行中でない場合、datalab connect コマンドを実行するとインスタントが再起動されます。コマンドは、停止するまで実行を続けます(コマンドが実行されている間は、接続は使用可能なままです)。

デフォルトでは、接続に使用されるローカルポートは 8081 です。別のポートに変更するには、--port フラグを渡します。たとえば、ローカルポート 8082 を使用するには、次のコマンドを実行します。

datalab connect --port 8082 instance-name

インスタンスの停止

次のコマンドを実行すると Cloud Datalab インスタンスが停止し、Cloud Datalab の使用を一時停止する際に不要なコストが発生しません。

datalab stop instance-name

Cloud Datalab を再び使用する準備ができたら、datalab connect コマンドを実行してインスタンスを再起動します。

ノートブック ディスクを削除せずに Cloud Datalab VM を更新する

新しい Cloud Datalab バージョンに更新したり、VM のプロパティ(マシンタイプやサービス アカウントなど)を変更したりする場合は、永続ディスクに保存されているノートブックを失うことなく、Cloud Datalab VM を削除してから再作成できます。

datalab delete --keep-disk instance-name
datalab create instance-name

インスタンスとノートブック ディスクを削除する

デフォルトでは、datalab delete コマンドはノートブックを保持する永続ディスクを削除しません。これにより、誤ってデータを失うことなく簡単に VM を変更できます(ノートブック ディスクを削除せずにインスタンスを削除、再作成するを参照)。

VM と接続された永続ディスクの両方を削除するには、コマンドに --delete-disk フラグを追加します。

datalab delete --delete-disk instance-name

コンピューティング リソースの使用量を削減する

Google Compute Engine VM にはコストが発生します。Cloud Datalab インスタンスを使用しているかどうかにかかわらず、Cloud Datalab インスタンスが実行されている時間に対して料金が発生します。インスタンスを使用していないときにはインスタンスを停止することで、Cloud Datalab VM の料金を削減できます。VM に接続されているリソース(永続ディスクや外部 IP アドレスなど)には引き続き料金が発生しますが、VM インスタンス自体は停止中に料金が発生することはありません。

停止したインスタンスを再度使用する必要がある場合は、datalab connect instance-name を実行してインスタンスに接続します。その際、接続を試行する前に datalab ツールによってインスタンスが再起動されます。

Cloud Datalab インスタンスに関連するすべての課金を停止するには、--delete-disk オプションを指定して datalab delete コマンドを実行し、接続された永続ディスクと VM の両方を削除する必要があります。