このページでは、Cloud Datalab インスタンスのライフサイクルと、コンピューティング リソースの管理と保存に使用できるオプションについて説明します。
Cloud Datalab は、Google Compute Engine VM の内部で実行され、ノートブックの保存に使用される永続ディスクが接続されています。Cloud Datalab VM は datalab-network.
というプロジェクト内の特別なネットワークに接続されています。このネットワークのデフォルト構成では、受信接続が SSH 接続に制限されます。
前提条件
以下で説明するコマンドを使用するには、次の操作が必要です。
- Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
-
Cloud プロジェクトに対して課金が有効になっていることを確認します。詳しくは、プロジェクトで課金が有効になっているかどうかを確認する方法をご覧ください。
-
Google Compute Engine and Cloud Source Repositories API を有効にします。
- Google Cloud CLI をインストールします。
-
gcloud CLI を初期化するには:
gcloud init
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
-
Cloud プロジェクトに対して課金が有効になっていることを確認します。詳しくは、プロジェクトで課金が有効になっているかどうかを確認する方法をご覧ください。
-
Google Compute Engine and Cloud Source Repositories API を有効にします。
- Google Cloud CLI をインストールします。
-
gcloud CLI を初期化するには:
gcloud init
インスタンスの作成
datalab create コマンドを使用して Cloud Datalab インスタンスを作成します。
datalab create instance-name
このコマンドでは、いくつかのコマンドライン オプションを使用できます。たとえば、デフォルトよりも多くのメモリを持つインスタンスを作成する場合、--machine-type
フラグを渡します。
datalab create --machine-type n1-highmem-2 instance-name
使用可能なすべてのオプションを一覧表示するには、次のコマンドを実行します。
datalab create --help
デフォルトでは、datalab create
コマンドは新しく作成されたインスタンスに接続します。インスタンスを作成するものの、それに接続しない場合は、--no-connect
フラグを渡します。
datalab create --no-connect instance-name
datalab create
コマンドは、次の Google Cloud Platform リソースも作成します(まだ存在しない場合)。
datalab-network
ネットワーク- 受信 SSH 接続を許可する
datalab-network
上のファイアウォール ルール datalab-notebooks
Google Cloud Source Repository- Cloud Datalab ノートブックを格納する永続ディスク
上記の手順の一部では、オーナーの権限が必要な場合があります(チーム環境で Cloud Datalab を使用するを参照)。
インスタンスへの接続
datalab
ツールは Cloud Datalab インスタンスへの永続的な SSH トンネルを作成し、Cloud Datalab がローカルマシン上で実行されているかのようにローカル ブラウザからインスタンスに接続できるようにします。
この接続を作成するには、datalab connect コマンドを使用します。
datalab connect instance-name
インスタンスが実行中でない場合、datalab connect
コマンドを実行するとインスタントが再起動されます。コマンドは、停止するまで実行を続けます(コマンドが実行されている間は、接続は使用可能なままです)。
デフォルトでは、接続に使用されるローカルポートは 8081
です。別のポートに変更するには、--port
フラグを渡します。たとえば、ローカルポート 8082
を使用するには、次のコマンドを実行します。
datalab connect --port 8082 instance-name
インスタンスの停止
次のコマンドを実行すると Cloud Datalab インスタンスが停止し、Cloud Datalab の使用を一時停止する際に不要なコストが発生しません。
datalab stop instance-name
Cloud Datalab を再び使用する準備ができたら、datalab connect
コマンドを実行してインスタンスを再起動します。
ノートブック ディスクを削除せずに Cloud Datalab VM を更新する
新しい Cloud Datalab バージョンに更新したり、VM のプロパティ(マシンタイプやサービス アカウントなど)を変更したりする場合は、永続ディスクに保存されているノートブックを失うことなく、Cloud Datalab VM を削除してから再作成できます。
datalab delete --keep-disk instance-name
datalab create instance-name
インスタンスとノートブック ディスクを削除する
デフォルトでは、datalab delete コマンドはノートブックを保持する永続ディスクを削除しません。これにより、誤ってデータを失うことなく簡単に VM を変更できます(ノートブック ディスクを削除せずにインスタンスを削除、再作成するを参照)。
VM と接続された永続ディスクの両方を削除するには、コマンドに --delete-disk
フラグを追加します。
datalab delete --delete-disk instance-name
コンピューティング リソースの使用量を削減する
Google Compute Engine VM にはコストが発生します。Cloud Datalab インスタンスを使用しているかどうかにかかわらず、Cloud Datalab インスタンスが実行されている時間に対して料金が発生します。インスタンスを使用していないときにはインスタンスを停止することで、Cloud Datalab VM の料金を削減できます。VM に接続されているリソース(永続ディスクや外部 IP アドレスなど)には引き続き料金が発生しますが、VM インスタンス自体は停止中に料金が発生することはありません。
停止したインスタンスを再度使用する必要がある場合は、datalab connect instance-name
を実行してインスタンスに接続します。その際、接続を試行する前に datalab
ツールによってインスタンスが再起動されます。
Cloud Datalab インスタンスに関連するすべての課金を停止するには、--delete-disk
オプションを指定して datalab delete コマンドを実行し、接続された永続ディスクと VM の両方を削除する必要があります。