Datalab のクイックスタート

このクイックスタートでは、Datalab を設定して Cloud Monitoring プロジェクトで使用する方法を説明します。Datalab の動的ノートブックを使用すると、現在の Monitoring の機能より優れたアドホック分析と可視化を行うことができます。

Datalab で Monitoring チュートリアルをプレビューするには、Monitoring チュートリアルをご覧ください。Datalab を実行していない場合は、チュートリアルを操作できません。

始める前に

  1. Google アカウントにログインします。

    Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。

  2. Cloud Console のプロジェクト セレクタページで、Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタのページに移動

  3. Google Cloud プロジェクトに対して課金が有効になっていることを確認します。 プロジェクトに対して課金が有効になっていることを確認する方法を学習する

  4. Compute Engine and Cloud Source Repositories API を有効にします。

    API を有効にする

  5. Cloud SDK をインストールし、初期化します

Datalab のセットアップ

ローカルマシンのターミナル ウィンドウで次の手順を行います。

  1. 最新の gcloud コマンドを取得します。
    gcloud components update
    
  2. gcloud datalab コンポーネントをインストールします。
    gcloud components install datalab
    
  3. [PROJECT_ID] を Google Cloud プロジェクト ID に置き換えてから、次のコマンドを実行して gcloud を構成し、Google Cloud プロジェクト ID に接続します。

    gcloud config set project [PROJECT_ID]
    

    構成を確認するには、次のコマンドを実行します。

    gcloud config get-value project
    

  4. Datalab インスタンスを作成するには、[DATALAB-INSTANCE-NAME] を実際のインスタンス名に置き換えてから、次のコマンドを実行します。名前は先頭を小文字にし、その後に 62 文字以下の小文字、数字、ハイフンを続けます。末尾をハイフンにすることはできません。

    datalab create [DATALAB-INSTANCE-NAME]
    

    • プロンプトが表示されたら、一覧からゾーンを選択します。
    • SSH パスフレーズの設定が求められたら、フレーズを入力します。このパスフレーズは必ず保存してください。
    • しばらくすると、次のようなメッセージが表示されます。

      Created [https://www.googleapis.com/compute/v1/projects/[PROJECT_ID]/zones/[ZONE]/instances/[DATALAB-INSTANCE-NAME]].
      Connecting to [DATALAB-INSTANCE-NAME].
      This will create an SSH tunnel and may prompt you to create an rsa key pair. To manage these keys, see https://cloud.google.com/compute/docs/instances/adding-removing-ssh-keys
      Waiting for Datalab to be reachable at http://localhost:8081/
      

      プロンプトが表示されたら、パスフレーズを入力します。

      Enter passphrase for key '[...]/.ssh/google_compute_engine':
      

      数分で create コマンドは正常に完了し、次のようなメッセージが表示されます。

      The connection to Datalab is now open and will remain until this command is killed.
      You can connect to Datalab at http://localhost:8081/
      

  5. datalab コマンドがアクティブな間は Datalab インスタンスへの接続が開いたままです。ターミナル コマンド ウィンドウが閉じた場合や中断された場合は、接続は終了します。接続を再確立するには、次のコマンドを実行します。

    datalab connect [DATALAB-INSTANCE-NAME]
    

Datalab のインターフェース

Datalab のインターフェースを表示するには、URL http://127.0.0.1:8081/ をブラウジングするか、次のボタンをクリックします。Datalab を初めて使用する場合、利用規約に同意する必要があります。

実行中の Datalab に移動

Datalab のインターフェース

Datalab の docs/ フォルダに、Datalab を使い始めるためのノートブック(Cloud Monitoring 用のノートブックなど)が複数含まれています。

Datalab と Cloud Monitoring

Monitoring では、ワークスペースを使用して 1 つ以上の Google Cloud プロジェクトに含まれるリソースを整理します。ワークスペースを使用すると、アラートとダッシュボードの作成やグループの構成など、さまざまな操作を行えます。

Datalab でグループを使用するには、ワークスペースを作成する必要があります。ワークスペースを作成するには、[モニタリング] に移動します。

[モニタリング] に移動

Google Cloud プロジェクトがすでにワークスペースと関連付けられている場合は、Cloud Monitoring のホームページが表示されます。それ以外の場合は、ワークスペースが自動的に作成されます。通常、お客様による操作は必要ありませんが、完了までに数分かかる場合があります。[Add your project to a Workspace] ダイアログが表示される場合があります。この場合は、新しいワークスペースを作成するオプションを選択します。詳細については、ワークスペースをご覧ください。

Monitoring のチュートリアル

Datalab には、Monitoring の複数の対話形式チュートリアルがインストールされています。

始めに
Python Google Cloud のオペレーション スイート API を Datalab にインポートし、デフォルトの Google Cloud プロジェクト ID を設定する方法が示されています。API を呼び出してプロジェクトからモニタリング データを取得するサンプルコードがあります。
グループ指標
プロジェクト内のグループ構造を調べる方法と、グループを使用して指標データをフィルタ処理し、集計する方法が示されています。グループの指標を使用するにはワークスペースが必要です。ワークスペースにグループがない場合は、グループがある別のワークスペースに変更します。詳細については、ワークスペースをご覧ください。
時間シフトデータ
時系列データを変更する方法が示されています。ユーザーのプロジェクトによい例となる十分な VM インスタンスがない可能性があるので、このチュートリアルはデモンストレーション プロジェクトから以前に抽出されたデータをオプションで使用するようにセットアップされています。

以下で説明するように、チュートリアルを実行し、必要に応じて変更できます。

チュートリアルの実行

チュートリアルを実行するには:

  1. Datalab のインターフェースで、[docs]、[tutorials]、[Stackdriver Monitoring] の順にクリックします。次のようなページが表示されます。

    Stackdriver チュートリアル

  2. チュートリアルを選択します。実行するチュートリアルの名前をクリックします。

  3. プロジェクト ID を設定します。次のように set_datalab_project_id('my-project-id') を含むセルを編集します。

    • ワークスペースを作成済みの場合は、my-project-id をそのワークスペース名に置き換えます。グループの指標を使用するにはワークスペースが必要です。
    • ワークスペースがない場合は、my-project-id を実際の Google Cloud プロジェクト ID に置き換えます。
  4. チュートリアルのコードを実行します。インターフェース上部のメニューバーから、[Run] > [Run all cells] を選択します。現在のプロジェクト ID を使用して、チュートリアルのすべてのコードが再実行されます。

チュートリアルのコードを自由に変更し、試してみてください。1 つのセルのコードを実行するには、セルをクリックして、セルの左側のメニューから [Run] を選択します。独自のノートブックを作成することもできます。

クリーンアップ

このクイックスタートで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順に従います。

  1. Datalab インターフェースの右上にある [Running Sessions] アイコンをクリックし、使用していないノートブックをシャットダウンします。必要であれば、後で再開できます。関連付けられているブラウザタブまたはウィンドウを閉じます。

  2. Datalab が実行されているウィンドウで「CTRL-C」を入力し、ブラウザで Datalab のタブを閉じます。

  3. Datalab VM インスタンスの作成時から削除時まで料金が発生します(Cloud Datalab の料金を参照)。また、ノートブックが保存されている永続ディスクの料金も請求されます。永続ディスクは、Datalab VM を削除した後もその永続ディスクを削除するまで維持されます。

    Datalab VM インスタンスと永続ディスクを削除するには、次のコマンドを実行します。

    datalab delete --delete-disk [DATALAB-INSTANCE-NAME]
    

  4. datalab create コマンドによって追加のリソースも作成されますが、このリソースは、他に作成する Datalab インスタンスによって再利用されます。追加の Datalab インスタンスを作成しない場合には、次のコマンドを実行して、以下に示される追加のリソースを削除できます。

    • Datalab インスタンスへの SSH 接続を可能にする datalab-network-allow-ssh ファイアウォール ルールを削除します。
      gcloud compute firewall-rules delete datalab-network-allow-ssh
      
    • Datalab インスタンスがデフォルトで接続される datalab-network Virtual Private Cloud(VPC) ネットワークを削除します。
      gcloud compute networks delete datalab-network
      
    • ノートブックを保存するために設定されている datalab-notebooksCloud Source Repositories のリポジトリを削除します(リポジトリを削除する前にノートブックをバックアップする場合は、ノートブックの操作をご覧ください)。
      gcloud source repos delete datalab-notebooks
      
  5. 残したくないワークスペース、プロジェクト、VM インスタンスを作成した場合は削除します。

次のステップ

以下の API リファレンス資料をご覧ください。