Dataproc クラスタでマネージド ノートブック インスタンスを実行する

このページでは、Dataproc クラスタでマネージド ノートブック インスタンスのノートブック ファイルを実行する方法について説明します。

始める前に

  1. Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Google Cloud プロジェクトで課金が有効になっていることを確認します

  4. Notebooks and Dataproc API を有効にします。

    API を有効にする

  5. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  6. Google Cloud プロジェクトで課金が有効になっていることを確認します

  7. Notebooks and Dataproc API を有効にします。

    API を有効にする

  8. まだ作成していない場合は、マネージド ノートブック インスタンスを作成します。

Dataproc クラスタを作成する

マネージド ノートブック インスタンスのノートブック ファイルを Dataproc クラスタで実行するには、クラスタが次の条件を満たしている必要があります。

  • クラスタのコンポーネント ゲートウェイが有効になっている必要があります。

  • クラスタに Jupyter コンポーネントが必要です。

  • クラスタは、マネージド ノートブック インスタンスと同じリージョンに存在する必要があります。

Dataproc クラスタを作成するには、Cloud Shell または Google Cloud CLI がインストールされている別の環境で、次のコマンドを入力します。

gcloud dataproc clusters create --region=REGION \
    --enable-component-gateway \
    --optional-components=JUPYTER CLUSTER_NAME

次のように置き換えます。

  • REGION: マネージド ノートブック インスタンスの Google Cloud のロケーション

  • CLUSTER_NAME: 新しいクラスタの名前。

数分後、Dataproc クラスタを使用できるようになります。Dataproc クラスタの作成に関する詳細をご覧ください。

JupyterLab を開く

  1. まだ作成していない場合は、Dataproc クラスタと同じリージョンにマネージド ノートブック インスタンスを作成します。

  2. Google Cloud コンソールで、[マネージド ノートブック] ページに移動します。

    [マネージド ノートブック] に移動

  3. マネージド ノートブック インスタンス名の横にある [Open JupyterLab] をクリックします。

Dataproc クラスタでノートブック ファイルを実行する