このページでは、Dataproc クラスタでマネージド ノートブック インスタンスのノートブック ファイルを実行する方法について説明します。
始める前に
- Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
-
Notebooks and Dataproc API を有効にします。
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
-
Notebooks and Dataproc API を有効にします。
- まだ作成していない場合は、マネージド ノートブック インスタンスを作成します。
Dataproc クラスタを作成する
マネージド ノートブック インスタンスのノートブック ファイルを Dataproc クラスタで実行するには、クラスタが次の条件を満たしている必要があります。
クラスタのコンポーネント ゲートウェイが有効になっている必要があります。
クラスタに Jupyter コンポーネントが必要です。
クラスタは、マネージド ノートブック インスタンスと同じリージョンに存在する必要があります。
Dataproc クラスタを作成するには、Cloud Shell または Google Cloud CLI がインストールされている別の環境で、次のコマンドを入力します。
gcloud dataproc clusters create --region=REGION \ --enable-component-gateway \ --optional-components=JUPYTER CLUSTER_NAME
次のように置き換えます。
REGION
: マネージド ノートブック インスタンスの Google Cloud のロケーションCLUSTER_NAME
: 新しいクラスタの名前。
数分後、Dataproc クラスタを使用できるようになります。Dataproc クラスタの作成に関する詳細をご覧ください。
JupyterLab を開く
まだ作成していない場合は、Dataproc クラスタと同じリージョンにマネージド ノートブック インスタンスを作成します。
Google Cloud コンソールで、[マネージド ノートブック] ページに移動します。
マネージド ノートブック インスタンス名の横にある [Open JupyterLab] をクリックします。
Dataproc クラスタでノートブック ファイルを実行する
同