マネージド ノートブックの概要
Vertex AI Workbench マネージド ノートブック インスタンスは Google Cloud が管理する環境で、Jupyter ノートブック ベースの本番環境全体に対する設定と作業に役立つ統合機能を備えています。
マネージド ノートブック インスタンスは JupyterLab で事前にパッケージ化されています。また、ディープ ラーニング パッケージ スイート(TensorFlow および PyTorch フレームワークのサポートなど)がプリインストールされています。マネージド ノートブック インスタンスは GPU アクセラレータをサポートしており、GitHub リポジトリと同期できます。マネージド ノートブック インスタンスは Google Cloud の認証と認可によって保護されています。
Google が管理するコンピューティング インフラストラクチャ
Vertex AI Workbench マネージド ノートブック インスタンスは、Google が管理する Jupyter ノートブック ベースのコンピューティング インフラストラクチャです。
マネージド ノートブック インスタンスを作成すると、そのインスタンスは Google が管理する仮想マシン(VM)インスタンスとしてテナント プロジェクトにデプロイされます。
マネージド ノートブック インスタンスには、TensorFlow や PyTorch など、一般的な多くのデータ サイエンス フレームワーク環境が含まれています。独自のカスタム コンテナ イメージをマネージド ノートブック インスタンスに追加することもできます。これらの環境は、ノートブック ファイルを実行するカーネルとして利用できます。
カーネルの 1 つでノートブックを実行すると、Vertex AI Workbench は対応するコンテナを起動して Jupyter セッションを作成し、その Jupyter セッションを使用してコンテナでノートブックを実行します。
この Google 管理のコンピューティング インフラストラクチャには、データ サイエンスと機械学習ワークフローを最初から最後まで実装する際に役立つ統合機能が含まれています。詳しくは、以降のセクションをご覧ください。
カスタム コンテナを使用する
マネージド ノートブック インスタンスにカスタム Docker コンテナ イメージを追加すると、ニーズに合わせてカスタマイズされた環境でノートブック コードを実行できます。
これらのカスタム コンテナは、プリインストールされたフレームワークとともに、JupyterLab ユーザー インターフェースから直接利用できます。詳細については、マネージド ノートブック インスタンスにカスタム コンテナを追加するをご覧ください。
ノートブック ベースのワークフロー
マネージド ノートブック インスタンスを使用すると、JupyterLab ユーザー インターフェースから離れることなく、ワークフロー指向のタスクを実行できます。
JupyterLab からハードウェアとフレームワークを制御する
マネージド ノートブック インスタンスでは、コードを実行するコンピューティング リソースを JupyterLab のユーザー インターフェースで指定できます。たとえば、必要な vCPU または GPU の数、必要な RAM の量、コードを実行するフレームワークを構成できます。最初にコードを記述して、JupyterLab から離れることやインスタンスを再起動することなく、コードの実行方法を選択できます。コードをすばやくテストするには、ハードウェアをスケールダウンしてからスケールアウトし、より多くのデータでコードを実行します。
データへのアクセス
JupyterLab ユーザー インターフェースから離れることなくデータにアクセスできます。
マネージド ノートブック インスタンスの JupyterLab のナビゲーション メニューから、Cloud Storage インテグレーションを使用して、アクセス可能なデータやその他のファイルを参照できます。JupyterLab 内から Cloud Storage バケットとファイルにアクセスするをご覧ください。
また、BigQuery インテグレーションを使用して、アクセス権のあるテーブルの参照、クエリの書き込み、結果のプレビュー、ノートブックへのデータの読み込みを行うこともできます。JupyterLab 内から BigQuery テーブルのデータにクエリを実行するをご覧ください。
ノートブックを実行する
エグゼキュータを使用して、ノートブック ファイルを 1 回だけ実行することも、スケジュールに従って実行することもできます。実行する環境とハードウェアを選択します。ノートブックのコードは Vertex AI カスタム トレーニングで実行されます。これにより、分散トレーニングの実行、ハイパーパラメータの最適化、継続的なトレーニング ジョブのスケジュールを簡単に行うことができます。エグゼキュータでノートブック ファイルを実行するをご覧ください。
実行でパラメータを使用すると、実行ごとに特定の変更を加えることができます。たとえば、使用する別のデータセットの指定、モデルの学習率の変更、モデルのバージョンの変更などを行うことができます。
また、定期的なスケジュールで実行するノートブックを設定できます。インスタンスがシャットダウンされている間も、Vertex AI Workbench はノートブック ファイルを実行して結果を保存し、他のユーザーが参照して共有できるようにします。
分析情報を共有する
ノートブックの実行結果は Cloud Storage バケットに保存されるため、結果へのアクセス権を付与することで分析情報を他のユーザーと共有できます。ノートブックの実行に関する前のセクションをご覧ください。
インスタンスを保護する
マネージド ノートブック インスタンスは、デフォルトの VPC ネットワークとサブネットを使用するデフォルトの Google マネージド ネットワーク内にデプロイできます。デフォルト ネットワークの代わりに、インスタンスで使用する VPC ネットワークを指定できます。詳細については、ネットワークの設定をご覧ください。VPC Service Controls を使用すると、マネージド ノートブック インスタンスのセキュリティを強化できます。
サービス境界内でマネージド ノートブックを使用する場合は、サービス境界内でマネージド ノートブック インスタンスを使用するをご覧ください。
Google Cloud では、デフォルトで、Google が管理する暗号鍵を使用して、自動的に保存されているデータを暗号化します。データを保護する鍵に関連する具体的なコンプライアンス要件や規制要件がある場合は、顧客管理の暗号鍵(CMEK)をマネージド ノートブック インスタンスに使用できます。詳細については、顧客管理の暗号鍵をご覧ください。
アイドル状態のインスタンスの自動シャットダウン
コストを管理しやすくするため、デフォルトでは、マネージド ノートブック インスタンスはアイドル状態が一定期間続くとシャットダウンします。この時間は変更できます。また、この機能をオフにすることもできます。詳しくは、アイドル シャットダウンをご覧ください。
Dataproc のインテグレーション
Dataproc クラスタでノートブックを実行すると、データを迅速に処理できます。クラスタを設定すると、JupyterLab ユーザー インターフェースを離れることなく、ノートブック ファイルをクラスタ上で実行できます。詳細については、Dataproc クラスタでマネージド ノートブック インスタンスを実行するをご覧ください。
制限事項
プロジェクトを計画する際は、マネージド ノートブックの次の制限事項を考慮してください。
マネージド ノートブック インスタンスは Google が管理するため、Vertex AI Workbench ユーザー管理ノートブック インスタンスよりもカスタマイズ性が低くなります。ユーザー管理のノートブック インスタンスは、環境をきめ細かく制御する必要があるユーザーに最適です。詳細については、ユーザー管理のノートブックの概要をご覧ください。
サードパーティの JupyterLab 拡張機能はサポートされていません。
マネージド ノートブック インスタンスでは、ユーザーは
sudo
アクセスを使用できません。Access Context Manager と BeyondCorp Enterprise を使用して、コンテキストアウェア アクセス制御でマネージド ノートブック インスタンスを保護する場合は、ユーザーがインスタンスに対して認証されるたびにアクセスが評価されます。たとえば、アクセス権はユーザーが JupyterLab に初めてアクセスしたときに評価され、さらにウェブブラウザの Cookie が期限切れになった場合は、ユーザーがアクセスするたびに評価されます。
マネージド ノートブック インスタンスでアクセラレータを使用するには、使用するアクセラレータ タイプがインスタンスのゾーンで使用可能である必要があります。各ゾーンでのアクセラレータの可用性については、GPU のリージョンとゾーンの可用性をご覧ください。