Vertex AI Workbench の概要
Vertex AI Workbench インスタンスは、データ サイエンス ワークフロー全体に対応する Jupyter ノートブック ベースの開発環境です。Vertex AI や他の Google Cloud サービスを Vertex AI Workbench インスタンスの Jupyter ノートブック内から操作できます。
Vertex AI Workbench のインテグレーションと機能を使用すると、データへのアクセス、データ処理の高速化、ノートブックの実行スケジュールの設定などが簡単に行えるようになります。
Vertex AI Workbench インスタンスは、JupyterLab で事前にパッケージ化され、ディープ ラーニング パッケージ一式(TensorFlow と PyTorch のフレームワークのサポートを含む)がプリインストールされています。CPU のみのインスタンスか GPU 対応のインスタンスを構成できます。
Vertex AI Workbench インスタンスは、GitHub リポジトリと同期する機能をサポートしています。
Vertex AI Workbench インスタンスは、 Google Cloud の認証と認可によって保護されています。
データへのアクセス
JupyterLab ユーザー インターフェースから離れることなくデータにアクセスできます。
Vertex AI Workbench インスタンスの JupyterLab のナビゲーション メニューでは、Cloud Storage インテグレーションを使用して、アクセス可能なデータやその他のファイルを参照できます。JupyterLab 内から Cloud Storage バケットとファイルにアクセスするをご覧ください。
また、BigQuery インテグレーションを使用して、アクセス権のあるテーブルの参照、クエリの書き込み、結果のプレビュー、ノートブックへのデータの読み込みを行うこともできます。JupyterLab 内から BigQuery テーブルのデータにクエリを実行するをご覧ください。
ノートブックを実行する
エグゼキュータを使用して、ノートブック ファイルを 1 回だけ実行することも、スケジュールに従って実行することもできます。実行する環境とハードウェアを選択します。ノートブックのコードは Vertex AI カスタム トレーニングで実行されます。これにより、分散トレーニングの実行、ハイパーパラメータの最適化、継続的なトレーニング ジョブのスケジュールを簡単に行うことができます。
実行の際にパラメータを使用すると、実行ごとに特定の変更を加えることができます。たとえば、使用する別のデータセットの指定、モデルの学習率の変更、モデルのバージョンの変更などを行うことができます。
また、ノートブックを定期的に実行するように設定することもできます。インスタンスがシャットダウンされている間も、Vertex AI Workbench はノートブック ファイルを実行して、結果を参照したり、他のユーザーと共有できるように保存します。ノートブックの実行スケジュールを設定するをご覧ください。
分析情報を共有する
ノートブックの実行結果は Cloud Storage バケットに保存されるため、結果へのアクセス権を付与することで分析情報を他のユーザーと共有できます。ノートブックの実行に関する前のセクションをご覧ください。
インスタンスを保護する
以降のセクションでは、Vertex AI Workbench インスタンスの保護に役立つサポート対象の機能について説明します。
VPC
Vertex AI Workbench インスタンスは、デフォルトの VPC ネットワークとサブネットを使用するデフォルトの Google が管理するネットワークを使用してデプロイできます。デフォルト ネットワークではなく、インスタンスで使用する VPC ネットワークも指定できます。
サービス境界内で Vertex AI Workbench を使用するには、サービス境界内で Vertex AI Workbench インスタンスを使用するをご覧ください。
顧客管理の暗号鍵(CMEK)
デフォルトでは、 Google Cloud は、Google が管理する暗号鍵を使用して、保存されているデータを自動的に暗号化します。データを保護する鍵に関連する具体的なコンプライアンス要件や規制要件がある場合は、Vertex AI Workbench インスタンスで顧客管理の暗号鍵(CMEK)を使用できます。詳細については、顧客管理の暗号鍵をご覧ください。
Confidential Computing
Confidential Computing を使用して、使用中のデータを暗号化できます。Confidential Computing を使用するには、Vertex AI Workbench インスタンスを作成するときに Confidential VM サービスを有効にします。使用を開始するには、Confidential Computing を使用してインスタンスを作成するをご覧ください。
アイドル状態のインスタンスの自動シャットダウン
デフォルトでは、Vertex AI Workbench インスタンスは、特定の期間アイドル状態になるとシャットダウンされます。この機能は費用管理に役立ちます。この時間は変更できます。また、この機能をオフにすることもできます。詳しくは、アイドル シャットダウンをご覧ください。
conda 環境を追加する
Vertex AI Workbench インスタンスは、conda 環境に基づいてカーネルを使用します。Vertex AI Workbench インスタンスに conda 環境を追加すると、その環境がインスタンスの JupyterLab インターフェースにカーネルとして表示されます。
conda 環境を追加すると、デフォルトの Vertex AI Workbench インスタンスでは使用できないカーネルを使用できます。たとえば、R と Apache Beam の conda 環境を追加できます。また、TensorFlow、PyTorch、Python など、利用可能なフレームワークの古いバージョン用の conda 環境を追加することもできます。
詳細については、conda 環境を追加するをご覧ください。
カスタム コンテナ
カスタム コンテナに基づいて Vertex AI Workbench インスタンスを作成できます。Google 提供のベースコンテナ イメージから始めて、ニーズに合わせて変更します。次に、カスタム コンテナに基づいてインスタンスを作成します。
詳細については、カスタム コンテナを使用してインスタンスを作成するをご覧ください。
Dataproc のインテグレーション
Dataproc クラスタでノートブックを実行すると、データを迅速に処理できます。クラスタを設定すると、JupyterLab ユーザー インターフェースを離れることなく、ノートブック ファイルをクラスタ上で実行できます。詳細については、Dataproc が有効になっているインスタンスを作成するをご覧ください。
VM リソースを予約する
Compute Engine の予約を使用して、Vertex AI Workbench インスタンスの実行に必要な仮想マシン(VM)リソースを確実に用意します。
予約は Compute Engine の機能です。予約を使用すると、必要なときに同じハードウェア(メモリと vCPU)とオプションのリソース(GPU とローカル SSD ディスク)を使用して VM を作成するためのリソースを確保できます。
詳細については、予約を使用するをご覧ください。
サードパーティの認証情報を使用してインスタンスを作成する
Workforce Identity 連携によって提供されるサードパーティの認証情報を使用して、Vertex AI Workbench インスタンスを作成して管理できます。Workforce Identity 連携は、外部 ID プロバイダ(IdP)を使用して、プロキシを介して Vertex AI Workbench インスタンスへのアクセス権をユーザー グループに付与します。
Vertex AI Workbench インスタンスへのアクセス権は、Vertex AI Workbench インスタンスのサービス アカウントに Workforce プールのプリンシパルを割り当てることで付与されます。
詳細については、サードパーティの認証情報を使用してインスタンスを作成するをご覧ください。
Vertex AI Workbench インスタンスのタグ
Vertex AI Workbench インスタンスの基盤となる VM は、Compute Engine VM です。Vertex AI Workbench インスタンスにリソースタグを追加して管理するには、Compute Engine VM を使用します。
Vertex AI Workbench インスタンスが作成されると、Vertex AI Workbench は Compute Engine リソースタグ vertex-workbench-instances:prod=READ_ONLY
をアタッチします。このリソースタグは内部目的でのみ使用されます。
Compute Engine インスタンスのタグの管理に関する詳細については、リソースのタグを管理するをご覧ください。
制限事項
プロジェクトを計画する際は、Vertex AI Workbench インスタンスの次の制限事項を考慮してください。
サードパーティの JupyterLab 拡張機能はサポートされていません。
Access Context Manager と Chrome Enterprise Premium を使用して、コンテキストアウェア アクセス制御で Vertex AI Workbench インスタンスを保護する場合は、ユーザーがインスタンスに対して認証されるたびにアクセス権が評価されます。たとえば、アクセス権はユーザーが JupyterLab に初めてアクセスしたときに評価され、さらにウェブブラウザの Cookie が期限切れになった場合は、ユーザーがアクセスするたびに評価されます。
Google 提供のベースコンテナ(
gcr.io/deeplearning-platform-release/workbench-container:latest
)から派生していないカスタム コンテナの使用は、Google のサービスとの互換性の問題が発生するリスクを高めるため、サポートされていません。代わりに、ベースコンテナを変更してニーズに合ったカスタム コンテナを作成し、カスタム コンテナを使用してインスタンスを作成します。Vertex AI Workbench インスタンスは、
cloud-notebooks-managed
プロジェクトのイメージを想定しています。イメージ名のリストは、 Google Cloud コンソールの作成ページで確認できます。Vertex AI Workbench インスタンスでカスタム仮想マシン(VM)イメージまたは Deep Learning VM イメージを使用できますが、Vertex AI Workbench は、これらのイメージの使用時に発生する予期しない動作や誤動作についてサポートを提供しません。ユーザー管理ノートブック イメージまたはマネージド ノートブック イメージを使用して Vertex AI Workbench インスタンスを作成することはできません。
Google Cloud コンソールまたは Compute Engine API を使用して、Vertex AI Workbench インスタンスの基盤となる VM を編集することはできません。Vertex AI Workbench インスタンスの基盤となる VM を編集するには、Notebooks API の
projects.locations.instances.patch
メソッドまたは Google Cloud SDK のgcloud workbench instances update
コマンドを使用します。VPC Service Controls を使用するインスタンスでは、エグゼキュータの使用はサポートされていません。
Vertex AI Workbench インスタンスでアクセラレータを使用するには、必要なアクセラレータ タイプをインスタンスのゾーンで使用できるようにする必要があります。各ゾーンでのアクセラレータの可用性については、GPU のリージョンとゾーンの可用性をご覧ください。