Vertex AI Workbench インスタンスの概要
Vertex AI Workbench インスタンスは、データ サイエンス ワークフロー全体に対応する Jupyter ノートブック ベースの開発環境です。Vertex AI や他の Google Cloud サービスを Vertex AI Workbench インスタンスの Jupyter ノートブック内から操作できます。
Vertex AI Workbench のインテグレーションと機能を使用すると、データへのアクセス、データ処理の高速化、ノートブックの実行スケジュールの設定などが簡単に行えるようになります。
Vertex AI Workbench インスタンスは、JupyterLab で事前にパッケージ化され、ディープ ラーニング パッケージ一式(TensorFlow と PyTorch のフレームワークのサポートを含む)がプリインストールされています。CPU 専用インスタンスまたは GPU 対応インスタンスを構成できます。
Vertex AI Workbench インスタンスは、GitHub リポジトリと同期する機能をサポートしています。また、同インスタンスは、Google Cloud の認証と認可によって保護されています。
データへのアクセス
JupyterLab ユーザー インターフェースから離れることなくデータにアクセスできます。
Vertex AI Workbench インスタンスの JupyterLab のナビゲーション メニューでは、Cloud Storage インテグレーションを使用して、アクセス可能なデータやその他のファイルを参照できます。JupyterLab 内から Cloud Storage バケットとファイルにアクセスするをご覧ください。
また、BigQuery インテグレーションを使用して、アクセス権のあるテーブルの参照、クエリの書き込み、結果のプレビュー、ノートブックへのデータの読み込みを行うこともできます。JupyterLab 内から BigQuery テーブルのデータにクエリを実行するをご覧ください。
ノートブックを実行する
エグゼキュータを使用して、ノートブック ファイルを 1 回だけ実行することも、スケジュールに従って実行することもできます。実行する環境とハードウェアを選択します。ノートブックのコードは Vertex AI カスタム トレーニングで実行されます。これにより、分散トレーニングの実行、ハイパーパラメータの最適化、継続的なトレーニング ジョブのスケジュールを簡単に行うことができます。
実行の際にパラメータを使用すると、実行ごとに特定の変更を加えることができます。たとえば、使用する別のデータセットの指定、モデルの学習率の変更、モデルのバージョンの変更などを行うことができます。
また、ノートブックを定期的に実行するように設定することもできます。インスタンスがシャットダウンされている間も、Vertex AI Workbench はノートブック ファイルを実行して結果を保存し、他のユーザーが参照して共有できるようにします。
分析情報を共有する
ノートブックの実行結果は Cloud Storage バケットに保存されるため、結果へのアクセス権を付与することで分析情報を他のユーザーと共有できます。ノートブックの実行に関する前のセクションをご覧ください。
インスタンスを保護する
Vertex AI Workbench インスタンスは、デフォルトの VPC ネットワークとサブネットを使用するデフォルトの Google が管理するネットワークを使用してデプロイできます。デフォルト ネットワークではなく、インスタンスで使用する VPC ネットワークも指定できます。
Google Cloud では、デフォルトで、Google が管理する暗号鍵を使用して、自動的に保存されているデータを暗号化します。データを保護する鍵に関連する具体的なコンプライアンス要件や規制要件がある場合は、Vertex AI Workbench インスタンスで顧客管理の暗号鍵(CMEK)を使用できます。詳細については、顧客管理の暗号鍵をご覧ください。
アイドル状態のインスタンスの自動シャットダウン
費用を管理するため、Vertex AI Workbench インスタンスは、デフォルトで一定時間アイドル状態になるとシャットダウンします。この時間は変更できます。また、この機能をオフにすることもできます。詳しくは、アイドル シャットダウンをご覧ください。
conda 環境を追加する
Vertex AI Workbench インスタンスは、conda 環境に基づいてカーネルを使用します。Vertex AI Workbench インスタンスに conda 環境を追加すると、その環境がインスタンスの JupyterLab インターフェースにカーネルとして表示されます。
conda 環境を追加すると、デフォルトの Vertex AI Workbench インスタンスでは使用できないカーネルを使用できます。たとえば、R と Apache Beam の conda 環境を追加できます。また、TensorFlow、PyTorch、Python など、利用可能なフレームワークの古いバージョン用の conda 環境を追加することもできます。
詳細については、conda 環境を追加するをご覧ください。
Dataproc のインテグレーション
Dataproc クラスタでノートブックを実行すると、データを迅速に処理できます。クラスタを設定すると、JupyterLab ユーザー インターフェースを離れることなく、ノートブック ファイルをクラスタ上で実行できます。詳細については、Dataproc が有効になっているインスタンスを作成するをご覧ください。
制限事項
プロジェクトを計画する際は、Vertex AI Workbench インスタンスの次の制限事項を考慮してください。
サードパーティの JupyterLab 拡張機能はサポートされていません。
Access Context Manager と BeyondCorp Enterprise を使用して、コンテキストアウェア アクセス制御で Vertex AI Workbench インスタンスを保護する場合は、ユーザーがインスタンスに対して認証されるたびにアクセスが評価されます。たとえば、アクセス権はユーザーが JupyterLab に初めてアクセスしたときに評価され、さらにウェブブラウザの Cookie が期限切れになった場合は、ユーザーがアクセスするたびに評価されます。
Vertex AI Workbench インスタンスでのカスタム コンテナの使用はサポートされていません。代わりに、インスタンスに conda 環境を追加してください。
Vertex AI Workbench インスタンスでカスタム仮想マシン(VM)イメージまたはカスタム Deep Learning VM を使用できますが、Vertex AI Workbench は、カスタム イメージでの予期しない動作や誤動作についてサポートを提供しません。
ユーザー管理ノートブック イメージまたはマネージド ノートブック イメージを使用して Vertex AI Workbench インスタンスを作成することはできません。
Google Cloud コンソールまたは Compute Engine API を使用して、Vertex AI Workbench インスタンスの基盤となる VM を編集することはできません。Vertex AI Workbench インスタンスの基盤となる VM を編集するには、Notebooks API の
projects.locations.instances.patch
メソッドまたは Google Cloud SDK のgcloud workbench instances update
コマンドを使用します。VPC Service Controls を使用するインスタンスでは、エグゼキュータの使用はサポートされていません。
Vertex AI Workbench インスタンスのネットワーク タグの変更はサポートされていません。
Vertex AI Workbench インスタンスでアクセラレータを使用するには、必要なアクセラレータ タイプをインスタンスのゾーンで使用できるようにする必要があります。各ゾーンでのアクセラレータの可用性については、GPU のリージョンとゾーンの可用性をご覧ください。