Ray on Vertex AI を使用する前に、次の手順に沿って Google プロジェクトと Vertex AI SDK for Python を設定します。
プロジェクトと開発環境を設定するの手順に沿って、プロジェクトの課金情報を設定し、gcloud CLI をインストールして Vertex AI API を有効にします。
前提条件: オープンソースの Ray を使用してプログラムを開発する方法を理解している必要があります。
ここで使用する Ray on Vertex AI SDK for Python は、Ray Client、Ray BigQuery コネクタ、Vertex AI での Ray クラスタ管理、Vertex AI での予測の機能が含まれているバージョンの Vertex AI SDK for Python です。
Google Cloud コンソールで Ray on Vertex AI を使用する場合は、Ray クラスタを作成した後、Colab Enterprise ノートブックの指示に従って Vertex AI SDK for Python のインストール プロセスを完了します。
Vertex AI Workbench や他のインタラクティブな Python 環境で Ray on Vertex AI を使用する場合は、次のようにして Vertex AI SDK for Python をインストールします。
# The latest image in the Ray cluster includes Ray 2.33 # The latest supported Python version is Python 3.10. $ pip install google-cloud-aiplatform[ray]
SDK をインストールした後、カーネルを再起動してからパッケージをインポートします。
(省略可)BigQuery から読み取る場合は、新しい BigQuery データセットを作成するか、既存のデータセットを使用する必要があります。
(省略可)Vertex AI からのデータ漏洩のリスクを軽減するには、VPC Service Controls を有効にして、クラスタの作成時に VPC ネットワークを指定します。詳細については、Vertex AI を使用した VPC Service Controls をご覧ください。
VPC Service Controls を有効にすると、境界外のリソース(Cloud Storage バケット内のファイルなど)にアクセスできなくなります。
(省略可)カスタム コンテナ イメージを使用するには、Artifact Registry でホストします。カスタム イメージを使用すると、ビルド済みコンテナ イメージに含まれていない Python の依存関係を追加できます。カスタム イメージをビルドするには、Docker のドキュメントでソフトウェアのパッケージ化に関する説明をご覧ください。
(省略可)Vertex AI で Ray クラスタを作成するときに VPC ネットワークを指定する場合は、プロジェクトに自動モードの VPC ネットワークを 1 つ用意することをおすすめします。カスタムモードの VPC ネットワークを使用するか、複数の VPC ネットワークを使用して同じプロジェクト内にクラスタを作成すると、問題が発生することがあります。
クラスタを保護する
Ray ワークロードを保護するには、Ray のベスト プラクティスとガイドライン(信頼できるネットワークで信頼できるコードを実行するなど)に従ってください。お客様のクラウド インスタンスへの ray.io のデプロイは、共有責任モデルに分類されます。
Google Cloud のベスト プラクティスの詳細については、セキュリティに関する公開情報 GCP-2024-020 をご覧ください。
サポートされているロケーション
Ray on Vertex AI で使用可能なロケーションについては、カスタム モデル トレーニングの特徴の可用性の表をご覧ください。