Créer un cluster Ray sur Vertex AI

Vous pouvez créer un cluster Ray sur Vertex AI à l'aide de la console ou du SDK Vertex AI pour Python.

Avant de commencer, veillez à lire la Présentation de Ray sur Vertex AI et à configurer tous les outils prérequis.

Console

  1. Dans la console Google Cloud, accédez à la page Ray sur Vertex AI.

    Accéder à la page Ray sur Vertex AI

  2. Cliquez sur Créer un cluster pour ouvrir le panneau Créer un cluster.

  3. Pour chaque étape du panneau Créer un cluster, vérifiez ou remplacez les informations du cluster par défaut. Cliquez sur Continuer à chaque étape :

    1. Dans le champ Nom et région, spécifiez un Nom et choisissez une Région pour votre cluster.

    2. Pour les paramètres de calcul, spécifiez la configuration du cluster Ray sur le nœud principal de Vertex AI, y compris le type de machine, le type et le nombre d'accélérateurs, le type et la taille du disque et le nombre d'instances répliquées. Sous Options avancées, vous pouvez spécifier la clé de chiffrement.

    3. Pour le champ Mise en réseau, spécifiez le réseau d'appairage de VPC que vous souhaitez utiliser avec Ray sur Vertex AI.

      Si vous n'avez pas encore configuré la connexion d'accès aux services privés pour votre réseau VPC, cliquez sur Configurer la connexion. Dans le panneau Créer une connexion d'accès aux services privés, cliquez sur Continuer pour effectuer chacune des étapes suivantes :

      1. Activez l'API Service Networking.

      2. Pour Allouer une plage d'adresses IP, vous pouvez sélectionner, créer ou autoriser Google à allouer automatiquement une plage d'adresses IP.

      3. Dans la section Créer une connexion, consultez les informations Réseau et Plage d'adresses IP allouée.

      4. Cliquez sur Créer une connexion.

  4. Cliquez sur Créer.

SDK Ray sur Vertex AI

Dans un environnement Python interactif au sein du réseau VPC, utilisez les éléments suivants pour créer le cluster Ray sur Vertex AI :

import ray
import vertex_ray
from google.cloud import aiplatform
from vertex_ray import Resources

# Define a default CPU cluster, machine_type is n1-standard-8, 1 head node and 1 worker node
head_node_type = Resources()
worker_node_types = [Resources()]

# Or define a GPU cluster.
head_node_type = Resources(
  machine_type="n1-standard-8",
  node_count=1,
)

worker_node_types = [Resources(
  machine_type="n1-standard-8",
  node_count=2,  # Can be > 1
  accelerator_type="NVIDIA_TESLA_K80",
  accelerator_count=1,
)]

aiplatform.init()
# Initialize Vertex AI to retrieve projects for downstream operations.
# Create the Ray cluster on Vertex AI
CLUSTER_RESOURCE_NAME = vertex_ray.create_ray_cluster(
  head_node_type=head_node_type,
  network=NETWORK,
  worker_node_types=worker_node_types,
  python_version="3.10",  # Optional
  ray_version="2.9",  # Optional
  cluster_name = CLUSTER_NAME
)

Où :

  • CLUSTER_NAME : nom du cluster Ray sur Vertex AI qui doit être unique dans votre projet.

  • NETWORK est le nom complet de votre réseau VPC appairé, au format projects/PROJECT_NUMBER/global/networks/VPC_NAME.

  • PROJECT_NUMBER est le numéro de votre projet Google Cloud.

Le résultat suivant doit s'afficher jusqu'à ce que l'état passe à RUNNING :

[Ray on Vertex AI]: Cluster State = State.PROVISIONING
Waiting for cluster provisioning; attempt 1; sleeping for 0:02:30 seconds
...
[Ray on Vertex AI]: Cluster State = State.RUNNING

Veuillez noter les points suivants :

  • Le premier nœud est utilisé comme nœud principal.

  • Les types de machines TPU ne sont pas compatibles.

Étapes suivantes