Gérer le cycle de vie d'une instance Cloud Datalab

Cette page décrit le cycle de vie d'une instance Cloud Datalab, ainsi que les options disponibles pour gérer et conserver les ressources de calcul.

Cloud Datalab s'exécute dans une VM Google Compute Engine avec un disque persistant associé permettant de stocker des notebooks. Les VM Cloud Datalab sont connectées à un réseau spécial dans un projet appelé datalab-network.. La configuration par défaut de ce réseau limite les connexions entrantes aux connexions SSH.

Prérequis

Pour exécuter les commandes décrites ci-dessous, vous devez avoir effectué les opérations suivantes :

  1. Vous devez avoir installé le SDK Cloud, y compris le composant datalab
  2. Vous devez vous être authentifié avec l'outil de ligne de commande gcloud
  3. Vous devez avoir configuré l'outil de ligne de commande gcloud pour utiliser le projet et la zone sélectionnés

Créer une instance

Pour créer une instance Cloud Datalab, exécutez la commande datalab create.

datalab create instance-name

Plusieurs options de ligne de commande sont disponibles avec cette commande. Par exemple, si vous souhaitez créer une instance avec davantage de mémoire que la mémoire par défaut, vous pouvez transmettre l'option --machine-type :

datalab create --machine-type n1-highmem-2 instance-name

Pour répertorier toutes les options disponibles, exécutez la commande suivante :

datalab create --help

Par défaut, la commande datalab create vous connecte à la nouvelle instance. Pour créer l'instance sans vous y connecter, transmettez l'option --no-connect :

datalab create --no-connect instance-name

La commande datalab create crée également les ressources Google Cloud Platform suivantes (si elles ne sont pas déjà disponibles) :

  • Le réseau datalab-network
  • Une règle de pare-feu sur datalab-network autorisant les connexions SSH entrantes
  • Le dépôt Google Cloud Source Repositories datalab-notebooks
  • Le disque persistant permettant de stocker les notebooks Cloud Datalab

Notez que vous devez disposer d'une autorisation de propriétaire pour effectuer certaines des étapes ci-dessus (consultez Utiliser Cloud Datalab au sein d'une équipe).

Se connecter à une instance

L'outil datalab peut créer un tunnel SSH persistant vers votre instance Cloud Datalab. Vous pouvez ainsi vous connecter à l'instance depuis votre navigateur local comme si Cloud Datalab était exécuté sur votre machine locale.

Pour créer cette connexion, exécutez la commande datalab connect :

datalab connect instance-name

La commande datalab connect redémarre votre instance si elle n'est pas en cours d'exécution. La commande continue de s'exécuter jusqu'à ce que vous l'arrêtiez (la connexion reste disponible tant que la commande est en cours d'exécution).

Par défaut, le port local 8081 est utilisé pour la connexion. Pour changer de port, transmettez l'option --port. Par exemple, exécutez la commande suivante pour utiliser le port local 8082 :

datalab connect --port 8082 instance-name

Arrêter une instance

Exécutez la commande suivante pour arrêter votre instance Cloud Datalab, afin d'éviter que des coûts inutiles ne soient facturés lorsque vous souhaitez suspendre l'utilisation de Cloud Datalab.

datalab stop instance-name

Lorsque vous êtes prêt à utiliser à nouveau Cloud Datalab, exécutez la commande datalab connect pour redémarrer l'instance.

Mettre à jour la VM Cloud Datalab sans supprimer le disque des notebooks

Pour effectuer la mise à jour vers une nouvelle version Cloud Datalab ou modifier les propriétés de la VM (par exemple, le type de machine ou le compte de service), vous pouvez supprimer, puis recréer la VM Cloud Datalab sans perdre vos notebooks stockés sur le disque persistant.

datalab delete --keep-disk instance-name
datalab create instance-name

Supprimer une instance et le disque des notebooks

Par défaut, la commande datalab delete ne supprime pas le disque persistant qui contient vos notebooks. Vous pouvez ainsi modifier facilement la VM sans perdre accidentellement vos données (consultez Supprimer et recréer une instance sans supprimer le disque des notebooks).

Si vous souhaitez supprimer à la fois la VM et le disque persistant associé, ajoutez l'option --delete-disk à la commande :

datalab delete --delete-disk instance-name

Réduire l'utilisation des ressources de calcul

Les VM Google Compute Engine entraînent des frais. La durée d'exécution d'une instance Cloud Datalab est facturée, que vous l'utilisiez ou non. Vous pouvez réduire les frais de la VM Cloud Datalab en arrêtant l'instance lorsque vous ne l'utilisez pas. Les ressources associées à la VM (comme le disque persistant et l'adresse IP externe) sont toujours facturées, mais l'instance de VM elle-même ne l'est pas tant qu'elle est arrêtée.

Lorsque vous devez de nouveau utiliser votre instance arrêtée, exécutez datalab connect instance-name pour vous connecter à votre instance. L'outil datalab redémarrera l'instance avant de tenter de s'y connecter.

Pour arrêter la facturation de tous les frais associés à une instance Cloud Datalab, vous devez supprimer la VM et le disque persistant associé en exécutant la commande datalab delete avec l'option --delete-disk.