Cette page décrit le cycle de vie d'une instance Cloud Datalab, ainsi que les options disponibles pour gérer et conserver les ressources de calcul.
Cloud Datalab s'exécute dans une VM Google Compute Engine avec un disque persistant associé permettant de stocker des notebooks. Les VM Cloud Datalab sont connectées à un réseau spécial dans un projet appelé datalab-network.
. La configuration par défaut de ce réseau limite les connexions entrantes aux connexions SSH.
Prerequisites
Pour exécuter les commandes décrites ci-dessous, vous devez avoir effectué les opérations suivantes :
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
-
Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier si la facturation est activée sur un projet.
-
Activer les API Google Compute Engine and Cloud Source Repositories .
- Installez Google Cloud CLI.
-
Pour initialiser gcloudCLI, exécutez la commande suivante :
gcloud init
-
Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
-
Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier si la facturation est activée sur un projet.
-
Activer les API Google Compute Engine and Cloud Source Repositories .
- Installez Google Cloud CLI.
-
Pour initialiser gcloudCLI, exécutez la commande suivante :
gcloud init
Créer une instance
Pour créer une instance Cloud Datalab, exécutez la commande datalab create.
datalab create instance-name
Plusieurs options de ligne de commande sont disponibles avec cette commande. Par exemple, si vous souhaitez créer une instance avec davantage de mémoire que la mémoire par défaut, vous pouvez transmettre l'option --machine-type
:
datalab create --machine-type n1-highmem-2 instance-name
Pour répertorier toutes les options disponibles, exécutez la commande suivante :
datalab create --help
Par défaut, la commande datalab create
vous connecte à la nouvelle instance.
Pour créer l'instance sans vous y connecter, transmettez l'option --no-connect
:
datalab create --no-connect instance-name
La commande datalab create
crée également les ressources Google Cloud Platform suivantes (si elles ne sont pas déjà disponibles) :
- Le réseau
datalab-network
- Une règle de pare-feu sur
datalab-network
autorisant les connexions SSH entrantes - Le dépôt Google Cloud Source Repositories
datalab-notebooks
- Le disque persistant permettant de stocker les notebooks Cloud Datalab
Notez que vous devez disposer d'une autorisation de propriétaire pour effectuer certaines des étapes ci-dessus (consultez Utiliser Cloud Datalab au sein d'une équipe).
Se connecter à une instance
L'outil datalab
peut créer un tunnel SSH persistant vers votre instance Cloud Datalab. Vous pouvez ainsi vous connecter à l'instance depuis votre navigateur local comme si Cloud Datalab était exécuté sur votre machine locale.
Pour créer cette connexion, exécutez la commande datalab connect :
datalab connect instance-name
La commande datalab connect
redémarre votre instance si elle n'est pas en cours d'exécution. La commande continue de s'exécuter jusqu'à ce que vous l'arrêtiez (la connexion reste disponible tant que la commande est en cours d'exécution).
Par défaut, le port local 8081
est utilisé pour la connexion. Pour changer de port, transmettez l'option --port
. Par exemple, exécutez la commande suivante pour utiliser le port local 8082
:
datalab connect --port 8082 instance-name
Arrêter une instance
Exécutez la commande suivante pour arrêter votre instance Cloud Datalab, afin d'éviter que des coûts inutiles ne soient facturés lorsque vous souhaitez suspendre l'utilisation de Cloud Datalab.
datalab stop instance-name
Lorsque vous êtes prêt à utiliser à nouveau Cloud Datalab, exécutez la commande datalab connect
pour redémarrer l'instance.
Mettre à jour la VM Cloud Datalab sans supprimer le disque des notebooks
Pour effectuer la mise à jour vers une nouvelle version Cloud Datalab ou modifier les propriétés de la VM (par exemple, le type de machine ou le compte de service), vous pouvez supprimer, puis recréer la VM Cloud Datalab sans perdre vos blocs-notes stockés sur le disque persistant.
datalab delete --keep-disk instance-name
datalab create instance-name
Supprimer une instance et le disque des blocs-notes
Par défaut, la commande datalab delete ne supprime pas le disque persistant qui contient vos blocs-notes. Vous pouvez ainsi modifier facilement la VM sans perdre accidentellement vos données (consultez Supprimer et recréer une instance sans supprimer le disque des notebooks).
Si vous souhaitez supprimer à la fois la VM et le disque persistant associé, ajoutez l'option --delete-disk
à la commande :
datalab delete --delete-disk instance-name
Réduire l'utilisation des ressources de calcul
Les VM Google Compute Engine entraînent des frais. La durée d'exécution d'une instance Cloud Datalab est facturée, que vous l'utilisiez ou non. Vous pouvez réduire les frais de la VM Cloud Datalab en arrêtant l'instance lorsque vous ne l'utilisez pas. Les ressources associées à la VM (comme le disque persistant et l'adresse IP externe) sont toujours facturées, mais l'instance de VM elle-même ne l'est pas tant qu'elle est arrêtée.
Lorsque vous devez de nouveau utiliser votre instance arrêtée, exécutez datalab connect instance-name
pour vous connecter à votre instance. L'outil datalab
redémarrera l'instance avant de tenter de s'y connecter.
Pour arrêter la facturation de tous les frais associés à une instance Cloud Datalab, vous devez supprimer la VM et le disque persistant associé en exécutant la commande datalab delete avec l'option --delete-disk
.