Choisir un type de machine VM

Cette page décrit les considérations liées au choix du type de machine Google Compute Engine approprié pour votre instance de machine virtuelle (VM) Cloud Datalab.

Considérations liées au choix du type de machine d'une VM

Lorsque vous créez une instance de VM Datalab, vous pouvez spécifier un type de machine Google Compute Engine. Le type de machine par défaut utilisé est n1-standard-1. Vous pouvez sélectionner un autre type de machine en fonction des performances et des coûts recherchés pour répondre à vos besoins en analyse de données. Voici quelques-unes des principales considérations relatives au choix d'un type de machine :

  • Chaque bloc-notes utilise un noyau Python pour exécuter du code dans son propre processus. Par exemple, si vous ouvrez N blocs-notes, il y a au moins N processus correspondant à chacun d'eux.
  • Chaque noyau est à thread unique. L'utilisation de plusieurs cœurs n'apporte pas d'avantage significatif, sauf si vous exécutez plusieurs blocs-notes simultanément.
  • Pour en tirer pleinement parti, sélectionnez une machine avec davantage de mémoire en fonction de votre modèle d'utilisation et de la quantité de données traitées.
  • L'exécution est cumulative. L'exécution de trois cellules d'un notebook Cloud Datalab sur une ligne entraîne l'accumulation de l'état correspondant, y compris la mémoire allouée pour les structures de données utilisées dans ces cellules.
  • Le traitement de grandes quantités de données en mémoire (par exemple, à l'aide des objets Dataframe Pandas) entraîne une allocation de mémoire proportionnelle. Vous pouvez arrêter une session lorsque vous arrêtez d'exécuter un notebook. Pour ce faire, cliquez sur l'icône Sessions en cours d'exécution sessions-icon dans la barre supérieure (vous devrez peut-être redimensionner la fenêtre du navigateur pour voir l'icône) et fermez la session.
  • Cloud Datalab se sert d'un fichier d'échange sur disque pour fournir davantage de mémoire si nécessaire. Cependant, le fait de s'appuyer sur le fichier d'échange risque de ralentir le traitement. Il est préférable d'estimer les besoins en mémoire, puis de choisir un type de machine qui dispose au minimum de cette quantité de mémoire.

Choisir un type de machine

Vous choisissez un type de machine pour votre instance de VM Cloud Datalab lorsque vous créez l'instance. Pour en savoir plus, consultez la section sur datalab create --machine-type. Exemple :

datalab create --machine-type n1-highmem-2 instance-name