VM-Maschinentyp auswählen

Auf dieser Seite werden Überlegungen zur Auswahl des richtigen Google Compute Engine-Maschinentyps für die Cloud Datalab-VM-Instanz beschrieben.

Überlegungen bei der Auswahl eines VM-Maschinentyps

Beim Erstellen einer Datalab-VM-Instanz können Sie einen Google Compute Engine-Maschinentyp angeben. Der Standardmaschinentyp ist n1-standard-1. Sie können einen anderen Maschinentyp basierend auf Leistungs- und Kosteneigenschaften auswählen, der Ihren Anforderungen an die Datenanalyse entspricht. Dies sind einige wichtige Überlegungen bei der Auswahl eines Maschinentyps:

  • Jedes Notebook verwendet einen Python-Kernel zur Ausführung von Code in einem eigenen Prozess. Beispiel: Wenn n Notebooks geöffnet sind, sind mindestens n Prozesse für diese Notebooks vorhanden.
  • Jeder Kernel ist single-threaded. Mehrere Prozessorkerne sind nur sinnvoll, wenn Sie mehrere Notebooks gleichzeitig ausführen.
  • Die Auswahl einer Maschine mit zusätzlichem Arbeitsspeicher kann je nach Nutzungsmuster und Menge der verarbeiteten Daten von Vorteil sein.
  • Die Ausführung ist kumulativ. Wenn Sie drei Cloud Datalab-Notebookzellen nacheinander ausführen, wird der entsprechende Status akkumuliert, auch für den Arbeitsspeicher, der für die Datenstrukturen in diesen Zellen zugeordnet ist.
  • Bei der Verarbeitung großer Datenmengen im Arbeitsspeicher (beispielsweise bei Verwendung von Pandas DataFrames) wird der Speicher proportional zugeordnet. Nachdem Sie die Ausführung eines Notebooks abgeschlossen haben, können Sie die Sitzung anhalten. Klicken Sie dazu in der oberen Leiste auf das Symbol "Laufende Sitzungen" sessions-icon und beenden Sie die Sitzung. Um das Symbol sehen zu können, müssen Sie gegebenenfalls die Größe des Browserfensters ändern.
  • Cloud Datalab nutzt eine laufwerkbasierte Auslagerungsdatei als Overhead für zusätzliche Arbeitsspeicheranforderungen. Diese Auslagerungsdatei wird jedoch wahrscheinlich die Verarbeitung verlangsamen. Am besten schätzen Sie die Arbeitsspeicheranforderungen und wählen dann einen Maschinentyp aus, der mindestens diese Menge an Arbeitsspeicher hat.

Maschinentyp auswählen

Der Maschinentyp für eine Cloud Datalab-VM-Instanz wird beim Erstellen der Instanz ausgewählt. Weitere Informationen finden Sie unter datalab create --machine-type. Beispiel:

datalab create --machine-type n1-highmem-2 instance-name