Panoramica di Dataproc Hub

Dataproc Hub ti permette di sfruttare AI Platform Notebooks e Dataproc per eseguire attività interattive di ML ed elaborazione di dati su larga scala utilizzando i blocchi note Jupyter e l'ecosistema Hadoop e Spark.

  • Dataproc Hub utilizza JupyterHub per:

    • Migliora la coerenza all'interno dell'organizzazione consentendo agli amministratori di creare un elenco selezionato di modelli di blocco note per diversi gruppi di dati e utenti ML.
    • Accelera la creazione dei blocchi note fornendo agli utenti il machine learning e dati con ambienti preconfigurati che corrispondono ai loro requisiti software e hardware.
  • Dataproc Hub fornisce interfacce separate per amministratori e utenti:

    • Gli amministratori utilizzano la pagina Dataproc→Workbench→User-Managed Notebooks nella console Google Cloud per creare istanze Dataproc Hub. Ogni istanza hub contiene un insieme predefinito di ambienti di blocco note definiti dai file di configurazione del cluster YAML.
    • Gli utenti di dati e ML utilizzano la UI Notebooks→Instances in Google Cloud Console per selezionare un ambiente di blocco note predefinito per generare un server di blocchi note sul loro cluster Dataproc.
      • Gli utenti senza accesso alla console possono accedere all'istanza di Dataproc Hub per generare un cluster Dataproc dal browser web utilizzando un URL dell'istanza di Dataproc Hub fornito dall'amministratore.
  • Casi d'uso di Dataproc Hub:

    • Gli utenti di dati e ML sono organizzati in gruppi con requisiti software e hardware comuni (gli utenti possono essere inseriti in più gruppi)
    • Accesso limitato alla console Dataproc: gli utenti non hanno accesso a Dataproc nella console Google Cloud
  • Funzionalità di Dataproc Hub:

    • Ambienti utente predefiniti
    • Isolamento del cluster e del blocco note: ai membri di un gruppo non viene fornito un facile accesso ai cluster e ai blocchi note dei membri di altri gruppi

Per ulteriori informazioni