Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Dataproc Hub ti consente di sfruttare
Vertex AI Workbench e Dataproc per eseguire
attività interattive di ML ed
elaborazione dei dati su larga scala utilizzando i blocchi note Jupyter e l'ecosistema Hadoop e Spark.
I notebook Dataproc Hub sono notebook per un singolo utente curati dall'amministratore ed eseguiti su un cluster Dataproc JupyterLab creato ed eseguito nel progetto dell'utente.
Dataproc Hub utilizza JupyterHub per:
Garantisci la coerenza in tutta l'organizzazione consentendo agli amministratori di
creare un elenco selezionato di modelli di blocco note per diversi gruppi
di utenti di dati e ML.
Accelera la creazione di notebook fornendo agli utenti di dati e ML ambienti preconfigurati che corrispondono ai loro requisiti software e hardware.
Dataproc Hub fornisce interfacce separate per amministratori e
utenti:
Gli amministratori utilizzano la pagina Dataproc→Workbench→Notebook gestiti dall'utente
nella console Google Cloud per creare istanze di Dataproc Hub. Ogni istanza hub contiene un insieme predefinito di ambienti notebook
definiti da file di configurazione del cluster YAML.
Gli utenti di dati e ML utilizzano l'interfaccia utente Notebooks→Istanze nella
consoleGoogle Cloud per selezionare un ambiente notebook predefinito per generare
un server notebook sul proprio cluster Dataproc.
Gli utenti senza accesso alla console possono accedere all'istanza Dataproc Hub per generare un cluster Dataproc dal browser web utilizzando un URL dell'istanza Dataproc Hub fornito dall'amministratore.
Casi d'uso di Dataproc Hub:
Gli utenti di dati e ML sono organizzati in gruppi con requisiti software e hardware comuni (gli utenti possono essere inseriti in più gruppi)
Accesso limitato alla console Dataproc: gli utenti non hanno accesso
a Dataproc nella console Google Cloud
Funzionalità di Dataproc Hub:
Ambienti utente predefiniti
Isolamento di cluster e blocchi note: i membri di un gruppo non hanno facile
accesso ai cluster e ai blocchi note dei membri di altri gruppi
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eDataproc Hub and Vertex AI Workbench user-managed notebooks are deprecated and will no longer be supported after January 30, 2025.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub allows administrators to create and manage curated notebook templates for different data and ML user groups within an organization.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub enables users to quickly create notebook servers on Dataproc clusters from pre-configured environments that match their specific software and hardware requirements.\u003c/p\u003e\n"],["\u003cp\u003eAdministrators can use the Google Cloud console to configure Dataproc Hub instances, while data and ML users can select and spawn notebook servers from predefined environments.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub offers benefits such as predefined user environments, cluster and notebook isolation between different groups of users, and can be used by teams with restricted access to the console.\u003c/p\u003e\n"]]],[],null,["| Dataproc Hub and\n| Vertex AI Workbench user-managed notebooks are\n| deprecated. On January 30, 2025, support for user-managed notebooks\n| will end and the ability to create user-managed notebooks instances\n| will be removed. For alternative notebook solutions\n| on Google Cloud, see:\n|\n| - [Install\n| the Jupyter component on your Dataproc cluster](/dataproc/docs/concepts/components/jupyter#install_jupyter).\n| - [Create\n| a Dataproc-enabled\n| Vertex AI Workbench instance](/vertex-ai/docs/workbench/instances/create-dataproc-enabled).\n\nThe Dataproc Hub lets you to take advantage of\nVertex AI Workbench and Dataproc to run\ninteractive ML and\ndata processing tasks at scale using Jupyter notebooks and the Hadoop and Spark\necosystem.\n\nDataproc Hub notebooks are administrator-curated,\nsingle-user notebooks running on a Dataproc JupyterLab cluster\ncreated and running in the user's project.\n\n- Dataproc Hub leverages JupyterHub to:\n\n - Bring consistency across the organization by enabling administrators to create a curated list of notebook templates for different groups of data and ML users.\n - Accelerate notebook creation by providing data and ML users with pre-configured environments that match their software and hardware requirements.\n- Dataproc Hub provides separate interfaces for administrators and\n users:\n\n - Administrators use the **Dataproc→Workbench→User-Managed Notebooks** page in the Google Cloud console to create Dataproc Hub instances. Each hub instance contains a predefined set of notebook environments defined by YAML cluster configuration files.\n - Data and ML users use the Notebooks→Instances UI in the Google Cloud console to select a predefined notebook environment to spawn a notebook server on their Dataproc cluster.\n - Users without console access can access the Dataproc Hub instance to spawn a Dataproc cluster from their web browser by using a Dataproc Hub instance URL provided by the administrator. If the organization does not define and implement separate notebook administrative and user roles, instead of using Dataproc Hub to configure and spawn a Jupyter notebook cluster, users can [install the Jupyter component on their cluster](/dataproc/docs/concepts/components/jupyter).\n- Dataproc Hub use cases:\n\n - Data and ML users are organized in groups with common software and hardware requirements (users can be placed in multiple groups)\n - Restricted Dataproc console access: Users do not have access to Dataproc in the Google Cloud console\n- Dataproc Hub features:\n\n - Predefined user environments\n - Cluster and notebook isolation: members of a group are not provided easy access to clusters and notebooks of members in other groups\n\nFor more information\n\n- Admins: [Configure Dataproc Hub](/dataproc/docs/tutorials/dataproc-hub-admins)\n- Users: [Use Dataproc Hub](/dataproc/docs/tutorials/dataproc-hub-users)"]]