Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Dataproc Hub vous permet de tirer parti de Vertex AI Workbench et de Dataproc pour exécuter des tâches de ML et de traitement de données interactives à grande échelle à l'aide de notebooks Jupyter et de l'écosystème Hadoop et Spark.
Les notebooks Dataproc Hub sont des notebooks à utilisateur unique sélectionnés par l'administrateur, qui s'exécutent sur un cluster Dataproc JupyterLab créé et exécuté dans le projet de l'utilisateur.
Dataproc Hub exploite JupyterHub pour :
renforcer la cohérence au sein de votre organisation en permettant aux administrateurs de créer une liste organisée de modèles de notebooks pour différents groupes de données et d'utilisateurs de ML ;
accélérer la création de notebooks en fournissant aux utilisateurs des données et du ML des environnements préconfigurés qui correspondent à leurs exigences logicielles et matérielles.
Dataproc Hub fournit des interfaces distinctes pour les administrateurs et les utilisateurs :
Les administrateurs utilisent la page Dataproc→Workbench→Notebooks gérés par l'utilisateur de la console Google Cloud pour créer des instances Dataproc Hub. Chaque instance de hub contient un ensemble prédéfini d'environnements de notebooks définis par des fichiers de configuration de cluster YAML.
Les utilisateurs de données et de ML utilisent l'interface utilisateur Notebooks→Instances de la consoleGoogle Cloud pour sélectionner un environnement de notebooks prédéfini afin de générer un serveur de notebooks sur leur cluster Dataproc.
Les utilisateurs qui n'ont pas accès à la console peuvent accéder à l'instance Dataproc Hub pour générer un cluster Dataproc à partir de leur navigateur Web à l'aide d'une URL d'instance Dataproc Hub fournie par l'administrateur.
Cas d'utilisation de Dataproc Hub :
Les utilisateurs de données et de ML sont organisés en groupes ayant des exigences logicielles et matérielles courantes (les utilisateurs peuvent être placés dans plusieurs groupes).
Accès limité à la console Dataproc : les utilisateurs n'ont pas accès à Dataproc dans la console Google Cloud .
Fonctionnalités de Dataproc Hub :
Environnements utilisateurs prédéfinis
Isolation de cluster et de notebook : les membres d'un groupe donné ne disposent pas d'un accès facile aux clusters et aux notebooks des membres d'autres groupes
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eDataproc Hub and Vertex AI Workbench user-managed notebooks are deprecated and will no longer be supported after January 30, 2025.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub allows administrators to create and manage curated notebook templates for different data and ML user groups within an organization.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub enables users to quickly create notebook servers on Dataproc clusters from pre-configured environments that match their specific software and hardware requirements.\u003c/p\u003e\n"],["\u003cp\u003eAdministrators can use the Google Cloud console to configure Dataproc Hub instances, while data and ML users can select and spawn notebook servers from predefined environments.\u003c/p\u003e\n"],["\u003cp\u003eDataproc Hub offers benefits such as predefined user environments, cluster and notebook isolation between different groups of users, and can be used by teams with restricted access to the console.\u003c/p\u003e\n"]]],[],null,["| Dataproc Hub and\n| Vertex AI Workbench user-managed notebooks are\n| deprecated. On January 30, 2025, support for user-managed notebooks\n| will end and the ability to create user-managed notebooks instances\n| will be removed. For alternative notebook solutions\n| on Google Cloud, see:\n|\n| - [Install\n| the Jupyter component on your Dataproc cluster](/dataproc/docs/concepts/components/jupyter#install_jupyter).\n| - [Create\n| a Dataproc-enabled\n| Vertex AI Workbench instance](/vertex-ai/docs/workbench/instances/create-dataproc-enabled).\n\nThe Dataproc Hub lets you to take advantage of\nVertex AI Workbench and Dataproc to run\ninteractive ML and\ndata processing tasks at scale using Jupyter notebooks and the Hadoop and Spark\necosystem.\n\nDataproc Hub notebooks are administrator-curated,\nsingle-user notebooks running on a Dataproc JupyterLab cluster\ncreated and running in the user's project.\n\n- Dataproc Hub leverages JupyterHub to:\n\n - Bring consistency across the organization by enabling administrators to create a curated list of notebook templates for different groups of data and ML users.\n - Accelerate notebook creation by providing data and ML users with pre-configured environments that match their software and hardware requirements.\n- Dataproc Hub provides separate interfaces for administrators and\n users:\n\n - Administrators use the **Dataproc→Workbench→User-Managed Notebooks** page in the Google Cloud console to create Dataproc Hub instances. Each hub instance contains a predefined set of notebook environments defined by YAML cluster configuration files.\n - Data and ML users use the Notebooks→Instances UI in the Google Cloud console to select a predefined notebook environment to spawn a notebook server on their Dataproc cluster.\n - Users without console access can access the Dataproc Hub instance to spawn a Dataproc cluster from their web browser by using a Dataproc Hub instance URL provided by the administrator. If the organization does not define and implement separate notebook administrative and user roles, instead of using Dataproc Hub to configure and spawn a Jupyter notebook cluster, users can [install the Jupyter component on their cluster](/dataproc/docs/concepts/components/jupyter).\n- Dataproc Hub use cases:\n\n - Data and ML users are organized in groups with common software and hardware requirements (users can be placed in multiple groups)\n - Restricted Dataproc console access: Users do not have access to Dataproc in the Google Cloud console\n- Dataproc Hub features:\n\n - Predefined user environments\n - Cluster and notebook isolation: members of a group are not provided easy access to clusters and notebooks of members in other groups\n\nFor more information\n\n- Admins: [Configure Dataproc Hub](/dataproc/docs/tutorials/dataproc-hub-admins)\n- Users: [Use Dataproc Hub](/dataproc/docs/tutorials/dataproc-hub-users)"]]