Les clusters à nœud unique sont des clusters Dataproc avec un seul nœud. Ce nœud unique agit à la fois en tant que nœud maître et nœud de calcul pour votre cluster Dataproc. Bien que les clusters à nœud unique ne comportent qu'un seul nœud, la plupart des concepts et fonctionnalités de Dataproc continuent de s'appliquer, à l'exception de ceux répertoriés ci-dessous.
Les clusters Dataproc à nœud unique peuvent être utiles dans plusieurs cas, parmi lesquels :
- Pour essayer de nouvelles versions de Spark et Hadoop ou d'autres composants Open Source.
- Pour élaborer des démonstrations de faisabilité.
- Pour les applications légères de la science des données.
- Pour le traitement de données non critiques à petite échelle.
- Pour la formation sur l'écosystème Spark et Hadoop.
Sémantique d'un cluster à nœud unique
La sémantique suivante s'applique aux clusters Dataproc à nœud unique :
- Les clusters à nœud unique sont configurés de la même manière que les clusters Dataproc multinœuds. Ils incluent des services tels que HDFS et YARN.
- Les clusters à nœud unique sont signalés en tant que nœuds maîtres pour les actions d'initialisation.
- Les clusters à nœud unique n'affichent aucun nœud de calcul, car le nœud unique joue lui-même le rôle de nœud maître et de nœud de calcul.
- Les clusters à nœud unique reçoivent des noms d'hôte qui suivent le modèle
clustername-m
. Vous pouvez utiliser ce nom d'hôte pour vous connecter en SSH ou à une interface utilisateur Web sur le nœud. - Les clusters à nœud unique ne peuvent pas être remplacés par des clusters multinœuds. Une fois créés, les clusters à nœud unique sont limités à un seul nœud. Réciproquement, les clusters multinœuds ne peuvent pas être remplacés par des clusters à nœud unique.
Limites
Les clusters à nœud unique ne sont pas recommandés pour le traitement parallèle de données à grande échelle. Si vous dépassez les ressources d'un cluster à nœud unique, il est recommandé d'utiliser un cluster Dataproc multinœud.
Les clusters à nœud unique ne sont pas compatibles avec la haute disponibilité, car le cluster ne possède qu'un seul nœud.
Les clusters à nœud unique ne peuvent pas utiliser de machines virtuelles préemptives.
Créer un cluster à nœud unique
Commande gcloud
Vous pouvez créer un cluster Dataproc à nœud unique à l'aide de l'outil de ligne de commande gcloud
. Pour créer un cluster à nœud unique, transmettez l'option --single-node
à la commande gcloud dataproc clusters create.
gcloud dataproc clusters create cluster-name \ --region=region \ --single-node \ ... other args
API REST
Vous pouvez créer un cluster à nœud unique via l'API REST Dataproc avec une requête clusters.create. Lors de cette requête, pensez à effectuer les actions suivantes :
- Ajoutez la propriété
"dataproc:dataproc.allow.zero.workers":"true"
à l'objet SoftwareConfig de la requête de cluster. - N'envoyez pas de valeurs pour
workerConfig
etsecondaryWorkerConfig
(voir ClusterConfig).
Console
Vous pouvez créer un cluster à nœud unique. Pour ce faire, sélectionnez "Un seul nœud (1 nœud maître, 0 nœud de calcul)" dans la section "Type de cluster" du panneau "Configurer le cluster" sur la page Créer un cluster de Dataproc.