Composant Dataproc Zeppelin

Vous pouvez installer des composants supplémentaires lorsque vous créez un cluster Dataproc à l'aide de la fonctionnalité Composants facultatifs. Cette page décrit le composant Zeppelin.

Le composant Notebook Zeppelin est un notebook Web utilisé pour l'analyse interactive de données. L'interface utilisateur Web de Zeppelin est disponible sur le port 8080 du premier nœud maître du cluster.

Par défaut, les notebooks sont enregistrés dans Cloud Storage, dans le bucket de préproduction Dataproc (spécifié par l'utilisateur ou créé automatiquement lors de la création du cluster). L'emplacement peut être modifié au moment de la création du cluster via la propriété zeppelin:zeppelin.notebook.gcs.dir.

Installer le composant

Installez le composant lorsque vous créez un cluster Dataproc. Des composants peuvent être ajoutés aux clusters créés avec Dataproc version 1.3 et ultérieure.

Consultez la section Versions Dataproc compatibles pour connaître la version de composant incluse dans chaque version d'image Dataproc.

Commande gcloud

Pour créer un cluster Dataproc incluant le composant Zeppelin, utilisez la commande gcloud dataproc clusters create cluster-name avec l'option --optional-components.

.
gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Le composant Zeppelin peut être spécifié via l'API Dataproc à l'aide de la propriété SoftwareConfig.Component dans le cadre d'une requête clusters.create.

Console

  1. Activez le composant.
    • Dans Cloud Console, ouvrez la page Dataproc Créer un cluster. Cliquez sur "Advanced options" (Options avancées) au bas de la page pour afficher la section "Optional Components" (Composants facultatifs).

    • Cliquez sur "Select component" (Sélectionner un composant) pour ouvrir le panneau de sélection Optional components (Composants facultatifs). Sélectionnez "Zeppelin Notebook" (Notebook Zeppelin) et les autres composants facultatifs à installer sur votre cluster.

  2. Activez la passerelle des composants (nécessite la version d'image 1.3.29 ou ultérieure) pour faciliter l'accès au notebook Zeppelin et aux autres interfaces Web des composants depuis Google Cloud Console (voir la section Afficher les URL de la passerelle des composants et y accéder).
    • Cochez la case "Component Gateway" (Passerelle des composants) dans le formulaire "Create a cluster" (Créer un cluster).

Ouvrir le notebook Zeppelin

Consultez la section Afficher les URL de la passerelle des composants et y accéder. Elle contient des liens de la passerelle des composants dans Cloud Console, sur lesquels vous pouvez cliquer pour ouvrir l'interface utilisateur du notebook Zeppelin s'exécutant sur le nœud maître du cluster dans votre navigateur local.