Crea un servizio e un cluster Dataproc Metastore
Questa pagina mostra come creare un servizio Dataproc Metastore e un cluster Dataproc che utilizza il servizio come metastore Hive.
Per indicazioni dettagliate su questa attività direttamente in Google Cloud Console, fai clic su Guida:
Nelle sezioni seguenti puoi seguire la stessa procedura utilizzata per fare clic su Procedura guidata.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Attiva l'API Dataproc Metastore.
Controllo dell'accesso
Per creare un servizio, devi richiedere un ruolo IAM contenente l'autorizzazione IAM
metastore.services.create
. I ruoli specifici di Dataproc Metastoreroles/metastore.admin
eroles/metastore.editor
includono l'autorizzazione di creazione.Per autorizzare la creazione di utenti o gruppi, puoi utilizzare i ruoli precedenti di
roles/owner
eroles/editor
.
Per ottenere e impostare i criteri IAM, puoi utilizzare quanto segue:
- Per Google Cloud Console, vedi Concedere un ruolo IAM utilizzando Google Cloud Console.
- Per le API REST, consulta l'API IAM.
- Per la riga di comando
gcloud
, vedi CLI di Google Cloud IAM.
Per ulteriori informazioni, vedi Gestire l'accesso con IAM.
Crea un servizio Dataproc Metastore
Le seguenti istruzioni spiegano come creare un servizio Dataproc Metastore utilizzando Google Cloud Console, l'interfaccia a riga di comando gcloud o l'API Dataproc Metastore.
console
In Google Cloud Console, apri la pagina Crea servizio:
Apri la pagina Crea servizio in Google Cloud Console
Nel campo Nome servizio, inserisci
example-service
.Seleziona Località dei dati. Per informazioni sulla selezione di un'area geografica, vedi Località cloud.
Per altre opzioni di configurazione del servizio, utilizza le impostazioni predefinite fornite.
Per creare e avviare il servizio, fai clic sul pulsante Invia.
Il nuovo servizio viene visualizzato nell'elenco Servizi.
gcloud
Esegui il comando gcloud metastore services create
seguente per creare un servizio:
gcloud metastore services create example-service \ --location=LOCATION
Sostituisci LOCATION
con l'area geografica di Compute Engine
in cui deve essere creato il servizio. Assicurati che Dataproc Metastore sia disponibile
nella località.
REST
Segui le istruzioni dell'API per creare un servizio utilizzando Explorer API.
Crea un cluster Dataproc che utilizza il servizio
Dopo aver creato un servizio, puoi creare e collegare un cluster Dataproc che utilizza il servizio come metastore Hive.
L'immagine Dataproc e la versione Dataproc Metastore Hive devono essere compatibili. Controlla le seguenti pagine di controllo delle versioni delle immagini per assicurarti che la versione Hive sia compatibile:
- Versioni release di Dataproc 2.0.x
- Versioni release di Dataproc 1.5.x
- Versioni release di Dataproc 1.4.x
Per ulteriori informazioni, consulta la sezione Elenco delle versioni dell'immagine di Dataproc.
console
In Google Cloud Console, apri la pagina Crea un cluster di Dataproc:
Nel campo Nome cluster, inserisci
example-cluster
.Nei menu Area geografica e Zona, seleziona un'area geografica e una zona per il cluster. Puoi selezionare un'area geografica distinta, per isolare le risorse e le località di archiviazione dei metadati all'interno dell'area geografica specificata. Se selezioni un'area geografica distinta, puoi selezionare "Nessuna preferenza" per la zona in cui consentire a Dataproc di scegliere una zona all'interno dell'area geografica selezionata per il cluster (vedi Posizionamento zona Dataproc).
Utilizza i valori predefiniti forniti per tutte le altre opzioni.
Fai clic sulla scheda Personalizza cluster.
Nella sezione Configurazione di rete, seleziona la stessa rete specificata durante la creazione del metastore.
Nella sezione Dataproc Metastore, seleziona
example-service
.Fai clic su Crea per creare il cluster.
Il nuovo cluster viene visualizzato nell'elenco Cluster. Lo stato del cluster è "Provisioning", finché il cluster non è pronto per essere utilizzato. Lo stato cambia in "In esecuzione".
gcloud
Esegui il comando gcloud dataproc clusters create
seguente per creare un cluster:
gcloud dataproc clusters create example-cluster \ --dataproc-metastore=projects/PROJECT_ID/locations/LOCATION/services/example-service \ --region=LOCATION
Sostituisci PROJECT_ID
con l'ID progetto del progetto in cui hai creato il servizio Dataproc Metastore.
Sostituisci LOCATION
con l'area geografica specificata
per il servizio Dataproc Metastore.
REST
Segui le istruzioni dell'API per creare un cluster utilizzando Explorer API.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- In Cloud Console, vai alla pagina Gestisci risorse.
- Se il progetto che vuoi eliminare è associato a un'organizzazione, espandi l'elenco Organizzazione nella colonna Nome.
- Nell'elenco dei progetti, seleziona il progetto da eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
In alternativa, puoi eliminare le risorse utilizzate in questo tutorial:
Elimina il servizio Dataproc Metastore.
console
In Google Cloud Console, apri la pagina Dataproc Metastore:
A sinistra del nome del servizio, seleziona la casella
example-service
.Nella parte superiore della pagina Dataproc Metastore, fai clic su Elimina per eliminare il servizio.
Nella finestra di dialogo, fai clic su Elimina per confermare l'eliminazione.
Il tuo servizio non è più visualizzato nell'elenco dei servizi.
gcloud
Esegui questo comando
gcloud metastore services delete
per eliminare un servizio:gcloud metastore services delete example-service \ --location=LOCATION
Sostituisci
LOCATION
con l'area geografica di Compute Engine in cui è stato creato il servizio.REST
Segui le istruzioni dell'API per eliminare un servizio utilizzando Explorer API.
Tutte le eliminazioni hanno esito positivo immediatamente.
Elimina il bucket Cloud Storage per il servizio Dataproc Metastore.
Elimina il cluster Dataproc che utilizzava il servizio Dataproc Metastore.