Questa guida mostra come creare un lake Dataplex utilizzando
Console Google Cloud, gcloud CLI o il metodo API lakes.create
.
Puoi creare il tuo lake in una delle regioni che supportano Dataplex.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage. APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage. APIs.
Controllo degli accessi
Assicurati di disporre dei ruoli predefiniti.
roles/dataplex.admin
oroles/dataplex.editor
ti sono stati concessi per consentirti per creare e gestire il lake. Segui i passaggi nella documentazione IAM per assegnazione di ruoli.Per collegare un bucket Cloud Storage da un altro progetto al tuo lake, concedi al seguente account di servizio Dataplex nel bucket eseguendo questo comando:
gcloud alpha dataplex lakes authorize \ --project PROJECT_ID_OF_LAKE \ --storage-bucket-resource BUCKET_NAME
Crea un metastore
Puoi accedere ai metadati Dataplex utilizzando Hive Metastore in Spark mediante l'associazione di dell'istanza di servizio Dataproc Metastore lake Dataplex. Devi avere una rete VPC abilitata Dataproc Metastore (versione 3.1.2 o successiva) associato al lake Dataplex.
Crea un servizio Dataproc Metastore.
Configura l'istanza del servizio Dataproc Metastore in modo da esporre un endpoint gRPC (anziché l'endpoint Metastore Thrift predefinito). Esegui l' seguente richiesta API di aggiornamento:
curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://metastore.googleapis.com/v1beta/projects/PROJECT_ID/locations/LOCATION/services/SERVICE_ID?updateMask=hiveMetastoreConfig.endpointProtocol" \ -d '{"hiveMetastoreConfig": {"endpointProtocol": "GRPC"}}'
Visualizza l'endpoint gRPC. Esegui questo comando:
gcloud metastore services describe SERVICE_ID \ --project PROJECT_ID \ --location LOCATION \ --format "value(endpointUri)"
Crea un lake Dataplex
I passaggi riportati di seguito mostrano come creare un lake Dataplex.
Console
Vai a Dataplex nella console Google Cloud.
Vai a Dataplex
Vai alla visualizzazione Gestisci.
Fai clic su
Crea.Inserisci un Nome visualizzato.
L'ID lago viene generato automaticamente. Se preferisci, può fornire il tuo ID. Consulta la Convenzione di denominazione delle risorse.
(Facoltativo) Inserisci una descrizione.
Specifica la Regione in cui creare il lake.
Per i lake creati in una determinata regione (ad esempio
us-central1
), è possibile associare i dati sia a singola regione (us-central1
) che a più regioni (us multi-region
) a seconda delle impostazioni della zona.(Facoltativo) Aggiungi etichette al lake.
(Facoltativo) Nella sezione Metastore, fai clic sul menu a discesa Servizio Metastore e seleziona il servizio che hai creato nella sezione Prima di iniziare.
Fai clic su Crea.
gcloud
Usa questo comando gcloud preview dataplex lake create
per creare un'istanza
lago:
gcloud alpha dataplex lakes create LAKE \ --location=LOCATION \ --labels=k1=v1,k2=v2,k3=v3 \ --metastore-service=METASTORE_SERVICE
Sostituisci quanto segue:
LAKE
: il nome del nuovo lake.LOCATION
: si riferisce a una regione Google Cloud.k1=v1,k2=v2,k3=v3
: le etichette utilizzate (se presenti).METASTORE_SERVICE
: il servizio Dataproc Metastore, se creato.
REST
Segui le istruzioni dell'API per creare un lake utilizzando Explorer API.
Passaggi successivi
- Scopri come organizzare i dati
in laghi e zone.
- Aggiungi zone al lake.
- Collega asset alle tue zone.
- Scopri come proteggere il tuo lake.
- Scopri come gestire il lake.