Soluzione già pronta: lakehouse di analisi

Last reviewed 2023-11-20 UTC

Questa guida ti aiuta a comprendere, eseguire il deployment e utilizzare Lakehouse di Analytics soluzione già pronta. Questa soluzione dimostra come unificare i data lake e i data warehouse creando una lakehouse di analisi per archiviare, elaborare, e attivare i dati utilizzando uno stack di dati unificato.

Ecco alcuni casi d'uso comuni per la creazione di una lakehouse di analisi:

  • Analisi su larga scala dei dati di telemetria combinati con i dati dei report.
  • Unificazione dell'analisi dei dati strutturati e non strutturati.
  • Fornire funzionalità di analisi in tempo reale per un data warehouse.

Questo documento è rivolto agli sviluppatori che conoscono già i dati un'analisi e hanno utilizzato un database o un data lake per eseguire un'analisi. Presuppone hai familiarità con i concetti cloud di base, anche se non necessariamente in Google Cloud. L'esperienza con Terraform è utile.

Obiettivi

  • Scopri come configurare una lakehouse di analisi.
  • Proteggi una lakehouse di analisi utilizzando un livello di governance comune.
  • Crea dashboard dai dati per eseguire l'analisi dei dati.
  • Crea un modello di machine learning per prevedere i valori dei dati nel tempo.

Prodotti utilizzati

La soluzione utilizza i seguenti prodotti Google Cloud:

  • BigQuery: Un data warehouse completamente gestito e a scalabilità elevata con macchina integrata e machine learning.
  • Dataproc: Un servizio completamente gestito per la modernizzazione, l'ETL e la sicurezza dei data lake data science su larga scala.
  • Looker Studio: Piattaforma di business intelligence self-service che ti aiuta a creare e condividere e insight sui dati.
  • Dataplex: Rileva, gestisci, monitora e governa a livello centralizzato i dati su larga scala.
  • Cloud Storage Un servizio di livello enterprise che offre archiviazione di oggetti a basso costo e senza limiti per diversi tipi di dati. I dati sono accessibili all'interno e all'esterno di in Google Cloud e viene replicato con ridondanza geografica.
  • BigLake: BigLake è un motore di archiviazione che unifica data warehouse e data lake tramite consente a BigQuery e a framework open source come Spark di accedere ai dati con un controllo dell'accesso granulare.

I seguenti prodotti Google Cloud vengono utilizzati per inserire in un'area intermedia i dati soluzione per il primo utilizzo:

  • Flussi di lavoro: una piattaforma di orchestrazione completamente gestita che esegue i servizi in una dell'ordine specificato come flusso di lavoro. Workflows possono combinare servizi, tra cui personalizzati ospitati su Cloud Run o Cloud Functions, ai servizi Google Cloud come BigQuery e qualsiasi basata su HTTP.

Architettura

L'architettura di lakehouse di esempio di cui questa soluzione esegue il deployment analizza un set di dati di e-commerce per comprendere le prestazioni di un retailer nel tempo. La diagramma seguente mostra l'architettura delle risorse Google Cloud di cui la soluzione esegue il deployment.

Architettura dell'infrastruttura per la soluzione di data warehouse.

Flusso della soluzione

L'architettura rappresenta un flusso di dati comune per compilare e trasformare i dati in un'architettura di lakehouse di analisi:

  1. I dati vengono inseriti in Cloud Storage bucket.
  2. Viene creato un data lake in Dataplex. I dati nei bucket sono organizzati in entità o tabelle nel data lake.
  3. Le tabelle nel data lake sono immediatamente disponibili in BigQuery come BigLake: tabelle.
  4. Trasformazioni dei dati con Dataproc o BigQuery e utilizzando formati file aperti, tra cui Apache Iceberg.
  5. I dati possono essere protetti tramite tag di criteri e criteri di accesso alle righe.
  6. Alle tabelle è possibile applicare il machine learning.
  7. Le dashboard vengono create dai dati per eseguire più analisi Looker Studio

Costo

Per una stima del costo delle risorse Google Cloud che degli usi della soluzione lakehouse di analisi, visualizza la stima precalcolata Calcolatore prezzi di Google Cloud.

Utilizza questa stima come punto di partenza per calcolare il costo del deployment. Puoi modificare la stima per riflettere eventuali modifiche alla configurazione che prevedi per le risorse utilizzate nella soluzione.

La stima precalcolata si basa su ipotesi per determinati fattori, tra cui:

  • Le località Google Cloud in cui viene eseguito il deployment delle risorse.
  • La quantità di tempo di utilizzo delle risorse.

Prima di iniziare

Per eseguire il deployment di questa soluzione, devi prima avere un progetto Google Cloud e Autorizzazioni IAM.

Crea o scegli un progetto Google Cloud

Quando esegui il deployment della soluzione, scegli Progetto Google Cloud in cui viene eseguito il deployment delle risorse. Puoi creare un nuovo progetto o utilizzare progetto esistente per il deployment.

Se vuoi creare un nuovo progetto, fallo prima di iniziare il deployment. L'utilizzo di un nuovo progetto può aiutare a evitare conflitti con il provisioning in precedenza ad esempio quelle utilizzate per i carichi di lavoro di produzione.

Per creare un progetto, completa i seguenti passaggi:

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Click Create project.

  3. Name your project. Make a note of your generated project ID.

  4. Edit the other fields as needed.

  5. Click Create.

Ottieni le autorizzazioni IAM richieste

Per avviare il processo di deployment, hai bisogno di Identity and Access Management (IAM) elencate nella tabella seguente.

Se hai creato un nuovo progetto per questa soluzione, hai roles/owner ruolo di base nel progetto e disporre di tutte le autorizzazioni necessarie. Se non disponi di ruolo roles/owner, poi chiedi all'amministratore di concedere queste autorizzazioni (oppure i ruoli che includono queste autorizzazioni).

Autorizzazione IAM richiesta Ruolo predefinito che include le autorizzazioni richieste

serviceusage.services.enable

Amministratore Service Usage
(roles/serviceusage.serviceUsageAdmin)

iam.serviceAccounts.create

Amministratore account di servizio
(roles/iam.serviceAccountAdmin)

resourcemanager.projects.setIamPolicy

Amministratore IAM progetto
(roles/resourcemanager.projectIamAdmin)
config.deployments.create
config.deployments.list
Amministratore Cloud Infrastructure Manager
(roles/config.admin)
iam.serviceAccount.actAs Utente account di servizio
(roles/iam.serviceAccountUser)

Informazioni sulle autorizzazioni temporanee degli account di servizio

Se avvii il processo di deployment tramite la console, Google crea un'istanza account di servizio di eseguire il deployment della soluzione per tuo conto (ed eliminare il deployment in un secondo momento se scegli). A questo account di servizio sono assegnate determinate autorizzazioni IAM temporaneamente; cioè le autorizzazioni vengono revocate automaticamente le operazioni di deployment ed eliminazione della soluzione. Google consiglia Dopo aver eliminato il deployment, elimini l'account di servizio, descritti più avanti in questa guida.

Visualizzare i ruoli assegnati al servizio account

Questi ruoli sono elencati qui nel caso in cui un amministratore del tuo Il progetto o l'organizzazione Google Cloud richiede queste informazioni.

  • roles/biglake.admin
  • roles/bigquery.admin
  • roles/compute.admin
  • roles/datalineage.viewer
  • roles/dataplex.admin
  • roles/dataproc.admin
  • roles/iam.serviceAccountAdmin
  • roles/iam.serviceAccountUser
  • roles/resourcemanager.projectIamAdmin
  • roles/servicenetworking.serviceAgent
  • roles/serviceusage.serviceUsageViewer
  • roles/vpcaccess.admin
  • roles/storage.admin
  • roles/workflows.admin

Esegui il deployment della soluzione

Questa sezione ti guida nella procedura di deployment della soluzione.

Per aiutarti a eseguire il deployment di questa soluzione con il minimo sforzo, è fornito in GitHub. La configurazione di Terraform definisce Le risorse Google Cloud necessarie per la soluzione.

Puoi eseguire il deployment della soluzione utilizzando uno dei seguenti metodi:

  • Tramite la console: utilizza questo metodo se vuoi per provare la soluzione con la configurazione predefinita e vedere come funziona. Cloud Build esegue il deployment di tutte le risorse necessarie soluzione. Quando la soluzione di cui hai eseguito il deployment non è più necessaria, puoi eliminarla tramite la console. Qualsiasi risorsa creata dopo potrebbe essere necessario eliminare separatamente la soluzione.

    Per utilizzare questo metodo di deployment, segui le istruzioni in Esegui il deployment tramite la console.

  • Utilizzo dell'interfaccia a riga di comando di Terraform: utilizza questo metodo se vuoi personalizzare o se vuoi automatizzare il provisioning e la gestione risorse mediante l'approccio Infrastructure as Code (IaC). Scarica Configurazione Terraform da GitHub, facoltativamente personalizza il codice come necessario ed eseguire il deployment della soluzione usando l'interfaccia a riga di comando di Terraform. Dopo il giorno esegui il deployment della soluzione, puoi continuare a usare Terraform per gestire soluzione.

    Per utilizzare questo metodo di deployment, segui le istruzioni in Esegui il deployment utilizzando l'interfaccia a riga di comando di Terraform.

Esegui il deployment tramite la console

Completa i seguenti passaggi per eseguire il deployment della soluzione preconfigurata.

  1. Nel catalogo delle soluzioni di avvio rapido di Google Cloud, vai alla Soluzione lakehouse di analisi.

    Vai alla soluzione lakehouse di Analytics

  2. Controlla le informazioni fornite nella pagina, ad esempio la stima costo della soluzione e il tempo di deployment stimato.

  3. Quando è tutto pronto per iniziare il deployment della soluzione, fai clic su Esegui il deployment.

    Viene visualizzato un riquadro di configurazione passo passo.

  4. Completa i passaggi nel riquadro di configurazione.

    Prendi nota del nome che inserisci per il deployment. Questo nome è obbligatorio in un secondo momento, quando elimini il deployment.

    Quando fai clic su Esegui il deployment, viene visualizzata la pagina Deployment della soluzione. Il campo Stato in questa pagina mostra Deployment in corso.

  5. Attendi che venga eseguito il deployment della soluzione.

    Se il deployment non va a buon fine, il campo Stato mostra Non riuscito. Puoi e usare il log di Cloud Build per diagnosticare gli errori. Per maggiori informazioni le informazioni, vedi Errori durante il deployment tramite la console.

    Al termine del deployment, il campo Stato diventa Deployment eseguito.

  6. Per visualizzare e utilizzare la soluzione, torna a Deployment della soluzione nella console.

    1. Fai clic sulla Menu Azioni.
    2. Seleziona Visualizza la dashboard di Looker Studio per aprire una dashboard. basato sui dati di esempio che vengono trasformati utilizzando la soluzione.
    3. Seleziona Apri editor BigQuery per eseguire query e creare la macchina di machine learning (ML) utilizzando i dati di esempio nella soluzione.
    4. Seleziona Visualizza Colab per eseguire query in un ambiente blocco note.

Quando la soluzione non ti serve più, puoi eliminare il deployment per evitare e la fatturazione continua per le risorse Google Cloud. Per ulteriori informazioni, vedi Elimina il deployment.

Esegui il deployment utilizzando l'interfaccia a riga di comando di Terraform

Questa sezione descrive come puoi personalizzare la soluzione o automatizzare il provisioning e la gestione della soluzione tramite l'interfaccia a riga di comando di Terraform. Le soluzioni di cui esegui il deployment utilizzando l'interfaccia a riga di comando di Terraform non vengono visualizzate nel Pagina Deployment delle soluzioni nella console Google Cloud.

configura il client Terraform

Puoi eseguire Terraform in Cloud Shell o sul tuo host locale. Questo descrive come eseguire Terraform in Cloud Shell, Terraform è preinstallato e configurato per l'autenticazione con Google Cloud.

Il codice Terraform per questa soluzione è disponibile in un repository GitHub.

  1. Clona il repository GitHub in Cloud Shell.

    Apri in Cloud Shell

    Viene visualizzato un prompt per confermare il download del repository GitHub in in Cloud Shell.

  2. Fai clic su Conferma.

    Cloud Shell viene avviato in una scheda separata del browser Il codice Terraform viene scaricato nella directory $HOME/cloudshell_open di dell'ambiente Cloud Shell.

  3. In Cloud Shell, controlla se la directory di lavoro attuale è $HOME/cloudshell_open/terraform-google-analytics-lakehouse/. Questo è il contenente i file di configurazione Terraform per la soluzione. Se devi passare a questa directory, esegui questo comando:

    cd $HOME/cloudshell_open/terraform-google-analytics-lakehouse/
    
  4. Inizializza Terraform eseguendo questo comando:

    terraform init
    

    Attendi finché non viene visualizzato il seguente messaggio:

    Terraform has been successfully initialized!
    

Configura le variabili Terraform

Il codice Terraform che hai scaricato include variabili che puoi utilizzare per personalizzare il deployment in base ai tuoi requisiti. Ad esempio, puoi specifica il progetto Google Cloud e la regione in cui vuoi che venga utilizzata la soluzione di cui è stato eseguito il deployment.

  1. Assicurati che la directory di lavoro attuale sia $HOME/cloudshell_open/terraform-google-analytics-lakehouse/. Se non lo è, vai a quella directory.

  2. Nella stessa directory, crea un file di testo denominato terraform.tfvars.

  3. Nel file terraform.tfvars, copia il seguente snippet di codice e imposta per le variabili richieste.

    • Segui le istruzioni fornite sotto forma di commenti nel codice snippet di codice.
    • Questo snippet di codice include solo le variabili per le quali devi impostare e i relativi valori. La configurazione Terraform include altre variabili che i valori predefiniti. Per esaminare tutte le variabili e i valori predefiniti, consulta il file variables.tf disponibile in Directory $HOME/cloudshell_open/terraform-google-analytics-lakehouse/.
    • Assicurati che ogni valore impostato nel file terraform.tfvars corrisponde alla variabile tipo come dichiarato nel file variables.tf. Ad esempio, se il tipo definita per una variabile nel file variables.tf è bool, allora deve specificare true o false come valore di quella variabile nella terraform.tfvars.
    # This is an example of the terraform.tfvars file.
    # The values in this file must match the variable types declared in variables.tf.
    # The values in this file override any defaults in variables.tf.
    
    # ID of the project in which you want to deploy the solution
    project_id = "PROJECT_ID"
    
    # Google Cloud region where you want to deploy the solution
    # Example: us-central1
    region = "REGION"
    
    # Whether or not to enable underlying apis in this solution.
    # Example: true
    enable_apis = true
    
    # Whether or not to protect Cloud Storage and BigQuery resources from deletion when solution is modified or changed.
    # Example: false
    force_destroy = false
    

Convalida e rivedi la configurazione di Terraform

  1. Assicurati che la directory di lavoro attuale sia $HOME/cloudshell_open/terraform-google-analytics-lakehouse/. Se non lo è, vai a quella directory.

  2. Verifica che la configurazione Terraform non contenga errori:

    terraform validate
    

    Se il comando restituisce degli errori, apporta le correzioni necessarie nella configurazione ed esegui di nuovo il comando terraform validate. Ripeti questo passaggio finché il comando non restituisce il seguente messaggio:

    Success! The configuration is valid.
    
  3. Esamina le risorse definite nella configurazione:

    terraform plan
    
  4. Se non hai creato il file terraform.tfvars come descritto in precedenza, Terraform richiede di inserire i valori per le variabili privi di valori predefiniti. Inserisci i valori richiesti.

    L'output del comando terraform plan è un elenco delle risorse che Terraform esegue il provisioning quando applichi la configurazione.

    Se vuoi apportare modifiche, modifica la configurazione ed esegui di nuovo terraform validate e terraform plan.

Esegui il provisioning delle risorse

Quando non sono necessarie ulteriori modifiche alla configurazione Terraform, esegui il deployment le risorse.

  1. Assicurati che la directory di lavoro attuale sia $HOME/cloudshell_open/terraform-google-analytics-lakehouse/. Se non lo è, vai a quella directory.

  2. Applica la configurazione Terraform:

    terraform apply
    
  3. Se non hai creato il file terraform.tfvars come descritto in precedenza, Terraform richiede di inserire i valori per le variabili privi di valori predefiniti. Inserisci i valori richiesti.

    Terraform mostra un elenco delle risorse che verranno create.

  4. Quando ti viene chiesto di eseguire le azioni, inserisci yes.

    Terraform visualizza dei messaggi che mostrano l'avanzamento del deployment.

    Se il deployment non può essere completato, Terraform visualizza gli errori che ha causato l'errore. Esamina i messaggi di errore e aggiorna la configurazione per correggere gli errori. Quindi esegui di nuovo il comando terraform apply. Per assistenza per la risoluzione degli errori di Terraform, consulta Errori durante il deployment della soluzione utilizzando l'interfaccia a riga di comando di Terraform.

    Al termine della creazione di tutte le risorse, Terraform visualizza quanto segue messaggio:

    Apply complete!
    

    L'output di Terraform elenca anche le seguenti informazioni aggiuntive ti serviranno:

    • L'URL di Looker Studio della dashboard di cui è stato eseguito il deployment.
    • Il link per aprire l'editor BigQuery per alcune query di esempio.
    • Il link per aprire il tutorial di Colab.

    L'esempio seguente mostra l'aspetto dell'output:

    lookerstudio_report_url = "https://lookerstudio.google.com/reporting/create?c.reportId=79675b4f-9ed8-4ee4-bb35-709b8fd5306a&ds.ds0.datasourceName=vw_ecommerce&ds.ds0.projectId=${var.project_id}&ds.ds0.type=TABLE&ds.ds0.datasetId=gcp_lakehouse_ds&ds.ds0.tableId=view_ecommerce"
    bigquery_editor_url = "https://console.cloud.google.com/bigquery?project=my-cloud-project&ws=!1m5!1m4!6m3!1smy-cloud-project!2sds_edw!3ssp_sample_queries"
    lakehouse_colab_url = "https://colab.research.google.com/github/GoogleCloudPlatform/terraform-google-analytics-lakehouse/blob/main/assets/ipynb/exploratory-analysis.ipynb"
    
  5. Per visualizzare e utilizzare la dashboard ed eseguire query in BigQuery, copia gli URL di output dal passaggio precedente aprire gli URL in nuove schede del browser.

    La dashboard, il blocco note e gli editor di BigQuery vengono visualizzati nelle nuove schede.

Quando la soluzione non ti serve più, puoi eliminare il deployment per evitare e la fatturazione continua per le risorse Google Cloud. Per ulteriori informazioni, vedi Elimina il deployment.

Personalizza la soluzione

Questa sezione fornisce informazioni che gli sviluppatori Terraform possono utilizzare per modificare la soluzione lakehouse di analisi per soddisfare le esigenze e requisiti aziendali. Le indicazioni in questa sezione sono pertinenti soltanto se eseguire il deployment della soluzione utilizzando l'interfaccia a riga di comando di Terraform.

Dopo aver visto come funziona la soluzione con i dati di esempio, è consigliabile lavorare con i tuoi dati. Per utilizzare i tuoi dati, li inserisci nella Bucket Cloud Storage denominato edw-raw-hash. La è un set casuale di 8 caratteri generato durante il deployment. Tu modificare il codice Terraform nei seguenti modi:

  1. ID set di dati: Modifica il codice Terraform in modo che, quando viene creato set di dati BigQuery, utilizza l'ID del set di dati che vuoi da utilizzare per i tuoi dati.
  2. Schema. Modifica il codice Terraform in modo che crei L'ID tabella BigQuery che vuoi utilizzare per archiviare i dati. È incluso lo schema della tabella esterna, in modo che BigQuery possa per leggere i dati da Cloud Storage.
  3. Zona. Crea le zone lake adatte alle tue esigenze aziendali (di solito una suddivisione in zone a due o tre livelli in base alla qualità e all'utilizzo dei dati).
  4. Dashboard di Looker. Cambia il codice Terraform che crea un'istanza di Looker in modo che riflettano i dati che che stai utilizzando.
  5. Offerte di lavoro PySpark. Cambia il codice Terraform per eseguire job PySpark utilizzando Dataproc.

Di seguito sono riportati oggetti lakehouse di analisi comuni, che mostrano il codice di esempio Terraform in main.tf.

  • Set di dati BigQuery: Lo schema in cui gli oggetti di database vengono raggruppati e archiviati.

    resource "google_bigquery_dataset" "ds_edw" {
          project = module.project-services.project_id
          dataset_id = "DATASET_PHYSICAL_ID"
          friendly_name = "DATASET_LOGICAL_NAME"
          description = "DATASET_DESCRIPTION"
          location = "REGION"
          labels = var.labels
          delete_contents_on_destroy = var.force_destroy
      }
  • Tabella BigQuery: Un oggetto di database che rappresenta i dati archiviati in BigQuery o rappresenta uno schema di dati archiviato in Cloud Storage.

    resource "google_bigquery_table" "tbl_edw_taxi" {
          dataset_id = google_bigquery_dataset.ds_edw.dataset_id
          table_id = "TABLE_NAME"
          project = module.project-services.project_id
          deletion_protection = var.deletion_protection
          ...
      }
  • Stored procedure di BigQuery: Un oggetto di database che rappresenta una o più istruzioni SQL da eseguire quando viene chiamato. come trasformare i dati da una tabella all'altra per caricare i dati da una tabella esterna in una tabella standard.

    resource "google_bigquery_routine" "sp_sample_translation_queries" {
          project = module.project-services.project_id
          dataset_id = google_bigquery_dataset.ds_edw.dataset_id
          routine_id = "sp_sample_translation_queries"
          routine_type = "PROCEDURE"
          language = "SQL"
          definition_body = templatefile("${path.module}/assets/sql/sp_sample_translation_queries.sql", { project_id = module.project-services.project_id })
        }
  • Flusso di lavoro di Cloud Workflows: Un flusso di lavoro di Workflows rappresenta una combinazione di passaggi da eseguire in un ordine specifico. Può essere utilizzato per configurare i dati o eseguire trasformazioni dei dati in altre fasi di esecuzione.

    resource "google_workflows_workflow" "copy_data" {
        name            = "copy_data"
        project         = module.project-services.project_id
        region          = var.region
        description     = "Copies data and performs project setup"
        service_account = google_service_account.workflows_sa.email
        source_contents = templatefile("${path.module}/src/yaml/copy-data.yaml", {
            public_data_bucket    = var.public_data_bucket,
            textocr_images_bucket = google_storage_bucket.textocr_images_bucket.name,
            ga4_images_bucket     = google_storage_bucket.ga4_images_bucket.name,
            tables_bucket         = google_storage_bucket.tables_bucket.name,
            dataplex_bucket       = google_storage_bucket.dataplex_bucket.name,
            images_zone_name      = google_dataplex_zone.gcp_primary_raw.name,
            tables_zone_name      = google_dataplex_zone.gcp_primary_staging.name,
            lake_name             = google_dataplex_lake.gcp_primary.name
        })
        }
        

Per personalizzare la soluzione, completa i seguenti passaggi in Cloud Shell:

  1. Verifica che la directory di lavoro attuale sia $HOME/cloudshell_open/terraform-google-analytics-lakehouse. In caso contrario, apri la directory:

    cd $HOME/cloudshell_open/terraform-google-analytics-lakehouse
    
  2. Apri main.tf e apporta le modifiche desiderate.

    Per ulteriori informazioni sugli effetti di questa personalizzazione affidabilità, sicurezza, prestazioni, costi e operazioni, vedi Consigli di progettazione.

  3. Convalida e rivedi la configurazione di Terraform.

  4. Esegui il provisioning delle risorse.

Suggerimenti di progettazione

Questa sezione fornisce suggerimenti per l'utilizzo della lakehouse di analisi soluzione per sviluppare un'architettura che soddisfi i requisiti di sicurezza, l'affidabilità, il costo e le prestazioni.

Quando inizi a scalare la tua soluzione lakehouse, hai a disposizione una serie per migliorare le prestazioni delle query e ridurre la spesa totale. Questi metodi includono la modifica del modo in cui i dati sono archiviati fisicamente, SQL e modificando il modo in cui vengono eseguite utilizzando tecnologie. Per scoprire di più sui metodi per ottimizzare Spark carichi di lavoro di lavoro, consulta le best practice di Dataproc per la produzione.

Tieni presente quanto segue:

  • Prima di apportare modifiche al design, valuta l'impatto sui costi e considera possibili compromessi con altre funzionalità. Puoi valutare l'impatto sui costi le modifiche al design utilizzando Calcolatore prezzi di Google Cloud.
  • Per implementare modifiche al design della soluzione, hai bisogno di competenze nel Programmazione Terraform e conoscenza avanzata dei servizi Google Cloud utilizzate nella soluzione.
  • Modificando la configurazione di Terraform fornita da Google e riscontrare errori, creare problemi in GitHub. I problemi di GitHub vengono esaminati secondo il criterio del "best effort" e non sono destinati a domande sull'utilizzo generale.
  • Per ulteriori informazioni sulla progettazione e la configurazione di livello di produzione ambienti in Google Cloud, consulta Progettazione delle zone di destinazione in Google Cloud e Elenco di controllo per la configurazione di Google Cloud.

Elimina il deployment della soluzione

Quando non hai più bisogno del deployment della soluzione, per evitare la fatturazione continua per le risorse che hai creato, elimina il deployment.

Elimina il deployment tramite la console

Utilizza questa procedura se hai eseguito il deployment della soluzione tramite la console.

  1. Nella console Google Cloud, vai alla pagina Deployment della soluzione.

    Vai a Deployment di soluzioni

  2. Seleziona il progetto che contiene il deployment da eliminare.

  3. Individua il deployment da eliminare.

  4. Nella riga relativa al deployment, fai clic su Azioni e seleziona Elimina.

    Potresti dover scorrere per visualizzare Azioni nella riga.

  5. Inserisci il nome del deployment e fai clic su Conferma.

    Il campo Stato mostra la dicitura Eliminazione.

    Se l'eliminazione non riesce, consulta le indicazioni per la risoluzione dei problemi in Errore durante l'eliminazione di un deployment.

Quando non hai più bisogno del progetto Google Cloud che hai utilizzato per la soluzione, possono eliminare il progetto. Per ulteriori informazioni, vedi (Facoltativo) Elimina il progetto.

Elimina il deployment utilizzando l'interfaccia a riga di comando di Terraform

Utilizza questa procedura se hai eseguito il deployment della soluzione mediante l'interfaccia a riga di comando di Terraform.

  1. In Cloud Shell, assicurati che la directory di lavoro attuale sia $HOME/cloudshell_open/terraform-google-analytics-lakehouse/. Se non lo è, vai a quella directory.

  2. Rimuovi le risorse di cui Terraform ha eseguito il provisioning:

    terraform destroy
    

    Terraform visualizza un elenco delle risorse che verranno eliminate.

  3. Quando ti viene chiesto di eseguire le azioni, inserisci yes.

    In Terraform vengono visualizzati dei messaggi che mostrano l'avanzamento. Dopo che tutte le risorse vengono eliminati, Terraform visualizza il seguente messaggio:

    Destroy complete!
    

    Se l'eliminazione non riesce, consulta le indicazioni per la risoluzione dei problemi in Errore durante l'eliminazione di un deployment.

Quando non hai più bisogno del progetto Google Cloud che hai utilizzato per la soluzione, possono eliminare il progetto. Per ulteriori informazioni, vedi (Facoltativo) Elimina il progetto.

(Facoltativo) Elimina il progetto

Se hai eseguito il deployment della soluzione in un nuovo progetto Google Cloud il progetto, quindi eliminalo completando i seguenti passaggi:

  1. Nella console Google Cloud, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Al prompt, digita l'ID progetto, quindi fai clic su Chiudi.

Se decidi di conservare il progetto, elimina l'account di servizio che era creato per questa soluzione, come descritto nella sezione successiva.

(Facoltativo) Elimina l'account di servizio

Se hai eliminato il progetto che hai utilizzato per la soluzione, salta questo passaggio .

Come indicato in precedenza in questa guida, quando hai eseguito il deployment della soluzione, è stato creato per tuo conto. All'account di servizio sono state assegnate Autorizzazioni IAM temporaneamente. cioè le autorizzazioni sono state revocata automaticamente dopo che le operazioni di deployment ed eliminazione della soluzione è stata completata, ma l'account di servizio non viene eliminato. Google consiglia di elimini questo account di servizio.

  • Se hai eseguito il deployment della soluzione tramite la console Google Cloud, vai alla Deployment delle soluzioni . Se ti trovi già in questa pagina, aggiorna il browser. Un processo è attivata in background per eliminare l'account di servizio. Nessun'altra azione necessaria.

  • Se hai eseguito il deployment della soluzione utilizzando l'interfaccia a riga di comando di Terraform, completa seguenti passaggi:

    1. Nella console Google Cloud, vai alla pagina Account di servizio.

      Vai ad Account di servizio

    2. Seleziona il progetto che hai utilizzato per la soluzione.

    3. Seleziona l'account di servizio che vuoi eliminare.

      L'ID email dell'account di servizio creato per la soluzione è nel seguente formato:

      goog-sc-DEPLOYMENT_NAME-NNN@PROJECT_ID.iam.gserviceaccount.com
      

      L'ID email contiene i seguenti valori:

      • DEPLOYMENT_NAME: il nome del deployment.
      • NNN: un numero casuale di 3 cifre.
      • PROJECT_ID: l'ID del progetto in cui di cui è stato eseguito il deployment della soluzione.
    4. Fai clic su Elimina.

Risolvere gli errori

Le azioni che puoi intraprendere per diagnosticare e risolvere gli errori dipendono il metodo di deployment e la complessità dell'errore.

Errori durante il deployment della soluzione tramite la console

Se il deployment non riesce quando utilizzi la console, seguenti:

  1. Vai alla pagina Deployment di soluzioni.

    Se il deployment non è riuscito, il campo Stato mostra Non riuscito.

  2. Visualizza i dettagli degli errori che hanno causato l'errore:

    1. Nella riga relativa al deployment, fai clic su Azioni.

      Potresti dover scorrere per visualizzare Azioni nella riga.

    2. Seleziona Visualizza i log di Cloud Build.

  3. Esamina il log di Cloud Build e intraprendi le azioni appropriate per risolvere il problema il problema che ha causato l'errore.

Errori durante il deployment della soluzione utilizzando l'interfaccia a riga di comando di Terraform

Se il deployment non riesce quando utilizzi Terraform, l'output del comando terraform apply include messaggi di errore che puoi esaminare per diagnosticare la richiesta. problema.

Gli esempi nelle sezioni seguenti mostrano errori di deployment che potresti incontrato nell'uso di Terraform.

Errore API non abilitata

Se crei un progetto e poi provi immediatamente a eseguire il deployment della soluzione al nuovo progetto, il deployment potrebbe non riuscire e restituire un errore come il seguente:

Error: Error creating Network: googleapi: Error 403: Compute Engine API has not
been used in project PROJECT_ID before or it is disabled. Enable it by visiting
https://console.developers.google.com/apis/api/compute.googleapis.com/overview?project=PROJECT_ID
then retry. If you enabled this API recently, wait a few minutes for the action
to propagate to our systems and retry.

Se si verifica questo errore, attendi qualche minuto ed esegui terraform apply il comando precedente.

Errore durante l'assegnazione dell'indirizzo richiesto

Quando esegui il comando terraform apply, viene eseguita un'operazione cannot assign requested address potrebbe verificarsi un errore, con un messaggio simile al seguente:

Error: Error creating service account:
 Post "https://iam.googleapis.com/v1/projects/PROJECT_ID/serviceAccounts:
 dial tcp [2001:db8:ffff:ffff::5f]:443:
 connect: cannot assign requested address

Se si verifica questo errore, esegui di nuovo il comando terraform apply.

Errori di accesso ai dati in BigQuery o Looker Studio

C'è un passaggio di provisioning che viene eseguito dopo i passaggi di provisioning di Terraform che carica i dati nell'ambiente. Se ricevi un messaggio di errore quando i dati vengono è stato caricato nella dashboard di Looker Studio oppure, quando inizi a esplorare BigQuery, attendi alcuni minuti Riprova.

Errore durante l'eliminazione di un deployment

In alcuni casi, i tentativi di eliminazione di un deployment potrebbero non riuscire:

  • Dopo aver eseguito il deployment di una soluzione tramite la console, modificare qualsiasi risorsa di cui la soluzione ha eseguito il provisioning, e se poi provi per eliminare il deployment, l'eliminazione potrebbe non riuscire. Il campo Status (Stato) nella La pagina Deployment di soluzioni mostra lo stato Non riuscito e Il log di Cloud Build mostra la causa dell'errore.
  • Dopo aver eseguito il deployment di una soluzione mediante l'interfaccia a riga di comando di Terraform, se modifichi utilizzando un'interfaccia non Terraform (ad esempio, la console) e, se provi a eliminare il deployment, l'eliminazione potrebbe non riuscire. I messaggi nell'output dell'terraform destroy per visualizzare la causa dell'errore.

Esamina i log e i messaggi degli errori, identifica ed elimina le risorse che ha causato l'errore, poi riprova a eliminare il deployment.

Se un deployment basato su console non viene eliminato e se non puoi diagnosticare l'errore utilizzando il log di Cloud Build, quindi eliminare il deployment utilizzando l'interfaccia a riga di comando Terraform, come descritto nella sezione successiva.

Elimina un deployment basato su console utilizzando l'interfaccia a riga di comando di Terraform

Questa sezione descrive come eliminare un deployment basato su console se si verificano quando provi a eliminarlo tramite la console. Nella questo approccio, scaricherai la configurazione Terraform per il deployment che vuoi eliminare, quindi usa l'interfaccia a riga di comando Terraform per eliminare il deployment.

  1. Identifica la regione in cui vengono inseriti il codice Terraform del deployment, i log e altre vengono archiviati i dati. che potrebbe essere diversa da quella in cui selezionato durante il deployment della soluzione.

    1. Nella console Google Cloud, vai a Deployment della soluzione .

      Vai a Deployment di soluzioni

    2. Seleziona il progetto che contiene il deployment da eliminare.

    3. Nell'elenco dei deployment, identifica la riga del deployment che da eliminare.

    4. Fai clic su Visualizza tutte le righe contenuti multimediali.

    5. Nella colonna Località, controlla la seconda posizione, come evidenziata nel seguente esempio:

      Posizione del codice di deployment, log e altri artefatti.

  2. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

  3. Crea variabili di ambiente per l'ID, la regione e il nome del progetto il deployment che vuoi eliminare:

    export REGION="REGION"
    export PROJECT_ID="PROJECT_ID"
    export DEPLOYMENT_NAME="DEPLOYMENT_NAME"
    

    In questi comandi, sostituisci quanto segue:

    • REGION: la località che hai annotato in precedenza in questa procedura.
    • PROJECT_ID: l'ID del progetto in cui di cui è stato eseguito il deployment della soluzione.
    • DEPLOYMENT_NAME: il nome del deployment da eliminare.
  4. Ottieni l'ID dell'ultima revisione del deployment che ti interessa da eliminare:

    export REVISION_ID=$(curl \
        -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        -H "Content-Type: application/json" \
        "https://config.googleapis.com/v1alpha2/projects/${PROJECT_ID}/locations/${REGION}/deployments/${DEPLOYMENT_NAME}" \
        | jq .latestRevision -r)
        echo $REVISION_ID
    

    L'output è simile al seguente:

    projects/PROJECT_ID/locations/REGION/deployments/DEPLOYMENT_NAME/revisions/r-0
    
  5. Ottieni il percorso Cloud Storage della configurazione Terraform per del deployment:

    export CONTENT_PATH=$(curl \
        -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        -H "Content-Type: application/json" \
        "https://config.googleapis.com/v1alpha2/${REVISION_ID}" \
        | jq .applyResults.content -r)
        echo $CONTENT_PATH
    

    Di seguito è riportato un esempio dell'output di questo comando:

    gs://PROJECT_ID-REGION-blueprint-config/DEPLOYMENT_NAME/r-0/apply_results/content
    
  6. Scarica la configurazione Terraform da Cloud Storage Cloud Shell:

    gcloud storage cp $CONTENT_PATH $HOME --recursive
    cd $HOME/content/
    

    Attendi finché non viene visualizzato il messaggio Operation completed, come mostrato in nell'esempio seguente:

    Operation completed over 45 objects/268.5 KiB
    
  7. Inizializza Terraform:

    terraform init
    

    Attendi finché non viene visualizzato il seguente messaggio:

    Terraform has been successfully initialized!
    
  8. Rimuovi le risorse di cui è stato eseguito il deployment:

    terraform destroy
    

    Terraform visualizza un elenco delle risorse che verranno eliminate.

    Se vengono visualizzati avvisi relativi a variabili non dichiarate, ignora il comando avvisi.

  9. Quando ti viene chiesto di eseguire le azioni, inserisci yes.

    In Terraform vengono visualizzati dei messaggi che mostrano l'avanzamento. Dopo tutte le vengono eliminate, Terraform visualizza il seguente messaggio:

    Destroy complete!
    
  10. Elimina l'artefatto di deployment:

    curl -X DELETE \
        -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        -H "Content-Type: application/json" \
        "https://config.googleapis.com/v1alpha2/projects/${PROJECT_ID}/locations/${REGION}/deployments/${DEPLOYMENT_NAME}?force=true&delete_policy=abandon"
    
  11. Attendi qualche secondo, quindi verifica che l'artefatto del deployment sia stato eliminati:

    curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        -H "Content-Type: application/json" \
        "https://config.googleapis.com/v1alpha2/projects/${PROJECT_ID}/locations/${REGION}/deployments/${DEPLOYMENT_NAME}" \
        | jq .error.message
    

    Se l'output mostra null, attendi qualche secondo ed esegui il comando di nuovo.

    Dopo l'eliminazione dell'artefatto di deployment, verrà visualizzato un messaggio come mostrato che viene visualizzato l'esempio seguente:

    Resource 'projects/PROJECT_ID/locations/REGION/deployments/DEPLOYMENT_NAME' was not found
    

Invia feedback

Le soluzioni già pronte sono solo a scopo informativo e non sono ufficialmente prodotti supportati. Google potrebbe modificare o rimuovere le soluzioni senza preavviso.

Per risolvere gli errori, esamina i log di Cloud Build e come output.

Per inviare un feedback:

  • Per la documentazione, i tutorial nella console o la soluzione, usa sul pulsante Invia feedback nella pagina.
  • Per il codice Terraform non modificato, crea problemi nel Repository GitHub. I problemi di GitHub vengono esaminati secondo il criterio del "best effort" e non sono destinati a domande sull'utilizzo generale.

Passaggi successivi