Creare e gestire le etichette

Puoi applicare etichette utente alle risorse del cluster e del job Dataproc al fine di raggruppare le risorse e le operazioni correlate per un secondo momento. filtrare ed elencare. Associa le etichette alle risorse al momento della loro creazione, durante la creazione del cluster o l'invio del job. Una volta associata a una risorsa, l'etichetta viene propagata alle operazioni eseguite sulla risorsa (creazione, aggiornamento, applicazione di patch o eliminazione di cluster; invio, aggiornamento, cancellazione o eliminazione di job), consentendoti di filtrare ed elencare cluster, job e operazioni in base all'etichetta.

Puoi anche aggiungere etichette alle risorse Compute Engine associate alle risorse del cluster, ad esempio istanze di macchine virtuali e dischi.

Cosa sono le etichette?

Un'etichetta è una coppia chiave-valore che puoi assegnare a cluster e job Google Cloud Dataproc. Aiutano a organizzare queste risorse e a gestire i costi su larga scala, con la granularità di cui hai bisogno. Puoi associare un'etichetta a ogni risorsa e poi filtrare le risorse in base alle etichette. Le informazioni sulle etichette vengono inoltrate al sistema di fatturazione che consente di suddividere gli addebiti fatturati per etichetta. Grazie ai report sulla fatturazione integrati, puoi filtrare e raggruppare i costi per etichette delle risorse. Puoi utilizzare le etichette anche eseguire query sulle esportazioni dei dati di fatturazione.

Requisiti per le etichette

Le etichette applicate a una risorsa devono soddisfare i seguenti requisiti requisiti:

  • Ogni risorsa può avere fino a 64 etichette.
  • Ogni etichetta deve essere una coppia chiave-valore.
  • Le chiavi hanno una lunghezza minima di 1 carattere e una lunghezza massima di 63 e non può essere vuoto. I valori possono essere vuoti e avere una lunghezza massima di 63 caratteri.
  • Le chiavi e i valori possono contenere solo lettere minuscole, caratteri numerici, trattini bassi e trattini. Tutti i caratteri devono utilizzare la codifica UTF-8 e sono consentiti caratteri internazionali. Le chiavi devono iniziare con una lettera minuscola o un carattere internazionale.
  • La parte della chiave di un'etichetta deve essere univoca all'interno di una singola risorsa. Tuttavia, puoi utilizzare la stessa chiave con più risorse.

Questi limiti si applicano alla chiave e al valore per ciascuna etichetta e al alle singole risorse Google Cloud con etichette. Non esiste un limite al numero di etichette che puoi applicare a tutte le risorse all'interno di un progetto.

Utilizzi comuni delle etichette

Ecco alcuni casi d'uso comuni per le etichette:

  • Etichette del team o del centro di costo: aggiungi etichette in base al team o per distinguere i cluster Dataproc e i job Dataproc di proprietà di team (ad es. team:research e team:analytics). Puoi utilizzare questo tipo di etichetta per la contabilizzazione dei costi o la definizione del budget.

  • Etichette dei componenti: ad esempio, component:redis, component:frontend, component:ingest e component:dashboard.

  • Etichette di ambiente o fase: ad esempio, environment:production e environment:test.

  • Etichette di stato: ad esempio state:active, state:readytodelete e state:archive.

  • Etichette di proprietà: utilizzate per identificare i team che sono responsabile delle operazioni, ad esempio: team:shopping-cart.

Sconsigliamo di creare un numero elevato di etichette univoche, ad esempio: per timestamp o singoli valori per ogni chiamata API. Il problema di questo approccio è che, quando i valori cambiano di frequente o con chiavi che ingombrano il catalogo, diventa difficile filtrare e generare report sulle risorse in modo efficace.

Etichette e tag

Le etichette possono essere utilizzate come annotazioni interrogabili per le risorse, ma non possono essere utilizzate per impostare delle condizioni sui criteri. I tag offrono un modo per consentire o di negare i criteri in base al fatto che una risorsa abbia un tag specifico, fornendo controllo sui criteri. Per ulteriori informazioni, consulta Panoramica dei tag.

Creazione e utilizzo di etichette Dataproc

Comando gcloud

Puoi specificare una o più etichette da applicare a un cluster o a un job Dataproc al momento della creazione o dell'invio utilizzando Google Cloud CLI.

gcloud dataproc clusters create args --labels environment=production,customer=acme
gcloud dataproc jobs submit args --labels environment=production,customer=acme

Dopo aver creato un cluster o un job Dataproc, puoi aggiornare le etichette associate alla risorsa usando Google Cloud CLI.

gcloud dataproc clusters update args --update-labels environment=production,customer=acme
gcloud dataproc jobs update args --update-labels environment=production,customer=acme

Analogamente, puoi utilizzare Google Cloud CLI per filtrare le risorse Dataproc per etichetta utilizzando un'espressione di filtro del seguente formato: labels.<key=value>.

gcloud dataproc clusters list \
    --region=region \
    --filter="status.state=ACTIVE AND labels.environment=production"
gcloud dataproc jobs list \
    --region=region \
    --filter="status.state=ACTIVE AND labels.customer=acme"

Consulta la documentazione dell'API Dataproc per clusters.list e jobs.list per ulteriori informazioni su come scrivere un'espressione di filtro.

API REST

Le etichette possono essere associate alle risorse Dataproc tramite l'API REST Dataproc. Il file clusters.create, jobs.submit Le API possono essere utilizzate per collegare le etichette a un cluster o a un job al momento della creazione o dell'invio. Il parametro clusters.patch, API jobs.patch può essere utilizzato per modificare le etichette dopo la creazione della risorsa. Ecco il corpo JSON di una richiesta cluster.create che include il collegamento key1:value al cluster.

{
  "clusterName":"cluster-1",
  "projectId":"my-project",
  "config":{
    "configBucket":"",
    "gceClusterConfig":{
      "networkUri":".../networks/default",
      "zoneUri":".../zones/us-central1-f"
    },
    "masterConfig":{
      "numInstances":1,
      "machineTypeUri":"..../machineTypes/n1-standard-4",
      "diskConfig":{
        "bootDiskSizeGb":500,
        "numLocalSsds":0
      }
    },
    "workerConfig":{
      "numInstances":2,
      "machineTypeUri":"...machineTypes/n1-standard-4",
      "diskConfig":{
        "bootDiskSizeGb":500,
        "numLocalSsds":0
      }
    }
  },
  "labels":{
    "key1":"value1"
  }
}

Le API clusters.list e jobs.list possono essere utilizzate per elencare le risorse corrispondenti a un filtro specificato utilizzando il seguente formato: labels.<key=value>.

Ecco un esempio di richiesta GET HTTPS dell'API Dataproc clusters.list che specifica un filtro delle etichette key=value. Il chiamante inserisce project, region, un filtro label-key e label-value e un api-key. Tieni presente che questa richiesta di esempio è suddivisa in due righe per facilitarne la lettura.

GET https://dataproc.googleapis.com/v1/projects/project/regions/region/clusters?
filter=labels.label-key=label-value&key=api-key

Consulta le clusters.list e jobs.list Documentazione dell'API Dataproc per ulteriori informazioni sulla scrittura di un'espressione di filtro.

Console

Puoi specificare un insieme di etichette da aggiungere a una risorsa Dataproc al momento della creazione o dell'invio utilizzando la console Google Cloud.

  • Aggiungi etichette a un cluster dalla sezione Etichette del riquadro Personalizza cluster di Dataproc Pagina Crea un cluster.
  • Aggiungi etichette a un job dalla pagina Dataproc Invia un job.

Dopo aver creato una risorsa Dataproc, puoi aggiornare le etichette associate a quella risorsa. Per aggiornare le etichette, devi prima fare clic su SHOW INFO PANEL in alto a sinistra della pagina. Questo è un esempio tratto dalla pagina Dataproc→Elenco cluster.

Quando viene visualizzato il riquadro delle informazioni, puoi aggiornare le etichette di Dataproc Google Cloud. Di seguito è riportato un esempio di aggiornamento delle etichette per un cluster Dataproc.

È anche possibile aggiornare le etichette di più elementi in una sola operazione. Nella in questo esempio le etichette vengono aggiornate per più job Dataproc contemporaneamente.

Le etichette ti consentono di filtrare le risorse Dataproc mostrate nelle pagine Dataproc→Elenca cluster e Dataproc→Elenca job. Nella parte superiore della pagina, puoi utilizzare il pattern di ricerca labels.<labelname>=<value> per filtrare le risorse in base a un'etichetta.

Etichette applicate automaticamente

Quando crei o aggiorni un cluster, Dataproc applica automaticamente diverse etichette al cluster e alle risorse del cluster. Ad esempio, Dataproc applica le etichette alle macchine virtuali, ai dischi permanenti e agli acceleratori quando viene creato un cluster. Le etichette applicate automaticamente hanno prefisso goog-dataproc speciale.

Le seguenti etichette goog-dataproc vengono applicate automaticamente alle risorse Dataproc. Qualsiasi valore fornito per goog-dataproc etichetta durante la creazione del cluster sostituirà forniti automaticamente. Per questo motivo, l'inserimento di valori propri per queste etichette non sono consigliate.

Etichetta Descrizione
goog-dataproc-cluster-name Nome del cluster specificato dall'utente
goog-dataproc-cluster-uuid ID cluster univoco
goog-dataproc-location Endpoint del cluster a livello di regione Dataproc

Puoi utilizzare queste etichette applicate automaticamente in molti modi, tra cui:

Passaggi successivi