Pode aplicar etiquetas de utilizador a recursos de tarefas e clusters do Dataproc para agrupar recursos e operações relacionadas para filtragem e listagem posteriores. Associa etiquetas a recursos quando o recurso é criado, na criação do cluster ou no envio de tarefas. Assim que um recurso estiver associado a uma etiqueta, a etiqueta é propagada para as operações realizadas no recurso: criação, atualização, aplicação de patch ou eliminação de clusters; envio, atualização, cancelamento ou eliminação de tarefas, o que lhe permite filtrar e listar clusters, tarefas e operações por etiqueta.
Também pode adicionar etiquetas a recursos do Compute Engine associados a recursos do cluster, como instâncias de máquinas virtuais e discos.
O que são etiquetas?
Uma etiqueta é um par de chave-valor que pode atribuir a Google Cloud clusters e tarefas do Dataproc. Ajudam a organizar estes recursos e a gerir os custos em grande escala, com a granularidade de que precisa. Pode anexar uma etiqueta a cada recurso e, em seguida, filtrar os recursos com base nas respetivas etiquetas. As informações sobre as etiquetas são encaminhadas para o sistema de faturação que lhe permite discriminar os encargos faturados por etiqueta. Com os relatórios de faturação integrados, pode filtrar e agrupar os custos por etiquetas de recursos. Também pode usar etiquetas para consultar exportações de dados de faturação.
Requisitos para etiquetas
As etiquetas aplicadas a um recurso têm de cumprir os seguintes requisitos:
- Cada recurso pode ter até 64 etiquetas.
- Cada etiqueta tem de ser um par chave-valor.
- As chaves têm um comprimento mínimo de 1 caráter e um comprimento máximo de 63 carateres, e não podem estar vazias. Os valores podem estar vazios e ter um comprimento máximo de 63 carateres.
- As chaves e os valores só podem conter letras minúsculas, carateres numéricos, sublinhados e travessões. Todos os carateres têm de usar a codificação UTF-8, e são permitidos carateres internacionais. As chaves têm de começar com uma letra minúscula ou um caráter internacional.
- A parte da chave de uma etiqueta tem de ser exclusiva num único recurso. No entanto, pode usar a mesma chave com vários recursos.
Estes limites aplicam-se à chave e ao valor de cada etiqueta, bem como aos recursos Google Cloud individuais que têm etiquetas. Não existe um limite para o número de etiquetas que pode aplicar a todos os recursos num projeto.
Utilizações comuns das etiquetas
Seguem-se alguns exemplos de utilização comuns das etiquetas:
Etiquetas de equipa ou centro de custos: adicione etiquetas com base na equipa ou no centro de custos para distinguir clusters e tarefas do Dataproc pertencentes a diferentes equipas (por exemplo,
team:research
eteam:analytics
). Pode usar este tipo de etiqueta para contabilidade de custos ou orçamentação.Etiquetas de componentes: por exemplo,
component:redis
,component:frontend
,component:ingest
ecomponent:dashboard
.Etiquetas de ambiente ou fase: por exemplo,
environment:production
eenvironment:test
.Etiquetas de estado: por exemplo,
state:active
,state:readytodelete
estate:archive
.Etiquetas de propriedade: usadas para identificar as equipas responsáveis pelas operações, por exemplo:
team:shopping-cart
.
Não recomendamos a criação de um grande número de etiquetas únicas, como para carimbos de data/hora ou valores individuais para cada chamada da API. O problema desta abordagem é que, quando os valores mudam frequentemente ou com chaves que desorganizam o catálogo, torna-se difícil filtrar e criar relatórios sobre os recursos de forma eficaz.
Etiquetas e marcadores
As etiquetas podem ser usadas como anotações consultáveis para recursos, mas não podem ser usadas para definir condições nas políticas. As etiquetas oferecem uma forma de permitir ou negar condicionalmente políticas com base no facto de um recurso ter uma etiqueta específica, oferecendo um controlo detalhado sobre as políticas. Para mais informações, consulte a Vista geral das etiquetas.
Crie e use etiquetas do Dataproc
Comando gcloud
Pode especificar uma ou mais etiquetas a aplicar a um cluster ou a uma tarefa do Dataproc no momento da criação ou do envio através da CLI Google Cloud.
gcloud dataproc clusters create args --labels environment=production,customer=acme
gcloud dataproc jobs submit args --labels environment=production,customer=acme
Depois de criar um cluster ou uma tarefa do Dataproc, pode atualizar as etiquetas associadas a esse recurso através da CLI Google Cloud.
gcloud dataproc clusters update args --update-labels environment=production,customer=acme
gcloud dataproc jobs update args --update-labels environment=production,customer=acme
Da mesma forma, pode usar a CLI Google Cloud para filtrar recursos do Dataproc por etiqueta usando uma expressão de filtro no seguinte formato: labels.<key=value>
.
gcloud dataproc clusters list \ --region=region \ --filter="status.state=ACTIVE AND labels.environment=production"
gcloud dataproc jobs list \ --region=region \ --filter="status.state=ACTIVE AND labels.customer=acme"
Consulte a documentação da API Dataproc para obter mais informações sobre como escrever uma expressão de filtro: clusters.list e jobs.list.
API REST
As etiquetas podem ser anexadas a recursos do Dataproc através da
API REST do Dataproc. As APIs clusters.create e jobs.submit podem ser usadas para anexar etiquetas a um cluster ou a uma tarefa no momento da criação ou do envio.
As APIs clusters.patch e jobs.patch podem ser usadas para editar etiquetas depois de o recurso ter sido criado. Segue-se o corpo JSON de um pedido cluster.create que inclui a anexação de uma etiqueta key1:value
ao cluster.
{ "clusterName":"cluster-1", "projectId":"my-project", "config":{ "configBucket":"", "gceClusterConfig":{ "networkUri":".../networks/default", "zoneUri":".../zones/us-central1-f" }, "masterConfig":{ "numInstances":1, "machineTypeUri":"..../machineTypes/n1-standard-4", "diskConfig":{ "bootDiskSizeGb":500, "numLocalSsds":0 } }, "workerConfig":{ "numInstances":2, "machineTypeUri":"...machineTypes/n1-standard-4", "diskConfig":{ "bootDiskSizeGb":500, "numLocalSsds":0 } } }, "labels":{ "key1":"value1" } }
As APIs clusters.list
e jobs.list
podem ser usadas para listar recursos que correspondam a um filtro especificado, usando o seguinte formato: labels.<key=value>
.
Segue-se um exemplo de um pedido HTTPS GET da API Dataproc clusters.list que especifica um filtro de etiqueta key=value
. A pessoa que está a ligar insere project
, region
, um filtro label-key
e label-value
, e um api-key
. Tenha em atenção que este pedido de exemplo está dividido em duas linhas para facilitar a leitura.
GET https://dataproc.googleapis.com/v1/projects/project/regions/region/clusters? filter=labels.label-key=label-value&key=api-key
Consulte a documentação da API Dataproc para obter mais informações sobre como escrever uma expressão de filtro: clusters.list e jobs.list.
Consola
Pode especificar um conjunto de etiquetas a adicionar a um recurso do Dataproc no momento da criação ou do envio através da Google Cloud consola.
- Adicione etiquetas a um cluster a partir da secção Etiquetas do painel Personalizar cluster da página Criar um cluster do Dataproc.
- Adicione etiquetas a uma tarefa a partir da página Enviar uma tarefa do Dataproc.
Depois de criar um recurso do Dataproc, pode atualizar as etiquetas associadas a esse recurso. Para atualizar as etiquetas, tem de clicar primeiro em SHOW INFO PANEL
na parte superior esquerda da página. Este é um exemplo da página Dataproc→List clusters.

Assim que o painel de informações for apresentado, pode atualizar as etiquetas dos seus recursos do Dataproc. Segue-se um exemplo de atualização de etiquetas para um cluster do Dataproc.
Também é possível atualizar etiquetas para vários itens numa única operação. Neste exemplo, as etiquetas estão a ser atualizadas para várias tarefas do Dataproc ao mesmo tempo.
As etiquetas permitem-lhe filtrar os recursos do Dataproc apresentados nas páginas [Dataproc→List clusters](https://console.cloud.google.com/dataproc/clusters) e [Dataproc→List jobs](https://console.cloud.google.com/dataproc/jobs). Na parte superior da página, pode usar o padrão de pesquisa `labels.
Etiquetas aplicadas automaticamente
Quando cria ou atualiza um cluster, o Dataproc aplica automaticamente várias etiquetas ao cluster e aos recursos do cluster. Por exemplo, o Dataproc aplica etiquetas a máquinas virtuais, discos persistentes e aceleradores quando é criado um cluster. As etiquetas aplicadas automaticamente têm um prefixo goog-dataproc
especial.
As seguintes etiquetas goog-dataproc
são aplicadas automaticamente aos recursos do Dataproc. Todos os valores que fornecer para as etiquetas goog-dataproc
reservadas no momento da criação do cluster substituem os valores fornecidos automaticamente. Por este motivo, não recomendamos que forneça os seus próprios valores para estas etiquetas.
Etiqueta | Descrição |
---|---|
goog-dataproc-cluster-name |
Nome do cluster especificado pelo utilizador |
goog-dataproc-cluster-uuid |
ID do cluster exclusivo |
goog-dataproc-location |
Ponto final do cluster regional do Dataproc |
Pode usar estas etiquetas aplicadas automaticamente de várias formas, incluindo:
- Pesquisar e filtrar recursos do Dataproc
- Filtrar dados de faturação para calcular os custos do Dataproc
O que se segue?
Saiba como criar e atualizar etiquetas para projetos através do Resource Manager.
Saiba como organizar recursos com etiquetas.