Etiquetas de usuario de Cloud Dataproc

Puedes aplicar etiquetas de usuario a recursos de trabajo y clúster de Cloud Dataproc para agrupar recursos y operaciones relacionadas a fin de filtrar y crear listas más adelante. Asocias etiquetas con recursos cuando estos se crean (en la creación de clústeres o envío de trabajos) con la herramienta de línea de comandos de gcloud del SDK de Google Cloud, Google Cloud Platform Console o la API de REST de Cloud Dataproc. Una vez que el recurso se asocia con una etiqueta, esta se propaga a las operaciones realizadas en el recurso (creación, actualización, actualización para parches o eliminación de clústeres; envío, actualización, cancelación o eliminación de trabajos), lo que te permite filtrar y crear listas de clústeres, trabajos y operaciones por etiqueta.

Semántica y requisitos de etiquetas

Las etiquetas son pares key:value de la string. Las etiquetas de Cloud Dataproc comparten características de otras etiquetas de recursos de Google Cloud Platform (las excepciones* se muestran abajo):

  • Las claves y valores de las etiquetas no pueden tener más de 63 caracteres.
  • Las claves y valores de las etiquetas solo pueden contener letras minúsculas, números, guiones bajos, guiones y caracteres internacionales.
  • Las claves y valores de las etiquetas no pueden exceder los 128 bytes de tamaño.
  • Las claves de las etiquetas deben comenzar con una letra.
  • Las claves de las etiquetas deben ser únicas dentro de un tipo de recurso (operación, clúster o trabajo).
  • Cada recurso de Cloud Dataproc puede tener hasta 32 etiquetas (*otros recursos de Google Cloud Platform pueden asociarse con hasta 64 etiquetas).
  • Los recursos de Cloud Dataproc no tienen etiquetas predeterminadas.
  • Cloud Dataproc administra de manera automática algunas etiquetas del sistema mediante el prefijo goog-dataproc-.

Etiquetas aplicadas de manera automática

Cuando creas o actualizas un clúster, Cloud Dataproc aplica de forma automática múltiples etiquetas al clúster y a sus recursos. Por ejemplo, Cloud Dataproc aplica etiquetas a las máquinas virtuales, los discos persistentes y los aceleradores. Las etiquetas aplicadas de forma automática tienen un prefijo goog-dataproc especial.

Puedes usar estas etiquetas de muchas maneras, incluidas las siguientes:

Las siguientes etiquetas goog-dataproc se aplican de manera automática a recursos de Cloud Dataproc. Cualquier valor que proporciones para las etiquetas goog-dataproc reservadas en la creación del clúster anularán el valor proporcionado de manera automática. Por esta razón, no se recomienda que proporciones tus propios valores para estas etiquetas.

Etiqueta Descripción
goog-dataproc-cluster-name Nombre del clúster especificado por el usuario.
goog-dataproc-cluster-uuid ID de clúster único.
goog-dataproc-location Extremo regional de clúster de Cloud Dataproc.

Crea y usa etiquetas de Cloud Dataproc

Comando de gcloud

Puedes especificar una o más etiquetas para que se apliquen a un clúster o trabajo de Cloud Dataproc al momento de su creación o envío con la herramienta de línea de comandos de gcloud.

gcloud dataproc clusters create args --labels env=prod,customer=acme
gcloud dataproc jobs submit args --labels env=prod,customer=acme
Una vez que se creó el clúster o trabajo de Cloud Dataproc, puedes actualizar las etiquetas asociadas con el recurso mediante la herramienta de línea de comandos de gcloud.
gcloud dataproc clusters update args --update-labels env=prod,customer=acme
gcloud dataproc jobs update args --update-labels env=prod,customer=acme
De manera similar, puedes usar la herramienta de línea de comandos de gcloud para filtrar los recursos de Cloud Dataproc por etiqueta a través de una expresión de filtro con el siguiente formato: labels.<key=value>
gcloud dataproc clusters list --filter "status.state=ACTIVE AND labels.env=prod"
gcloud dataproc jobs list --filter "status.state=ACTIVE AND labels.customer=acme"
Consulta la documentación de las API de clusters.list y jobs.list de Cloud Dataproc para obtener más información sobre cómo escribir una expresión de filtro.

API de REST

Las etiquetas pueden adjuntarse a recursos de Cloud Dataproc a través de la API de REST de Cloud Dataproc. Las API de clusters.create y jobs.submit pueden usarse para adjuntar etiquetas a un clúster o trabajo al momento de su creación o envío. Las API de clusters.patch y jobs.patch pueden usarse para editar etiquetas luego de que se creó el recurso. A continuación, se muestra el cuerpo JSON de una solicitud cluster.create que adjunta la etiqueta key1:value al clúster.

{
"clusterName": "cluster-1",
"projectId": "my-project",
"config": {
"configBucket": "",
"gceClusterConfig": {
  "networkUri": ".../networks/default",
  "zoneUri": ".../zones/us-central1-f"
},
"masterConfig": {
  "numInstances": 1,
  "machineTypeUri": "..../machineTypes/n1-standard-4",
  "diskConfig": {
    "bootDiskSizeGb": 500,
    "numLocalSsds": 0
  }
},
"workerConfig": {
  "numInstances": 2,
  "machineTypeUri": "...machineTypes/n1-standard-4",
  "diskConfig": {
    "bootDiskSizeGb": 500,
    "numLocalSsds": 0
  }
}
},
"labels": {
"key1": "value1"
}
}
Las API de clusters.list y jobs.list pueden usarse para crear listas de recursos que coinciden con un filtro específico mediante el siguiente formato: labels.<key=value>. A continuación, se muestra un ejemplo de una solicitud HTTPS GET a la API de clusters.list de Cloud Dataproc que especifica un filtro de etiqueta key=value. El emisor inserta project, region, un filtro label-key y label-value, y una api-key. Ten en cuenta que esta solicitud de ejemplo está dividida en dos líneas para que se pueda leer con mayor facilidad.
GET https://dataproc.googleapis.com/v1/projects/project/regions/region/clusters?
filter=labels.label-key=label-value&key=api-key
Consulta la documentación de las API de clusters.list y jobs.list de Cloud Dataproc para obtener más información sobre cómo escribir una expresión de filtro.

Console

Puedes especificar un conjunto de etiquetas para que se apliquen a un recurso de Cloud Dataproc al momento de su creación o envío con GCP Console. Debajo se muestra un ejemplo de la creación de una etiqueta para asociar con un clúster de Cloud Dataproc desde la página Cloud Dataproc→Create a cluster (Crea un clúster).

Aquí hay un ejemplo de la creación de una etiqueta para asociar con un trabajo de Cloud Dataproc desde la página Cloud Dataproc→Submit a job (Envía un trabajo).

Una vez que se creó un recurso de Cloud Dataproc, puedes actualizar las etiquetas asociadas con él. Para actualizar las etiquetas, primero debes hacer clic en SHOW INFO PANEL (MOSTRAR PANEL DE INFORMACIÓN) en la esquina superior izquierda de la página. Este es un ejemplo de la página Cloud Dataproc→List clusters (Mostrar lista de clústeres).

Una vez que se muestra el panel de información, puedes actualizar las etiquetas de tus recursos de Cloud Dataproc. A continuación, se muestra un ejemplo de la actualización de etiquetas para un clúster de Cloud Dataproc.

También es posible actualizar etiquetas para múltiples elementos en una operación. En este ejemplo, las etiquetas se actualizan para múltiples trabajos de Cloud Dataproc al mismo tiempo.

Las etiquetas te permiten filtrar los recursos de Cloud Dataproc que se muestran en las páginas Cloud Dataproc→List clusters y Cloud Dataproc→List jobs (Mostrar lista de trabajos). En la parte superior de la página, puedes usar el patrón de búsqueda labels.<labelname>=<value> para filtrar los recursos por una etiqueta.

Pasos siguientes

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Documentación de Cloud Dataproc
¿Necesitas ayuda? Visita nuestra página de asistencia.