Comparte datos sensibles con salas limpias de datos

Las salas limpias de datos proporcionan un entorno con seguridad mejorada en el que varias partes pueden compartir, unir y analizar sus recursos de datos sin mover ni revelar los datos subyacentes.

Las salas limpias de datos de BigQuery se basan en la plataforma Analytics Hub. Si bien los intercambios de datos de Analytics Hub estándar proporcionan una forma de compartir datos a través de los límites organizacionales a gran escala, las salas limpias de datos te ayudan a abordar casos de uso compartido de datos sensibles y protegidos. Las salas limpias de datos proporcionan controles de seguridad adicionales para ayudar a proteger los datos subyacentes y aplicar reglas de análisis que define el propietario de los datos.

Los siguientes son casos de uso principales:

  • Planificación de campañas y estadísticas de público. Permite que dos partes (como vendedores y compradores) mezclen datos de origen y mejoren el enriquecimiento de datos de forma centrada en la privacidad.
  • Medición y atribución. Haz coincidir los datos de rendimiento de los clientes y de los medios para comprender mejor la eficacia de los esfuerzos de marketing y tomar decisiones empresariales más fundamentadas.
  • Activación. Combina los datos del cliente con los datos de otras partes para enriquecer la comprensión de los clientes, lo que mejora las capacidades de segmentación y la activación de medios más eficaz.

También existen varios casos de uso de salas limpias de datos más allá de la industria de marketing:

  • Venta minorista y bienes de consumo envasados (CPG). Optimiza las actividades de marketing y promocionales a través de la combinación de datos de puntos de venta de minoristas y datos de marketing de empresas de CPG.
  • Servicios financieros. Mejora la detección de fraudes a través de la combinación de datos sensibles de otros organismos financieros y gubernamentales. Crea la puntuación de riesgo de crédito a través de la incorporación de datos del cliente en varios bancos.
  • Servicios de salud. Comparte datos entre investigadores farmacéuticos y médicos para saber cómo reaccionan los pacientes a los tratamientos.
  • Cadena de suministro, logística y transporte. Combina los datos de los proveedores y los especialistas en marketing para obtener un panorama completo del rendimiento de los productos durante su ciclo de vida.

Funciones

Existen tres roles principales en las salas limpias de datos de BigQuery:

  • Propietario de la sala limpia de datos: es un usuario que administra los permisos, la visibilidad y la membresía de una o más salas limpias de datos dentro de un proyecto. Este rol es análogo al rol de administrador de Analytics Hub.
  • Colaborador de datos: es un usuario que asigna el propietario de la sala limpia de datos para publicar datos en una sala limpia de datos. En muchos casos, el propietario de una sala limpia de datos también es un colaborador de datos. Este rol es análogo al rol de publicador de Analytics Hub.
  • Suscriptor: es un usuario que el propietario de la sala limpia de datos asigna para suscribirse a los datos publicados en una sala limpia de datos, lo que le permite ejecutar consultas sobre los datos. Este rol es similar a una combinación del rol de suscriptor de Analytics Hub y propietario de la suscripción a Analytics Hub. Los suscriptores deben tener precios on demand o la edición Enterprise Plus.

Arquitectura

Las salas limpias de datos de BigQuery se compilan en un modelo de publicación y suscripción de modelos de datos de BigQuery. La arquitectura de BigQuery proporciona una separación entre el procesamiento y el almacenamiento, lo que permite que los colaboradores de datos compartan datos sin tener que hacer varias copias de los datos. En la siguiente imagen, se muestra una descripción general de la arquitectura de salas limpias de datos de BigQuery:

Los colaboradores de datos publican datos en la sala limpia de datos, que los suscriptores pueden consultar con filtros de privacidad.

Sala limpia de datos

Una sala limpia de datos es un entorno para compartir datos sensibles en el que se evita el acceso sin procesar y se aplican restricciones de consulta. Solo los usuarios o grupos que se agregan como suscriptores a una sala limpia de datos pueden suscribirse a los datos compartidos. Los propietarios de las salas limpias de datos pueden crear tantas salas limpias de datos como deseen en Analytics Hub.

Recursos compartidos

Un recurso compartido es la unidad de uso compartido de datos en una sala limpia de datos. El el recurso debe ser una tabla o vista de BigQuery. Como colaborador de datos, debes crear o usar un recurso de BigQuery existente en tu proyecto que deseas compartir con tus suscriptores.

Fichas

Se crea una ficha cuando un colaborador de datos agrega datos a una sala limpia de datos. Contiene una referencia al recurso compartido de datos compartido del colaborador de datos, junto con información descriptiva que ayuda a los suscriptores a usar los datos. Como colaborador de datos, puedes crear una ficha y, además, incluir información, como una descripción, consultas de muestra y vínculos a la documentación de tus suscriptores.

Conjuntos de datos vinculados

Un conjunto de datos vinculado es un conjunto de datos de BigQuery de solo lectura que funciona como un vínculo simbólico a todos los datos en una sala limpia de datos. Cuando los suscriptores consultan recursos en un conjunto de datos vinculado, se muestran los datos de los recursos compartidos, lo que satisface las reglas de análisis establecidas por el colaborador de datos. Como suscriptor, se crea un conjunto de datos vinculado dentro de tu proyecto cuando te suscribes a una sala limpia de datos. No se crea una copia de los datos y los suscriptores no pueden ver ciertos metadatos, como las definiciones de vistas.

Reglas de análisis

Como colaborador de datos, configuras reglas de análisis en los recursos que compartes en la sala limpia de datos. Las reglas de análisis evitan el acceso sin procesar a los datos subyacentes y aplican restricciones de consulta. Por ejemplo, las salas limpias de datos admiten la regla de análisis de umbral de agregación, que permite a los suscriptores analizar datos solo a través de consultas de agregación.

Controles de salida de datos

Los controles de salida de datos se habilitan automáticamente para evitar que los suscriptores copien y exporten datos sin procesar desde una sala limpia de datos. Los colaboradores de datos pueden configurar controles adicionales para evitar la copia y la exportación de los resultados de consultas que obtienen los suscriptores.

Limitaciones

Las salas limpias de datos de BigQuery tienen las siguientes limitaciones:

  • Puedes establecer reglas de análisis solo en las vistas, no en las tablas ni en las vistas materializadas. Debido a esta limitación, si un colaborador de datos comparte directamente tablas o vistas materializadas (o vistas sin reglas de análisis) en una sala limpia de datos, los suscriptores tienen acceso sin procesar a los datos de esos recursos.
  • Como las salas limpias de datos se compilan en la plataforma Analytics Hub, se aplican todas las limitaciones de Analytics Hub.
  • Las salas limpias de datos solo están disponibles en las regiones de Analytics Hub.
  • Como suscriptor, no puedes buscar recursos compartidos en Dataplex o Data Catalog.
  • Como suscriptor, no puedes consultar vistas INFORMATION_SCHEMA en los conjuntos de datos vinculados.
  • Como colaborador de datos, no puedes publicar un conjunto de datos completo directamente en una sala limpia de datos.
  • Como colaborador de datos, no puedes publicar modelos ni rutinas en una sala limpia de datos.
  • Puedes agregar un máximo de 100 recursos compartidos a una sala limpia de datos. Si necesitas aumentar este límite, comunícate con bq-dcr-feedback@google.com.

Antes de comenzar

Otorga roles de Identity and Access Management (IAM) que otorguen a los usuarios los permisos necesarios para realizar cada tarea de este documento, habilita la API de Analytics Hub y asigna el rol de administrador de Analytics Hub al propietario sala limpia de datos (el usuario que creará la sala limpia de datos).

Permisos necesarios

Para obtener los permisos que necesitas para usar salas limpias de datos, pídele a tu administrador que te otorgue el rol de IAM de editor de datos de BigQuery (roles/bigquery.dataEditor). Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para usar las salas limpias de datos. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para usar salas limpias de datos:

  • serviceUsage.services.get
  • serviceUsage.services.list
  • serviceUsage.services.enable

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre los roles y permisos de IAM en BigQuery, consulta Introducción a IAM.

Habilita la API de Analytics Hub

Para habilitar la API de Analytics Hub, selecciona una de las siguientes opciones:

Console

Abre la página de la API de Analytics Hub para tu proyecto de Google Cloud y habilítala.

Habilita la API de Analytics Hub

bq

Ejecuta el comando gcloud services enable:

gcloud services enable analyticshub.googleapis.com

Una vez que habilites la API de Analytics Hub, podrás acceder a la página Analytics Hub.

Asigna el rol de administrador de Analytics Hub

El propietario de la sala limpia de datos debe tener el rol de administrador de Analytics Hub (roles/analyticshub.admin). Para obtener información sobre cómo otorgar este rol a otros usuarios, consulta Crea administradores de Analytics Hub.

Flujos de trabajo del propietario de la sala limpia de datos

Como propietario de una sala limpia de datos, puedes hacer lo siguiente:

  • Crear una sala limpia de datos.
  • Actualizar las propiedades de la sala limpia de datos.
  • Borrar una sala de limpieza de datos.
  • Administrar colaboradores de datos.
  • Administrar suscriptores.
  • Compartir una sala limpia de datos.

Permisos adicionales del propietario de la sala limpia de datos

Debes tener el rol de administrador de Analytics Hub (roles/analyticshub.admin) en tu proyecto para realizar tareas de propietario de la sala limpia de datos. Este rol también se puede asignar a nivel de carpeta o de organización, si corresponde.

Crea una sala limpia de datos

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en Crear sala limpia (Create clean room).

  3. En Proyecto (Project), selecciona el proyecto para la sala limpia de datos. La API de Analytics Hub debe estar habilitada para el proyecto.

  4. Especifica la ubicación, el nombre, el contacto principal, el ícono (opcional) y la descripción de la sala limpia de datos. Solo los recursos que se encuentran en la misma región que la sala limpia datos se pueden enumerar en ella.

  5. Haz clic en Crear sala limpia (Create clean room).

  6. Opcional: En la sección Permisos de la sala limpia (Clean Room Permissions), agrega otros propietarios de salas limpias de datos, colaboradores o suscriptores de datos.

    Crea un panel de sala limpia de datos.

API

Usa el método projects.locations.dataExchanges.create y establece el entorno de uso compartido en dcrExchangeConfig.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.create con el comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges?data_exchange_id=CLEAN_ROOM_ID -d
  '{
    display_name: "CLEAN_ROOM_NAME",
    sharing_environment_config: {dcr_exchange_config: {}}
  }'

Reemplaza lo siguiente:

  • PROJECT_ID: El ID de tu proyecto
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • CLEAN_ROOM_NAME: El nombre visible de tu sala limpia de datos

Actualiza una sala limpia de datos

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos que deseas actualizar.

  3. En la pestaña Detalles, haz clic en Edit clean room details.

  4. Actualiza el nombre, el contacto principal, el ícono o la descripción de la sala limpia de datos según sea necesario.

  5. Haz clic en Guardar.

API

Usa el método projects.locations.dataExchanges.patch y establece el entorno de uso compartido en dcrExchangeConfig.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.patch con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X PATCH https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID?updateMask=displayName -d
'{
  display_name: "CLEAN_ROOM_NAME",
  sharing_environment_config: {dcr_exchange_config: {}}
}'

Reemplaza lo siguiente:

  • PROJECT_ID: El ID de tu proyecto
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • CLEAN_ROOM_NAME: El nombre visible de tu sala limpia de datos

Borra una sala limpia de datos

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. En la fila de la sala limpia de datos que deseas borrar, haz clic en Más acciones > Borrar.

  3. Para confirmar, ingresa delete y, luego, haz clic en Borrar. No puedes deshacer esta acción.

API

Usa el método projects.locations.dataExchanges.delete y establece el entorno de uso compartido en dcrExchangeConfig.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.delete con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X DELETE https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges?data_exchange_id=CLEAN_ROOM_ID

Reemplaza lo siguiente:

  • PROJECT_ID: El ID de tu proyecto
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • CLEAN_ROOM_NAME: El nombre visible de tu sala limpia de datos

Cuando borras una sala limpia de datos, se borrarán todas las fichas que contiene. Sin embargo, los recursos compartidos y los vinculados no se borran. Los conjuntos de datos vinculados se desvinculan de los conjuntos de datos de origen, por lo que las consultas de los recursos en la sala limpia de datos comenzarán a fallar para los suscriptores.

Administra colaboradores de datos

Como propietario de una sala limpia de datos, administras qué usuarios pueden agregar datos a tus salas limpias de datos (los colaboradores de datos). Para permitir que un usuario agregue datos a una sala limpia de datos, otórgale el rol de publicador de Analytics Hub (roles/analyticshub.publisher) en una sala limpia de datos específica:

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos a la que deseas otorgar permisos.

  3. En la pestaña Detalles, haz clic en Establecer permisos.

  4. Haz clic en Agregar principal.

  5. En Principales nuevas, ingresa los nombres de usuario o los correos electrónicos de los colaboradores de datos que agregas.

  6. En Seleccionar un rol, selecciona Analytics Hub > Publicador de Analytics Hub.

  7. Haz clic en Guardar.

Puedes borrar y actualizar los colaboradores de datos en cualquier momento; para ello, haz clic en Establecer permisos.

API

Usa el método projects.locations.dataExchanges.setIamPolicy.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.setIamPolicy con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID:setIamPolicy -d
'{
  "policy": {
    "bindings": [
      {
        "members": [
          "my-service-account@my-project.iam.gserviceaccount.com"
        ],
        "role": "roles/analyticshub.publisher"
      }
    ]
  }
}'

La política del cuerpo de la solicitud debe cumplir con la estructura de una política.

Puedes otorgar el rol de publicador de Analytics Hub para un proyecto completo desde la página de IAM, que le otorga a un usuario permiso para agregar datos a cualquier sala limpia de datos en un proyecto. Sin embargo, no recomendamos esta acción, ya que podría provocar que los usuarios tengan un acceso demasiado permisivo.

Administra suscriptores

Como propietario de una sala limpia de datos, administras qué usuarios pueden suscribirse a tus salas limpias de datos (tus suscriptores). Para permitir que un usuario se suscriba a una sala limpia de datos, otórgale los roles de suscriptor de Analytics Hub (roles/analyticshub.subscriber) y propietario de la suscripción a Analytics Hub (roles/analyticshub.subscriptionOwner) en una sala limpia de datos específica:

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos a la que deseas otorgar permisos.

  3. En la pestaña Detalles, haz clic en Establecer permisos.

  4. Haz clic en Agregar principal.

  5. En Principales nuevas, ingresa los nombres de usuario o los correos electrónicos de los suscriptores que agregarás.

  6. En Seleccionar un rol, selecciona Analytics Hub > Suscriptor de Analytics Hub.

  7. Haz clic en Agregar otro rol.

  8. En Seleccionar un rol, selecciona Analytics Hub > Propietario de la suscripción a Analytics Hub.

  9. Haz clic en Guardar.

Puedes borrar y actualizar suscriptores en cualquier momento; para ello, haz clic en Establecer permisos.

API

Usa el método projects.locations.dataExchanges.setIamPolicy.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.setIamPolicy con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID:setIamPolicy -d
'{
  "policy": {
    "bindings": [
      {
        "members": [
          "user:mike@example.com"
        ],
        "role": "roles/analyticshub.subscriptionOwner"
      },
      {
        "members": [
          "user:mike@example.com"
        ],
        "role": "roles/analyticshub.subscriber"
      }
    ]
  }
}'

La política del cuerpo de la solicitud debe cumplir con la estructura de una política.

Puedes otorgar los roles de suscriptor de Analytics Hub y propietario de la suscripción a Analytics Hub para un proyecto completo desde la página de IAM, lo que le da a un usuario permiso para suscribirse a cualquier sala limpia de datos en un proyecto. Sin embargo, no recomendamos esta acción, ya que podría provocar que los usuarios tengan un acceso demasiado permisivo.

Comparte una sala limpia de datos

Puedes compartir directamente una sala limpia de datos con los suscriptores:

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. En la fila de la sala limpia de datos que deseas compartir, haz clic en Más acciones > Copiar vínculo para compartir.

  3. Comparte el vínculo copiado con los suscriptores para que puedan ver y suscribirse a la sala limpia de datos.

Flujos de trabajo de los colaboradores de datos

Como colaborador de datos, puedes hacer lo siguiente:

  • Crear una ficha para agregar datos a una sala limpia de datos.
  • Actualizar una ficha.
  • Borrar una ficha.
  • Compartir una sala limpia de datos.
  • Supervisar las fichas.

Permisos adicionales de los colaboradores de datos

Para realizar tareas de colaborador de datos, debes tener el rol de publicador de Analytics Hub (roles/analyticshub.publisher) en una sala limpia de datos.

Además, necesitas el permiso bigquery.datasets.link para los conjuntos de datos que contienen los recursos que deseas enumerar en una sala limpia de datos. También necesitas el permiso resourcemanager.organization.get si deseas ver las salas limpias de datos en tu organización que no están en tu proyecto actual.

Crea una ficha (agrega datos)

Para preparar datos con reglas de análisis y publicarlos en una sala limpia de datos como una ficha, haz lo siguiente:

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos en la que deseas crear una ficha.

    Si eres en una organización diferente a la del propietario de la sala limpia de datos y la sala limpia de datos no es visible para ti, pídele un vínculo directo al propietario de la sala limpia de datos.

  3. Haz clic en Add Data:

  4. En Seleccionar conjunto de datos y Nombre de la tabla/vista, ingresa la tabla o vista que deseas enumerar en la sala limpia de datos y su conjunto de datos correspondiente. Agregarás reglas de análisis para evitar el acceso sin procesar a estos datos subyacentes en unos pocos pasos.

  5. Selecciona las columnas del recurso que quieres publicar.

  6. Establece el nombre de la vista, el contacto principal y la descripción (opcional) de la ficha.

  7. Haz clic en Siguiente.

  8. Elige una regla de análisis para tu ficha y configura los detalles.

  9. Configura los controles de salida de datos para la ficha.

  10. Haz clic en Siguiente.

  11. Revisa los datos y la regla de análisis que agregas a la sala limpia de datos.

  12. Haz clic en Add Data: Se crea una vista para tus datos y se agrega como una ficha a la sala limpia de datos. No se agrega la tabla o vista de origen en sí.

API

Usa el método projects.locations.dataExchanges.listings.create.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.listings.create con el comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X POST https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings?listingId=LISTING_ID -d
  '{"bigqueryDataset":{"dataset":"projects/PROJECT_ID/datasets/DATASET_ID","selectedResources":[{"table":"projects/PROJECT_ID/datasets/DATASET_ID/tables/VIEW_ID"}],},"displayName":LISTING_NAME"}'

Reemplaza lo siguiente:

  • DCR_PROJECT_ID: El ID del proyecto en el que se creó la sala limpia de datos
  • PROJECT_ID: El ID del proyecto en el que se encontraba el conjunto de datos de origen.
  • DATASET_ID: El ID de tu conjunto de datos de origen
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • LISTING_ID: El ID de tu ficha
  • LISTING_NAME: El nombre de tu ficha
  • VIEW_ID: El ID de tu vista. La vista que agregues a una sala limpia de datos debe ser una vista autorizada que esté configurada con reglas de análisis.

Si enumeras un recurso en una sala limpia de datos, otorgas a todos los suscriptores de la sala limpia de datos actuales y futuros acceso a los datos de tu recurso compartido.

Si intentas crear una ficha con un recurso compartido que no tiene una regla de análisis, verás una advertencia que indica que los suscriptores podrán acceder a los datos sin procesar de ese recurso. Si confirmas que publicarás de forma intencional esos recursos sin reglas de análisis, aún puedes crear la ficha.

Si recibes el error Failed to save listing, asegúrate de tener los permisos necesarios para realizar tareas de colaborador de datos.

Actualiza una ficha

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos que contiene la ficha.

  3. En la fila de la ficha que deseas actualizar, haz clic en Más acciones > Editar ficha.

  4. Actualiza el contacto principal o la descripción según sea necesario.

  5. Haz clic en Siguiente.

  6. Actualiza la regla de análisis según sea necesario. Solo puedes actualizar los parámetros de la regla elegida. No puedes cambiar a una regla diferente.

  7. Haz clic en Siguiente.

  8. Revisa la ficha y haz clic en Agregar datos.

API

Usa el método projects.locations.dataExchanges.listings.patch.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.listings.patch con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X PATCH https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings/listingId=LISTING_ID?updateMask=displayName -d
'{"displayName":LISTING_NAME"}'

Reemplaza lo siguiente:

  • DCR_PROJECT_ID: El ID del proyecto en el que se creó la sala limpia
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • LISTING_ID: El ID de tu ficha
  • LISTING_NAME: El nombre de tu ficha

No puedes cambiar el recurso de origen ni los controles de salida de datos de una ficha después de crearla.

Borra una ficha

Console

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos que contiene la ficha.

  3. En la fila de la ficha que deseas borrar, haz clic en Más acciones > Borrar fichas.

  4. Para confirmar, ingresa delete y, luego, haz clic en Borrar. No puedes deshacer esta acción.

API

Usa el método projects.locations.dataExchanges.listings.delete.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.listings.delete con el comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X DELETE https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings?listingId=LISTING_ID

Reemplaza lo siguiente:

  • DCR_PROJECT_ID: El ID del proyecto en el que se creó la sala limpia
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • LISTING_ID: El ID de tu ficha

Cuando borras una ficha, no se borran los recursos compartidos ni los conjuntos de datos vinculados. Los conjuntos de datos vinculados se desvinculan de los conjuntos de datos de origen, por lo que las consultas de los datos en esa lista comenzarán a fallar para los suscriptores.

Comparte una sala limpia de datos

Puedes compartir directamente una sala limpia de datos con los suscriptores:

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. En la fila de la sala limpia de datos que deseas compartir, haz clic en Más acciones > Copiar vínculo para compartir.

  3. Comparte el vínculo copiado con los suscriptores para que puedan ver y suscribirse a la sala limpia de datos.

Supervisa las fichas

Puedes ver las métricas de uso en los conjuntos de datos de origen de los recursos que compartes en una sala limpia de datos si consultas la vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Para ver los suscriptores de tu ficha, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre visible de la sala limpia de datos.

  3. En la fila de una ficha que deseas ver, haz clic en Más acciones > Ver suscripciones.

Flujos de trabajo de los suscriptores

Un suscriptor puede ver una sala limpia de datos y suscribirse a ella. Suscribirse a una sala limpia de datos crea un conjunto de datos vinculado en el proyecto del suscriptor. Cada conjunto de datos vinculado tiene el mismo nombre que la sala limpia de datos.

No puedes suscribirte a una ficha específica dentro de una sala limpia de datos. Solo puedes suscribirte a la sala limpia de datos.

Permisos adicionales de suscriptor

Debes tener los roles de suscriptor de Analytics Hub (roles/analyticshub.subscriber) y propietario de la suscripción a Analytics Hub (roles/analyticshub.subscriptionOwner) en una sala limpia de datos para realizar tareas de suscriptor.

Además, necesitas el permiso bigquery.datasets.create en un proyecto para crear un conjunto de datos vinculado cuando te suscribes a una sala limpia.

Suscríbete a una sala limpia de datos

Suscribirse a una sala limpia de datos te brinda acceso de consulta a los datos en las fichas a través de la creación de un conjunto de datos vinculado en tu proyecto. Para suscribirte a una sala limpia de datos, haz lo siguiente:

Console

  1. En la consola de Google Cloud, ve a la página de BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, haz clic en Agregar.

  3. Selecciona Analytics Hub. Se abrirá una página de descubrimiento.

  4. Para mostrar las salas limpias de datos a las que tienes acceso, en la lista de filtros, selecciona Salas limpias.

  5. Haz clic en la sala limpia de datos a la que deseas suscribirte. Se abrirá una página de descripción de la sala limpia de datos.

  6. Haz clic en Suscribirse.

  7. Selecciona el proyecto de destino para la suscripción y haz clic en Suscribirse.

API

Usa el método projects.locations.dataExchanges.subscribe.

En el siguiente ejemplo, se muestra cómo llamar al método projects.locations.dataExchanges.subscribe con el comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/CLEAN_ROOM_ID:subscribe  --data '{"destination":"projects/SUBSCRIBER_PROJECT_ID/locations/LOCATION","subscription":"SUBSCRIPTION"}'

Reemplaza lo siguiente:

  • DCR_PROJECT_ID: El ID del proyecto en el que se creó la sala limpia
  • SUBSCRIBER_PROJECT_ID: El ID del proyecto del suscriptor
  • LOCATION: La ubicación de la sala limpia de datos
  • CLEAN_ROOM_ID: El ID de tu sala limpia de datos
  • SUBSCRIPTION: El nombre de tu suscripción

Un conjunto de datos vinculado ahora se agrega al proyecto que especificaste y está disponible para la consulta.

Como suscriptor, puedes editar algunos metadatos de los conjuntos de datos vinculados, como la descripción y las etiquetas. También puedes establecer permisos en tus conjuntos de datos vinculados. Sin embargo, los cambios en los conjuntos de datos vinculados no afectan a los conjuntos de datos de origen. Tampoco puedes ver las definiciones de vistas.

Los recursos que se encuentran en los conjuntos de datos vinculados son de solo lectura. Como suscriptor, no puedes editar datos ni metadatos de los recursos en conjuntos de datos vinculados. Tampoco puedes especificar permisos para recursos individuales dentro del conjunto de datos vinculado.

Para anular la suscripción a la sala limpia de datos, borra tu conjunto de datos vinculado.

Consulta datos en un conjunto de datos vinculado

Para consultar datos en un conjunto de datos vinculado, usa la sintaxis SELECT WITH AGGREGATION_THRESHOLD, que te permite ejecutar consultas en vistas aplicadas de análisis de reglas. Para ver un ejemplo de esta sintaxis, visita Consulta una vista aplicada de la regla de análisis del umbral de agregación.

Situación de ejemplo: análisis de atribución del anunciante y publicador

Un anunciante desea hacer un seguimiento de la eficacia de sus campañas de marketing. El anunciante tiene datos de origen sobre sus clientes, incluidos el historial de compras, los datos demográficos y los intereses. El publicador tiene datos de su sitio web, incluidos los anuncios que se mostraron a los visitantes y sus conversiones.

El anunciante y el publicador aceptan usar una sala limpia de datos para combinar datos y medir los resultados de sus campañas. En este caso, el publicador crea la sala limpia de datos y pone los datos a disposición del anunciante para realizar el análisis. El resultado es un informe de atribución que muestra al anunciante qué anuncios fueron más efectivos para generar ventas. Luego, el anunciante puede utilizar esta información para mejorar sus futuras campañas de marketing.

El anunciante y el publicador organizan la sala limpia de datos de BigQuery a través del siguiente proceso:

Creación de la sala limpia de datos (publicador)

  1. El propietario de una sala limpia de datos en la organización del publicador habilita la API de Analytics Hub en su proyecto de BigQuery y asigna al usuario A como propietario de la sala limpia de datos (administrador de Analytics Hub).
  2. El usuario A crea una sala limpia de datos llamada Campaign Analysis y le asigna los siguientes permisos:
    • Colaborador de datos (publicador de Analytics Hub): usuario B, un ingeniero de datos en la organización del publicador.
    • Suscriptor (suscriptor de Analytics Hub y propietario de la suscripción): usuario C, un analista de marketing en la organización del anunciante

Adición de datos a la sala limpia de datos (publicador)

  1. El usuario B crea una ficha nueva en la sala limpia de datos llamada Publisher Conversion Data. Como parte de la creación de una ficha, se crea una vista nueva con reglas de análisis de datos.

Suscripción a la sala limpia de datos (anunciante)

  1. El usuario C se suscribe a la sala limpia de datos, que crea un conjunto de datos vinculado para todas las fichas en la sala limpia de datos, incluida la ficha Publisher Conversion Data.
  2. El usuario C ahora puede ejecutar consultas de agregación para combinar los datos de este conjunto de datos vinculado a sus datos de origen para medir la eficacia de la campaña.

Resolución de entidades

Los casos de uso de las salas limpias de datos a menudo requieren la vinculación de entidades en los conjuntos de datos de colaboradores de datos y suscriptores que no incluyen un identificador común. Los suscriptores y los colaboradores de datos pueden representar los mismos registros de manera diferente en varios conjuntos de datos, ya sea porque los conjuntos de datos se originan en fuentes de datos diferentes o porque los conjuntos de datos usan identificadores de espacios de nombres diferentes.

Como parte de la preparación de los datos, la resolución de entidades en BigQuery hace lo siguiente:

  • Para los colaboradores de datos, anula el duplicado y resuelve los registros en sus recursos compartidos con los identificadores de un proveedor común de su elección. Este proceso permite la unión entre colaboradores.
  • Para los suscriptores, anula el duplicado y resuelve los registros en sus conjuntos de datos de origen y los vínculos a entidades en los conjuntos de datos de los colaboradores de datos. Este proceso permite uniones entre los conjuntos de datos de suscriptores y colaboradores de datos.

Para configurar la resolución de entidades con el proveedor de identidad que elijas, consulta Configura y usa la resolución de entidades en BigQuery.

Descubre los recursos de salas limpias de datos

Para encontrar todas las salas limpias de datos a las que tienes acceso, haz lo siguiente:

  • Para los propietarios y colaboradores de datos de las salas limpias de datos, en la consola de Google Cloud, ve a la página de Analytics Hub.

    Ir a Analytics Hub

    Se enumeran todas las salas limpias de datos a las que puedes acceder.

  • Para los suscriptores, haz lo siguiente:

    1. En la consola de Google Cloud, ve a la página de BigQuery.

      Ir a BigQuery

    2. En el panel Explorador, haz clic en Agregar.

    3. Selecciona Analytics Hub. Se abrirá una página de descubrimiento.

    4. Para mostrar las salas limpias de datos a las que tienes acceso, en la lista de filtros, selecciona Salas limpias.

Para encontrar todos los conjuntos de datos vinculados que crearon las salas limpias de datos en tu proyecto, ejecuta el siguiente comando en un entorno de línea de comandos:

PROJECT=PROJECT_ID \
for dataset in $(bq ls --project_id $PROJECT | tail +3); \
do [ "$(bq show -d --project_id $PROJECT $dataset | egrep LINKED)" ] \
&& echo $dataset; done

Reemplaza PROJECT_ID por el proyecto que contiene tus conjuntos de datos vinculados.

Precios

A los colaboradores de datos solo se les cobra por el almacenamiento de datos. A los suscriptores solo se les cobra por el procesamiento (análisis) cuando ejecutan consultas.

Los suscriptores deben tener precios on demand o la edición Enterprise Plus.

¿Qué sigue?