Introducción a Analytics Hub

Analytics Hub es una plataforma de intercambio de datos que te permite compartir datos y estadísticas a gran escala más allá de los límites de la organización con un framework de seguridad y privacidad sólido. Con Analytics Hub, puedes descubrir y acceder a una biblioteca de datos seleccionada por varios proveedores de datos. Esta biblioteca de datos también incluye conjuntos de datos proporcionados por Google.

Por ejemplo, con Analytics Hub puedes aumentar tus iniciativas de AA y estadísticas con conjuntos de datos de terceros y de Google.

Como usuario de Analytics Hub, puedes realizar las siguientes tareas:

  • Como publicador de Analytics Hub, puedes monetizar datos si los compartes con tu red de socio o dentro de tu propia organización en tiempo real. Las fichas te permiten compartir datos sin replicar los datos compartidos. Puedes compilar un catálogo de fuentes de datos listas para el análisis con permisos detallados que te permitan entregar datos a los públicos correctos. También puedes administrar las suscripciones y ver las métricas de uso de tus fichas.

  • Como suscriptor de Analytics Hub, puedes descubrir los datos que buscas, combinar datos compartidos con tus datos existentes y aprovechar las funciones integradas de BigQuery. Cuando te suscribes a una ficha, se crea un conjunto de datos vinculado o una suscripción a Pub/Sub vinculada en tu proyecto. Puedes administrar tus suscripciones con el recurso de suscripción, que almacena información relevante sobre el suscriptor y representa la conexión entre el publicador y el suscriptor.

  • Como visualizador de Analytics Hub, puedes explorar los conjuntos de datos a los que tienes acceso en Analytics Hub y solicitar al publicador que acceda a los datos compartidos.

  • Como administrador de Analytics Hub, puedes crear intercambios de datos que habiliten el uso compartido de datos y, luego, otorgar permisos a los publicadores y suscriptores de datos para acceder a estos intercambios.

Para obtener más información sobre los roles del usuario de Analytics Hub, consulta Configura los roles de Analytics Hub.

Arquitectura

Analytics Hub se basa en un modelo de publicación y suscripción de recursos de datos de Google Cloud, lo que permite compartir sin copias. Analytics Hub admite los siguientes recursos de Google Cloud:

  • Conjuntos de datos de BigQuery
  • Temas de Pub/Sub

Los flujos de trabajo de publicador y suscriptor en Analytics Hub se explican en detalle en las siguientes secciones.

Flujo de trabajo del publicador

En el siguiente diagrama, se describe cómo interactúan los publicadores con Analytics Hub:

Interacción entre los publicadores de Analytics Hub y Analytics Hub.
Figura 1. Flujo de trabajo del publicador de Analytics Hub.

En la Figura 1, se etiquetan las siguientes funciones: Conjunto de datos compartidos, Intercambio de datos y Ficha.

Recursos compartidos

Los recursos compartidos son la unidad de uso compartido que realiza un publicador en Analytics Hub.

Conjuntos de datos compartidos
Un conjunto de datos compartidos es un conjunto de datos de BigQuery que es la unidad de uso compartido de datos en Analytics Hub. La separación del procesamiento y el almacenamiento en la arquitectura de BigQuery permite que los publicadores de datos compartan conjuntos de datos con tantos suscriptores como deseen sin tener que hacer varias copias de los datos. Como publicador, debes crear o usar un conjunto de datos de BigQuery existente en tu proyecto con los siguientes objetos compatibles que deseas entregar a tus suscriptores: Los conjuntos de datos compartidos son compatibles con la seguridad a nivel de columna y a nivel de fila.
Temas compartidos (versión preliminar)
Un tema compartido es un tema de Pub/Sub que es la unidad de uso compartido de datos de transmisión en Analytics Hub. Como publicador, debes crear o usar un Pub/Sub existente en tu proyecto y distribuirlo con tus suscriptores.

Intercambios de datos

Un intercambio de datos es un contenedor que habilita el uso compartido de datos de autoservicio. Contiene fichas que hacen referencia a recursos compartidos. Con Analytics Hub, los publicadores y administradores pueden otorgar acceso a los suscriptores a nivel de intercambio y de ficha. Este método ayuda a evitar otorgar acceso a los recursos compartidos subyacentes de manera explícita. Un suscriptor de Analytics Hub puede explorar intercambios de datos, descubrir datos a los que puede acceder y suscribirse a recursos compartidos. Cuando creas un intercambio de datos, puedes asignarle un correo electrónico de contacto primario. El correo electrónico de contacto principal les brinda a los usuarios una forma de comunicarse con el propietario de un intercambio de datos si tienen preguntas o inquietudes sobre este. Un intercambio de datos puede ser de los siguientes tipos:
  • Intercambio de datos privado. De forma predeterminada, un intercambio de datos es privado y solo los usuarios o grupos que tienen acceso a ese intercambio pueden ver sus fichas o suscribirse a ellas.
  • Intercambio de datos público. De forma predeterminada, un intercambio de datos es privado y solo los usuarios o grupos que tienen acceso a ese intercambio pueden ver sus fichas o suscribirse a ellas. Sin embargo, puedes optar por hacer público un intercambio de datos. Los usuarios de Google Cloud (allAuthenticatedUsers) pueden descubrir fichas en los intercambios de datos públicos y suscribirse a ellas. Para obtener más información sobre los intercambios de datos públicos, consulta Haz público un intercambio de datos.

Como administrador de Analytics Hub, puedes crear varios intercambios de datos en Analytics Hub y administrar a otros usuarios de Analytics Hub.

Fichas

Una ficha es una referencia a un conjunto de datos compartidos que un publicador anuncia en un intercambio de datos. Como publicador, puedes crear una ficha y especificar la descripción del recurso, las consultas de muestra que se ejecutarán o los datos de mensajes de muestra, los vínculos a cualquier documentación relevante y cualquier información adicional que pueda ayudar a los suscriptores a usar tu recurso compartido. Cuando creas una ficha, puedes asignar un correo electrónico de contacto principal, un nombre y un contacto del proveedor, y un nombre y un contacto del publicador. El correo electrónico de contacto principal les permite a los usuarios comunicarse con el propietario de una ficha si tienen preguntas o inquietudes sobre el intercambio de datos. El nombre y el contacto del proveedor son la información de la agencia que proporcionó originalmente los datos para la ficha. Esta información es opcional. El nombre y el contacto del publicador son la agencia que publicó los datos para usarlos en Analytics Hub. Esta información es opcional. Para obtener más información, consulta Administra las fichas. Una ficha puede ser de los siguientes dos tipos según la política de Identity and Access Management (IAM) que se configura para la ficha y el tipo de intercambio de datos que contiene la ficha:
  • Ficha pública. Se comparte con todos los usuarios de Google Cloud (allAuthenticatedUsers). Las fichas en un intercambio de datos públicos son públicas. Estas fichas pueden ser referencias a un recurso público gratuito o a un recurso comercial. Si la ficha es de un recursos comercial, los suscriptores pueden solicitar acceso a la ficha y el proveedor de datos se comunicará directamente con esos suscriptores.
  • Ficha privada. Se comparte directamente con personas o grupos. Por ejemplo, una ficha privada puede hacer referencia a un conjunto de datos de métricas de marketing que compartes con otros equipos internos dentro de tu organización.

Flujo de trabajo del suscriptor

En el siguiente diagrama, se describe cómo interactúan los suscriptores con Analytics Hub:

Interacción entre los suscriptores de Analytics Hub y Analytics Hub.
Figura 2. Flujo de trabajo del suscriptor de Analytics Hub.

En la Figura 2, se etiquetan las siguientes funciones de Analytics Hub: Recursos compartidos, Intercambio de datos, Ficha y Recursos vinculados.

Recursos vinculados

Los recursos vinculados se crean cuando te suscribes a una ficha de Analytics Hub, lo que conecta a un suscriptor con el recurso compartido subyacente.

Conjuntos de datos vinculados
Un conjunto de datos vinculado es un conjunto de datos de BigQuery de solo lectura que funciona como un puntero o una referencia a un conjunto de datos compartido. Suscribirse a una ficha crea un conjunto de datos vinculado en tu proyecto y no una copia del conjunto de datos, de modo que los suscriptores pueden leer los datos, pero no pueden agregar ni actualizar objetos dentro de él. Cuando consultas objetos como tablas y vistas a través de un conjunto de datos vinculado, se muestran los datos del conjunto de datos compartidos. Para obtener más información sobre los conjuntos de datos vinculados, consulta Visualiza y suscríbete a fichas. Los conjuntos de datos vinculados están autorizados para acceder a las tablas y vistas de un conjunto de datos compartidos. Los suscriptores con conjuntos de datos vinculados acceden a las tablas y vistas de un conjunto de datos compartidos sin ninguna autorización adicional de Identity and Access Management. Los conjuntos de datos vinculados admiten los siguientes objetos:
Suscripciones vinculadas de Pub/Sub (versión preliminar)
Si te suscribes a una ficha con un tema compartido, se crea una suscripción a Pub/Sub vinculada en el proyecto del suscriptor. No se crean copias de los datos de los temas o mensajes compartidos. Los suscriptores de la suscripción a Pub/Sub vinculada pueden acceder a los mensajes publicados en el tema compartido. Los suscriptores acceden a los datos de los mensajes de un tema compartido sin ninguna autorización adicional de Identity and Access Management. Los publicadores pueden administrar las suscripciones directamente en Pub/Sub o a través de la administración de suscripciones de Analytics Hub. Para obtener más información sobre las suscripciones vinculadas de Pub/Sub, consulta Cómo compartir transmisiones con Pub/Sub.

Opciones de salida de datos (solo para conjuntos de datos compartidos de BigQuery)

Las opciones de salida de datos permiten que los publicadores restrinjan la exportación de datos de los suscriptores fuera de los conjuntos de datos vinculados de BigQuery.

Los publicadores pueden habilitar la restricción de salida de datos en una ficha, en los resultados de una consulta o en ambos. Cuando se restringe la salida de datos, se aplican las siguientes restricciones:

  • Las APIs de copia, clonación, exportación e instantáneas están inhabilitadas.

  • Las opciones de copia, clonación, exportación e instantáneas en la consola de Google Cloud están inhabilitadas.

  • Se inhabilitó la conexión del conjunto de datos restringido al explorador de tablas.

  • El Servicio de transferencia de datos de BigQuery está inhabilitado en el conjunto de datos restringido.

  • Las sentencias CREATE TABLE AS SELECT y la escritura en una tabla de destino están inhabilitadas.

  • Las sentencias CREATE VIEW AS SELECT y la escritura en una vista de destino están inhabilitadas.

Cuando creas una ficha, puedes configurar las opciones de salida de datos adecuadas.

Limitaciones

Analytics Hub tiene las siguientes limitaciones:

  • Un conjunto de datos compartidos puede tener un máximo de 1,000 conjuntos de datos vinculados.

  • Un tema compartido puede tener un máximo de 10,000 suscripciones a Pub/Sub. Este límite incluye las suscripciones de Pub/Sub vinculadas y las suscripciones de Pub/Sub creadas fuera de Analytics Hub (p. ej., creadas directamente desde Pub/Sub.

  • Un conjunto de datos con recursos no compatibles no se puede elegir como un conjunto de datos compartidos cuando creas una ficha. Para obtener más información sobre los objetos de BigQuery que admite Analytics Hub, consulta Conjuntos de datos compartidos en este documento.

  • No puedes establecer roles de IAM ni políticas de IAM en tablas individuales dentro de un conjunto de datos vinculado. En su lugar, aplícalos a nivel del conjunto de datos vinculado.

  • El recurso de suscripción no reabastece los conjuntos de datos vinculados creados antes del 25 de julio de 2023. Solo las suscripciones creadas después del 25 de julio de 2023 funcionan con los métodos de la API.

  • Si eres publicador, se aplican las siguientes limitaciones de interoperabilidad de BigQuery:

    • Los suscriptores deben tener permisos explícitos para leer el conjunto de datos de origen a fin de poder consultar vistas dentro de los conjuntos de datos vinculados. Para otorgar acceso a las vistas, como práctica recomendada, los publicadores deben crear vistas autorizadas. Las vistas autorizadas pueden otorgar a los suscriptores acceso a los datos de vista sin darles acceso a los datos de origen subyacentes.

    • El plan de consultas revela la consulta de vista compartida y la consulta de rutina, incluidos los ID de proyecto y otros conjuntos de datos involucrados en las vistas autorizadas. Nunca incluyas nada, como las claves de encriptación, que consideres sensible en la vista compartida o la consulta de rutina.

    • Los conjuntos de datos compartidos se indexan en Data Catalog. Las actualizaciones en un conjunto de datos compartidos, como la adición de tablas o vistas, están disponibles para los suscriptores sin ningún retraso. Sin embargo, en determinadas situaciones, por ejemplo, cuando hay más de 100 suscriptores o tablas en un conjunto de datos compartido, las actualizaciones pueden tardar hasta 18 horas en indexarse en Data Catalog. Debido a la demora en la indexación, los suscriptores no pueden buscar inmediatamente estos recursos actualizados en la consola de Google Cloud.

    • Los temas compartidos se indexan en Data Catalog, pero no puedes filtrar específicamente por su tipo de recurso.

    • Si configuraste las políticas de seguridad a nivel de fila o enmascaramiento de datos en las tablas que se enumeran, los suscriptores deben ser clientes de Enterprise o Enterprise Plus para ejecutar el trabajo de consulta en un conjunto de datos vinculado. Para obtener más información sobre las ediciones, consulta Introducción a las ediciones de BigQuery.

  • Si eres suscriptor, se aplican las siguientes limitaciones de interoperabilidad de BigQuery:

    • No se admiten las vistas materializadas que hagan referencia a tablas en el conjunto de datos vinculado.

    • No se admite la captura de instantáneas de tablas de conjuntos de datos vinculados.

    • Es posible que fallen las consultas con conjuntos de datos vinculados y declaraciones JOIN de más de 1 TB (almacenamiento físico). Puedes comunicarte con el equipo de asistencia para resolver este problema.

    • No puedes usar calificadores de región con vistas INFORMATION_SCHEMA a fin de ver los metadatos de la vista para tu conjunto de datos vinculado.

    • Cuando consultas rutinas en un conjunto de datos vinculado, solo puedes consultar funciones definidas por el usuario (tanto las UDF de SQL como las de JavaScript) y tipos de rutina de funciones de tabla. Si consultas un tipo de rutina no compatible, se mostrará el siguiente mensaje de error: Querying routine type type is not yet supported on linked dataset dataset.

  • Se aplican las siguientes limitaciones a las métricas de uso:

    • No puedes obtener las métricas de uso de las fichas que se suscribieron antes del 20 de julio de 2023.

    • Es posible que las métricas de uso de la tabla externa para los campos num_rows_processed y total_bytes_processed contengan datos inexactos.

    • Las métricas de uso solo son compatibles con el uso a través de trabajos de BigQuery. No se admite el consumo mediante el uso de los siguientes recursos:

    • Las métricas de uso de las vistas solo se propagan para las consultas posteriores al 22 de abril de 2024.

    • No se capturan las métricas de uso de las suscripciones de Pub/Sub vinculadas en Analytics Hub (puedes seguir viendo el uso directamente en Pub/Sub).

  • Las siguientes limitaciones se aplican cuando te suscribes a datos de Salesforce Data Cloud:

    • Los datos de Data Cloud se comparten como vistas. Como suscriptor, no puedes acceder a las tablas subyacentes a las que hacen referencia las vistas.

Regiones admitidas

Analytics Hub es compatible con las siguientes regiones y multirregiones.

Regiones

En la siguiente tabla, se enumeran las regiones de América en las que Analytics Hub está disponible.
Descripción de la región Nombre de la región Detalles
Columbus, Ohio us-east5
Dallas us-south1 ícono de hoja CO2 bajo
Iowa us-central1 ícono de hoja CO2 bajo
Las Vegas us-west4
Los Ángeles us-west2
Montreal northamerica-northeast1 ícono de hoja CO2 bajo
Virginia del Norte us-east4
Oregón us-west1 ícono de hoja CO2 bajo
Salt Lake City us-west3
São Paulo southamerica-east1 ícono de hoja CO2 bajo
Santiago southamerica-west1
Carolina del Sur us-east1
Toronto northamerica-northeast2
En la siguiente tabla, se enumeran las regiones de Asia-Pacífico en las que Analytics Hub está disponible.
Descripción de la región Nombre de la región Detalles
Delhi asia-south2
Hong Kong asia-east2
Yakarta asia-southeast2
Melbourne australia-southeast2
Bombay asia-south1
Osaka asia-northeast2
Seúl asia-northeast3
Singapur asia-southeast1
Sídney australia-southeast1
Taiwán asia-east1
Tokio asia-northeast1
En la siguiente tabla, se enumeran las regiones de Europa en las que Analytics Hub está disponible.
Descripción de la región Nombre de la región Detalles
Bélgica europe-west1 ícono de hoja CO2 bajo
Finlandia europe-north1 ícono de hoja CO2 bajo
Fráncfort europe-west3 ícono de hoja CO2 bajo
Londres europe-west2 ícono de hoja CO2 bajo
Países Bajos europe-west4 ícono de hoja CO2 bajo
Varsovia europe-central2
Zúrich europe-west6 ícono de hoja CO2 bajo
En la siguiente tabla, se enumeran las regiones de Oriente Medio en las que Analytics Hub está disponible.
Descripción de la región Nombre de la región Detalles
Dammam me-central2
Tel Aviv me-west1
En la siguiente tabla, se enumeran las regiones de África en las que Analytics Hub está disponible.
Descripción de la región Nombre de la región Detalles
Johannesburgo africa-south1

Multirregiones

En la siguiente tabla, se enumeran las multirregiones en las que Analytics Hub está disponible.
Descripción de la multirregión Nombre de la multirregión
Centros de datos dentro de los estados miembros de la Unión Europea1 EU
Centros de datos en Estados Unidos US

1 Los datos ubicados en la multirregión EU no se almacenan en los centros de datos de europe-west2 (Londres) ni deeurope-west6 (Zúrich).

Regiones de varios canales

En la siguiente tabla, se enumeran los Omnis en los que Analytics Hub está disponible.
Descripción de la región de varios canales Nombre de la región de varios canales
AWS
AWS - US East (N. Norte) aws-us-east-1
AWS: Oeste de EE.UU. (Oregón) aws-us-west-2
AWS: Asia-Pacífico (Seúl) aws-ap-northeast-2
AWS - Asia-Pacífico (Sídney) aws-ap-southeast-2
AWS: Europa (Irlanda) aws-eu-west-1
AWS - Europa (Fráncfort) aws-eu-central-1
Azure
Azure - East US 2 azure-eastus2

Ejemplo de caso de uso

En esta sección, se muestra un ejemplo de cómo puedes usar Analytics Hub.

Supongamos que eres un minorista y que tu organización tiene datos de previsión de la demanda en tiempo real en un proyecto de Google Cloud llamado Previsión. Quieres compartir estos datos de previsión de la demanda con cientos de proveedores en el sistema de la cadena de suministro. A continuación, te mostramos cómo puedes compartir tus datos con proveedores a través de Analytics Hub:

Administradores de Analytics Hub

Como propietario del proyecto Previsión, primero debes habilitar la API de Analytics Hub y, luego, asignar el rol Analytics Hub Admin a un usuario que administra el intercambio de datos en el proyecto. Los usuarios con el rol Analytics Hub Admin se denominan administradores de Analytics Hub.

Un administrador de Analytics Hub puede realizar las siguientes tareas:

  • Crear, actualizar, borrar y compartir el intercambio de datos en el proyecto Previsión de tu organización.

  • Administrar a otros administradores de Analytics Hub.

  • Administrar publicadores. Para ello, otorga el rol Analytics Hub Publisher a los empleados de tu organización. Si deseas que algunos empleados solo puedan actualizar, borrar y compartir fichas, pero no crearlas, puedes otorgarles el rol Analytics Hub Listing Admin.

  • Administrar los suscriptores. Para ello, otorga el rol Analytics Hub Subscriber a un grupo de Google que consta de todos los proveedores. Si deseas que algunos proveedores solo tengan acceso de lectura a los intercambios y fichas disponibles, puedes otorgarles el rol Analytics Hub Viewer. Estos proveedores no pueden suscribirse a las fichas.

Para obtener más información, consulta Administra intercambios de datos.

Publicadores de Analytics Hub

Los publicadores crean las siguientes fichas para sus conjuntos de datos en el proyecto Previsión o en un proyecto diferente:

  • Ficha A: Conjunto de datos de previsión de la demanda 1
  • Ficha B: Conjunto de datos de previsión de la demanda 2
  • Ficha C: Conjunto de datos de previsión de la demanda 3

Como proveedor de datos, puedes hacer un seguimiento de las métricas de uso de tu conjunto de datos compartido. Las métricas de uso incluyen los siguientes detalles:

  • Trabajos que se ejecutan en tu conjunto de datos compartido.
  • Los detalles de consumo de tu conjunto de datos compartido por los proyectos y la organización de los suscriptores.
  • Es la cantidad de filas y bytes procesados por el trabajo.

Para obtener más información, consulta Administra las fichas.

Suscriptores de Analytics Hub

Los suscriptores pueden explorar fichas a las que tienen acceso en los intercambios de datos. También pueden suscribirse a estas fichas y agregar estos conjuntos de datos a sus proyectos mediante la creación de un conjunto de datos vinculado. Luego, los proveedores pueden ejecutar consultas sobre estos conjuntos de datos vinculados y recuperar resultados en tiempo real.

Para obtener más información, consulta Visualiza y suscríbete a fichas.

Precios

No se aplican costos adicionales por administrar intercambios de datos o fichas.

En el caso de los conjuntos de datos de BigQuery, a los publicadores de Analytics Hub se les cobra por el almacenamiento de datos, mientras que los suscriptores pagan por las consultas que se ejecutan en los datos compartidos de acuerdo con el modelo de precios según demanda o basados en la capacidad. Para obtener más información sobre los precios, consulta Precios de BigQuery.

En Pub/Sub, a los publicadores de temas se les cobra por la cantidad total de bytes escritos (capacidad de procesamiento de publicación) en el tema compartido y la salida de red (si corresponde). A los suscriptores se les cobra por la cantidad total de bytes leídos (capacidad de procesamiento de suscripción) de la suscripción vinculada y la salida de red (si corresponde). Consulta los precios de Pub/Sub para obtener más detalles.

Cuotas

Para obtener más información sobre las cuotas de Analytics Hub, consulta Cuotas y límites.

Cumplimiento

Analytics Hub, como parte de BigQuery, cumple con los siguientes programas de cumplimiento:

Controles del servicio de VPC

Puedes configurar las reglas de entrada y salida necesarias para permitir que los publicadores y suscriptores accedan a los datos de los proyectos que tienen perímetros de Controles del servicio de VPC. Para obtener más información, consulta las reglas de los Controles del servicio de VPC de Analytics Hub.

¿Qué sigue?