Introducción a Analytics Hub
Analytics Hub es una plataforma de intercambio de datos que te permite compartir datos y estadísticas a gran escala más allá de los límites de la organización con un framework de seguridad y privacidad sólido. Con Analytics Hub, puedes descubrir y acceder a una biblioteca de datos seleccionada por varios proveedores de datos. Esta biblioteca de datos también incluye conjuntos de datos proporcionados por Google.
Por ejemplo, con Analytics Hub puedes aumentar tus iniciativas de AA y estadísticas con conjuntos de datos de terceros y de Google.
Como usuario de Analytics Hub, puedes realizar las siguientes tareas:
Como publicador de Analytics Hub, puedes monetizar datos si los compartes con tu red de socio o dentro de tu propia organización en tiempo real. Las fichas te permiten compartir datos sin replicar los datos compartidos. Puedes compilar un catálogo de fuentes de datos listas para el análisis con permisos detallados que te permitan entregar datos a los públicos correctos. También puedes administrar suscripciones a tus fichas.
Como suscriptor de Analytics Hub, puedes descubrir los datos que buscas, combinar datos compartidos con tus datos existentes y aprovechar las funciones integradas de BigQuery. Cuando te suscribes a una ficha, se crea un conjunto de datos vinculado en tu proyecto.
Como visualizador de Analytics Hub, puedes explorar los conjuntos de datos a los que tienes acceso en Analytics Hub y solicitar al publicador que acceda a los datos compartidos.
Como administrador de Analytics Hub, puedes crear intercambios de datos que habiliten el uso compartido de datos y, luego, otorgar permisos a los publicadores y suscriptores de datos para acceder a estos intercambios.
Para obtener más información sobre los roles del usuario de Analytics Hub, consulta Configura los roles de Analytics Hub.
Arquitectura
Analytics Hub se basa en un modelo de publicación y suscripción de conjuntos de datos de BigQuery. La separación del procesamiento y el almacenamiento en la arquitectura de BigQuery permite que los publicadores de datos compartan datos con tantos suscriptores como deseen sin tener que hacer varias copias de los datos. Los publicadores solo pagan por el almacenamiento de datos, mientras que los suscriptores solo pagan por las consultas que se ejecutan en los datos compartidos. Los flujos de trabajo de publicador y suscriptor en Analytics Hub se explican en detalle en las siguientes secciones.
Flujo de trabajo del publicador
En el siguiente diagrama, se describe cómo interactúan los publicadores con Analytics Hub:
En la Figura 1, se etiquetan las siguientes funciones: Conjunto de datos compartidos, Intercambio de datos y Ficha.
- Un conjunto de datos compartidos es un conjunto de datos de BigQuery que es la unidad de uso compartido de datos en Analytics Hub. Como publicador, puedes crear o usar un conjunto de datos de BigQuery existente en tu proyecto con los siguientes objetos compatibles que deseas entregar a los suscriptores:
- Vistas autorizadas
- Conjuntos de datos autorizados
- Modelos de BigQuery ML.
- Tablas externas
- Vistas materializadas
- Tablas
- Instantáneas de tablas
- Vistas Los
. - Intercambios de datos
- Un intercambio de datos es un contenedor que habilita el uso compartido de datos de autoservicio. Contiene fichas que hacen referencia a conjuntos de datos compartidos. Con Analytics Hub, los publicadores y administradores pueden otorgar acceso a los suscriptores a nivel de intercambio y de ficha. Este método ayuda a evitar otorgar acceso a los conjuntos de datos compartidos subyacentes de manera explícita. Un suscriptor de Analytics Hub puede explorar intercambios de datos, descubrir datos a los que puede acceder y suscribirse a conjuntos de datos compartidos. Un intercambio de datos puede ser de los siguientes tipos:
- Intercambio de datos privado. De forma predeterminada, un intercambio de datos es privado y solo los usuarios o grupos que tienen acceso a ese intercambio pueden ver los datos o suscribirse a ellos.
- Intercambio de datos público. De forma predeterminada, un intercambio de datos es privado y solo los usuarios o grupos que tienen acceso a ese intercambio pueden ver sus fichas o suscribirse a ellas. Sin embargo, puedes optar por hacer público un intercambio de datos. Los usuarios de Google Cloud (
allAuthenticatedUsers
) pueden descubrir fichas en los intercambios de datos públicos y suscribirse a ellas. Para obtener más información sobre los intercambios de datos públicos, consulta Haz público un intercambio de datos.
Como administrador de Analytics Hub, puedes crear varios intercambios de datos en Analytics Hub y administrar a otros usuarios de Analytics Hub.
- Fichas
- Una ficha es una referencia a un conjunto de datos compartidos que un publicador anuncia en un intercambio de datos. Como publicador, puedes crear una ficha y especificar la descripción del conjunto de datos, las consultas de muestra que se ejecutarán en el conjunto de datos, los vínculos a cualquier documentación relevante y cualquier información adicional que pueda ayudar a los suscriptores a usar tu conjunto de datos. Para obtener más información, consulta Administra las fichas. Una ficha puede ser de los siguientes dos tipos según la política de Identity and Access Management (IAM) que se configura para la ficha y el tipo de intercambio de datos que contiene la ficha:
- Ficha pública. Se comparte con todos los usuarios de Google Cloud (
allAuthenticatedUsers
). Las fichas en un intercambio de datos públicos son públicas. Estas fichas pueden ser referencias a un conjunto de datos público gratuito o a un conjunto de datos comerciales. Si la ficha es de un conjunto de datos comerciales, los suscriptores pueden solicitar acceso a la ficha y el proveedor de datos se comunicará directamente con esos suscriptores. - Ficha privada. Se comparte directamente con personas o grupos. Por ejemplo, una ficha privada puede hacer referencia a un conjunto de datos de métricas de marketing que compartes con otros equipos internos dentro de tu organización.
- Ficha pública. Se comparte con todos los usuarios de Google Cloud (
Flujo de trabajo del suscriptor
En el siguiente diagrama, se describe cómo interactúan los suscriptores con Analytics Hub:
En la Figura 2, se etiquetan las siguientes funciones de Analytics Hub: Conjunto de datos compartidos, Intercambio de datos, Ficha y Conjunto de datos vinculado.
- Conjuntos de datos vinculados
- Un conjunto de datos vinculado es un conjunto de datos de BigQuery de solo lectura que funciona como un vínculo simbólico a un conjunto de datos compartidos. Suscribirse a una ficha crea un conjunto de datos vinculado en tu proyecto y no una copia del conjunto de datos, de modo que los suscriptores pueden leer los datos, pero no pueden agregar ni actualizar objetos dentro de él. Cuando consultas objetos como tablas y vistas a través de un conjunto de datos vinculado, se muestran los datos del conjunto de datos compartidos. Para obtener más información sobre los conjuntos de datos vinculados, consulta Visualiza y suscríbete a fichas. Los conjuntos de datos vinculados están autorizados para acceder a las tablas y vistas de un conjunto de datos compartidos. Los suscriptores con conjuntos de datos vinculados acceden a las tablas y vistas de un conjunto de datos compartidos sin ninguna autorización adicional de Identity and Access Management.
Limitaciones
Analytics Hub tiene las siguientes limitaciones:
Si creas una lista para un conjunto de datos compartido que usa una clave de encriptación administrada por el cliente, los suscriptores no tendrán acceso a la clave de Cloud KMS que se necesita para acceder al conjunto de datos.
Un conjunto de datos compartidos puede tener un máximo de 1,000 conjuntos de datos vinculados.
Un conjunto de datos con recursos no compatibles no se puede seleccionar como un conjunto de datos compartido cuando creas una lista. Para obtener más información sobre los objetos de BigQuery que admite Analytics Hub, consulta Conjuntos de datos compartidos en este documento.
Si eres publicador, se aplican las siguientes limitaciones de interoperabilidad de BigQuery:
Los suscriptores no pueden consultar vistas dentro de conjuntos de datos vinculados que hacen referencia a datos de otros proyectos. Debes crear vistas autorizadas para otorgar a los suscriptores acceso a los datos de vista sin darles acceso a los datos de origen subyacentes.
Usando inserciones de transmisión o API de BigQuery Storage Write para transmitir datos a un conjunto de datos compartido podría causar problemas para conjuntos de datos vinculados.
Los conjuntos de datos compartidos se indexan en Data Catalog. Las actualizaciones en un conjunto de datos compartidos, como la adición de tablas o vistas, están disponibles para los suscriptores sin ningún retraso. Sin embargo, en determinadas situaciones, por ejemplo, cuando hay más de 100 suscriptores o tablas en un conjunto de datos compartido, las actualizaciones pueden tardar hasta 18 horas en indexarse en Data Catalog. Debido a la demora en la indexación, los suscriptores no pueden buscar inmediatamente estos recursos actualizados en la consola de Google Cloud.
Si eres un suscriptor, se aplican las siguientes limitaciones de interoperabilidad de BigQuery:
No se admite el uso de la API de lectura de BigQuery Storage en recursos de conjuntos de datos vinculados.
No se admite el viaje en el tiempo en los recursos de conjuntos de datos vinculados.
No se admiten las vistas materializadas que hagan referencia a tablas en el conjunto de datos vinculado.
No se admite la captura de instantáneas de tablas de conjuntos de datos vinculados.
Si los conjuntos de datos vinculados no se ubican con el conjunto de datos compartidos, es posible que fallen las operaciones de lectura en tablas de conjuntos de datos vinculados con un tamaño de consulta de más de 1 GiB. Puedes comunicarte con el equipo de asistencia para resolver este problema.
Las siguientes vistas
INFORMATION_SCHEMA
no admiten calificadores de conjuntos de datos para los conjuntos de datos vinculados:No puedes usar calificadores de región con vistas
INFORMATION_SCHEMA
a fin de ver los metadatos de la vista para tu conjunto de datos vinculado.
Regiones admitidas
Analytics Hub es compatible con las siguientes regiones y multirregiones.
Regiones
En la siguiente tabla, se enumeran las regiones de América en las que Analytics Hub está disponible.Descripción de la región | Nombre de la región | Detalles |
---|---|---|
Iowa | us-central1 |
|
Las Vegas | us-west4 |
|
Los Ángeles | us-west2 |
|
Montreal | northamerica-northeast1 |
|
Virginia del Norte | us-east4 |
|
Oregón | us-west1 |
|
Salt Lake City | us-west3 |
|
São Paulo | southamerica-east1 |
|
Santiago | southamerica-west1 |
|
Carolina del Sur | us-east1 |
|
Toronto | northamerica-northeast2 |
|
Descripción de la región | Nombre de la región | Detalles |
---|---|---|
Delhi | asia-south2 |
|
Hong Kong | asia-east2 |
|
Yakarta | asia-southeast2 |
|
Melbourne | australia-southeast2 |
|
Bombay | asia-south1 |
|
Osaka | asia-northeast2 |
|
Seúl | asia-northeast3 |
|
Singapur | asia-southeast1 |
|
Sídney | australia-southeast1 |
|
Taiwán | asia-east1 |
|
Tokio | asia-northeast1 |
Descripción de la región | Nombre de la región | Detalles |
---|---|---|
Bélgica | europe-west1 |
|
Finlandia | europe-north1 |
|
Fráncfort | europe-west3 |
|
Londres | europe-west2 |
|
Netherlands | europe-west4 |
|
Varsovia | europe-central2 |
|
Zúrich | europe-west6 |
|
Multirregiones
En la siguiente tabla, se enumeran las multirregiones en las que Analytics Hub está disponible.Descripción de la multirregión | Nombre de la multirregión |
---|---|
Centros de datos dentro de los estados miembros de la Unión Europea1 | EU |
Centros de datos en Estados Unidos | US |
1 Los datos ubicados en la multirregión EU
no se almacenan en los centros de datos de europe-west2
(Londres) ni deeurope-west6
(Zúrich).
Ejemplo de caso de uso
En esta sección, se muestra un ejemplo de cómo puedes usar Analytics Hub.
Supongamos que eres un minorista y que tu organización tiene datos de previsión de la demanda en tiempo real en un proyecto de Google Cloud llamado Previsión. Quieres compartir estos datos de previsión de la demanda con cientos de proveedores en el sistema de la cadena de suministro. A continuación, te mostramos cómo puedes compartir tus datos con proveedores a través de Analytics Hub:
Administradores de Analytics Hub
Como propietario del proyecto Previsión, primero debes habilitar la API de Analytics Hub y, luego, asignar el rol Analytics Hub Admin a un usuario que administra el intercambio de datos en el proyecto. Los usuarios con el rol Analytics Hub Admin se denominan administradores de Analytics Hub.
Un administrador de Analytics Hub puede realizar las siguientes tareas:
Crear, actualizar, borrar y compartir el intercambio de datos en el proyecto Previsión de tu organización.
Administrar a otros administradores de Analytics Hub.
Administrar publicadores. Para ello, otorga el rol Analytics Hub Publisher a los empleados de tu organización. Si deseas que algunos empleados solo puedan actualizar, borrar y compartir fichas, pero no crearlas, puedes otorgarles el rol Analytics Hub Listing Admin.
Administrar los suscriptores. Para ello, otorga el rol Analytics Hub Subscriber a un grupo de Google que consta de todos los proveedores. Si deseas que algunos proveedores solo tengan acceso de lectura a los intercambios y fichas disponibles, puedes otorgarles el rol Analytics Hub Viewer. Estos proveedores no podrán suscribirse a las fichas.
Para obtener más información, consulta Administra intercambios de datos.
Publicadores de Analytics Hub
Los publicadores crean las siguientes fichas para sus conjuntos de datos en el proyecto Previsión o en un proyecto diferente:
- Ficha A: Conjunto de datos de previsión de la demanda 1
- Ficha B: Conjunto de datos de previsión de la demanda 2
- Ficha C: Conjunto de datos de previsión de la demanda 3
Para obtener más información, consulta Administra las fichas.
Suscriptores de Analytics Hub
Los suscriptores pueden explorar fichas a las que tienen acceso en los intercambios de datos. También pueden suscribirse a estas fichas y agregar estos conjuntos de datos a sus proyectos mediante la creación de un conjunto de datos vinculado. Luego, los proveedores pueden ejecutar consultas sobre estos conjuntos de datos vinculados y recuperar resultados en tiempo real.
Para obtener más información, consulta Visualiza y suscríbete a fichas.
Precios
No se aplican costos adicionales por administrar intercambios de datos o fichas. A los publicadores de Analytics Hub se les cobra por el almacenamiento de datos, mientras que los suscriptores pagan por las consultas que se ejecutan en los datos compartidos de acuerdo con el modelo de precios según demanda o de tarifa plana. Para obtener más información sobre los precios, consulta Precios de BigQuery.
Cuotas
Para obtener más información sobre las cuotas de Analytics Hub, consulta Cuotas y límites.
¿Qué sigue?
- Obtén información sobre cómo ver y suscribirte a fichas.
- Obtén información sobre cómo otorgar roles a los usuarios de Analytics Hub.