Configurar y usar la resolución de entidades en BigQuery
En este documento se explica cómo implementar la resolución de entidades para los usuarios finales de la resolución de entidades (en adelante, usuarios finales) y los proveedores de identidades.
Los usuarios finales pueden usar este documento para conectarse con un proveedor de identidades y usar el servicio del proveedor para asociar registros. Los proveedores de identidades pueden usar este documento para configurar servicios que compartir con los usuarios finales en Google Cloud Marketplace.
Flujo de trabajo para usuarios finales
En las siguientes secciones se explica a los usuarios finales cómo configurar la resolución de entidades en BigQuery. Para ver una representación visual de la configuración completa, consulta la arquitectura de la resolución de entidades.
Antes de empezar
- Ponte en contacto con un proveedor de identidades y establece una relación con él. BigQuery admite la resolución de entidades con LiveRamp.
- Obtén los siguientes elementos del proveedor de identidades:
- Credenciales de cuenta de servicio
- Firma de función remota
- Crea dos conjuntos de datos en tu proyecto:
- Conjunto de datos de entrada
- Conjunto de datos de salida
Roles obligatorios
Para obtener los permisos que necesitas para ejecutar trabajos de resolución de entidades, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos:
-
Para que la cuenta de servicio del proveedor de identidades pueda leer el conjunto de datos de entrada y escribir en el de salida, haz lo siguiente:
-
Lector de datos de BigQuery (
roles/bigquery.dataViewer
) en el conjunto de datos de entrada -
Editor de datos de BigQuery (
roles/bigquery.dataEditor
) en el conjunto de datos de salida
-
Lector de datos de BigQuery (
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.
También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.
Traducir o resolver entidades
Para obtener instrucciones específicas sobre proveedores de identidades, consulta las siguientes secciones.
LiveRamp
Requisitos previos
- Configura LiveRamp Embedded Identity en BigQuery. Para obtener más información, consulta el artículo sobre cómo habilitar LiveRamp Embedded Identity en BigQuery.
- Coordínate con LiveRamp para habilitar las credenciales de la API que se usarán con Embedded Identity. Para obtener más información, consulta Autenticación.
Configuración
Debes seguir estos pasos la primera vez que uses LiveRamp Embedded Identity. Una vez completada la configuración, solo se deben modificar la tabla de entrada y la tabla de metadatos entre ejecuciones.
Crear una tabla de entrada
Crea una tabla en el conjunto de datos de entrada. Rellene la tabla con RampIDs, dominios de destino y tipos de destino. Para obtener más información y ver ejemplos, consulta Columnas y descripciones de la tabla de entrada.
Crear una tabla de metadatos
La tabla de metadatos se usa para controlar la ejecución de LiveRamp Embedded Identity en BigQuery. Crea una tabla de metadatos en el conjunto de datos de entrada. Rellena la tabla de metadatos con los IDs de cliente, los modos de ejecución, los dominios de destino y los tipos de destino. Para obtener más información y ver ejemplos, consulta Columnas y descripciones de la tabla de metadatos.
Compartir tablas con LiveRamp
Concede a la cuenta de servicio de LiveRamp Google Cloud acceso para ver y procesar datos en tu conjunto de datos de entrada. Para obtener más información y ver ejemplos, consulta Compartir tablas y conjuntos de datos con LiveRamp.
Ejecutar un trabajo de identidad insertada
Para ejecutar una tarea de identidad insertada con LiveRamp en BigQuery, haz lo siguiente:
- Confirma que todos los RampIDs codificados en tu dominio se encuentran en tu tabla de entrada.
- Antes de ejecutar el trabajo, comprueba que la tabla de metadatos siga siendo precisa.
- Ponte en contacto con LiveRampIdentitySupport@liveramp.com para solicitar un proceso de trabajo. Incluye el ID del proyecto, el ID del conjunto de datos y el ID de la tabla (si procede) de la tabla de entrada, la tabla de metadatos y el conjunto de datos de salida. Para obtener más información, consulta Notificar a LiveRamp para iniciar la transcodificación.
Los resultados suelen enviarse al conjunto de datos de salida en un plazo de tres días hábiles.
Asistencia de LiveRamp
Si tienes algún problema con el servicio de asistencia, ponte en contacto con el equipo de Asistencia de LiveRamp Identity.
Facturación de LiveRamp
LiveRamp se encarga de la facturación de la resolución de entidades.
Flujo de trabajo para proveedores de identidades
En las siguientes secciones se explica a los proveedores de identidades cómo configurar la resolución de entidades en BigQuery. Para ver una representación visual de la configuración completa, consulta la arquitectura de la resolución de entidades.
Antes de empezar
- Crea un trabajo de Cloud Run o una función de Cloud Run para integrarla con la función remota. Ambas opciones son adecuadas para este fin.
Anota el nombre de la cuenta de servicio asociada a la función de Cloud Run:
En la Google Cloud consola, ve a la página Cloud Functions.
Haga clic en el nombre de la función y, a continuación, en la pestaña Detalles.
En el panel Información general, busca y anota el nombre de la cuenta de servicio de la función remota.
Crea una función remota.
Recoge los principales de los usuarios finales.
Roles obligatorios
Para obtener los permisos que necesitas para ejecutar trabajos de resolución de entidades, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos:
-
Para que la cuenta de servicio asociada a tu función pueda leer y escribir en los conjuntos de datos asociados y lanzar trabajos, haz lo siguiente:
-
Editor de datos de BigQuery (
roles/bigquery.dataEditor
) en el proyecto -
Usuario de tareas de BigQuery (
roles/bigquery.jobUser
) en el proyecto
-
Editor de datos de BigQuery (
-
Para que la entidad de seguridad del usuario final pueda ver la función remota y conectarse a ella, debe cumplir los siguientes requisitos:
-
Usuario de conexión de BigQuery (
roles/bigquery.connectionUser
) en la conexión -
Lector de datos de BigQuery (
roles/bigquery.dataViewer
) en el conjunto de datos del plano de control con la función remota
-
Usuario de conexión de BigQuery (
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.
También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.
Compartir función remota de resolución de entidades
Modifica y comparte el siguiente código de interfaz remota con el usuario final. El usuario final necesita este código para iniciar el trabajo de resolución de entidades.
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
Sustituye LIST_OF_PARAMETERS por la lista de parámetros que se transfieren a la función remota.
Opcional: Proporcionar metadatos de la tarea
También puedes proporcionar metadatos de trabajo mediante una función remota independiente o escribiendo una nueva tabla de estado en el conjunto de datos de salida del usuario. Algunos ejemplos de metadatos son los estados y las métricas de los trabajos.
Facturación de proveedores de identidades
Para agilizar la facturación y la incorporación de clientes, te recomendamos que integres tu servicio de resolución de entidades con Google Cloud Marketplace. De esta forma, puedes configurar un modelo de precios basado en el uso del trabajo de resolución de entidades, y Google se encargará de la facturación. Para obtener más información, consulta el artículo Ofrecer productos de software como servicio (SaaS).