Configura y usa la resolución de entidades en BigQuery
En este documento, se muestra cómo implementar la resolución de entidades para los usuarios finales de resolución de entidades (que denominaremos usuarios finales) y los proveedores de identidad.
Los usuarios finales pueden usar este documento para conectarse con un proveedor de identidad y usar el servicio del proveedor a fin de hacer coincidir los registros. Los proveedores de identidad pueden usar este documento para configurar los servicios para compartirlos con los usuarios finales en Google Cloud Marketplace.
Flujo de trabajo para usuarios finales
En las siguientes secciones, se muestra a los usuarios finales cómo configurar la resolución de entidades en BigQuery. Si deseas obtener una representación visual de la configuración completa, consulta la arquitectura para la resolución de entidades.
Antes de comenzar
- Comunícate con un proveedor de identidad y establece una relación con él. BigQuery es compatible con la resolución de entidades con LiveRamp.
- Adquiere los siguientes elementos del proveedor de identidad:
- Credenciales de cuenta de servicio
- Firma de función remota
- Crea dos conjuntos de datos en tu proyecto:
- Conjunto de datos de entrada
- Conjunto de datos de salida
Roles obligatorios
A fin de obtener los permisos que necesitas para ejecutar los trabajos de resolución de entidades, pídele a tu administrador que te otorgue los siguientes roles de IAM:
-
Para que la cuenta de servicio del proveedor de identidad lea el conjunto de datos de entrada y escriba en el conjunto de datos de salida:
-
Visualizador de datos de BigQuery (
roles/bigquery.dataViewer
) en el conjunto de datos de entrada -
Editor de datos de BigQuery (
roles/bigquery.dataEditor
) en el conjunto de datos de salida
-
Visualizador de datos de BigQuery (
Si quieres obtener más información para otorgar roles, consulta Administra el acceso.
También puedes obtener los permisos necesarios a través de funciones personalizadas o cualquier otro rol predefinido.
Traduce o resuelve entidades
Para obtener instrucciones específicas del proveedor de identidad, consulta las siguientes secciones.
LiveRamp
Requisitos previos
- Configurar la identidad incorporada de LiveRamp en BigQuery. Para obtener más información, consulta Habilita la identidad incorporada de LiveRamp en BigQuery.
- Coordina con LiveRamp para habilitar las credenciales de API y usarlas con la identidad incorporada. Para obtener más información, consulta Autenticación.
Configuración
Los siguientes pasos son necesarios cuando usas la identidad incorporada de LiveRamp por primera vez. Una vez completada la configuración, solo la tabla de entrada y la tabla de metadatos deben modificarse entre ejecuciones.
Cree una tabla de entrada
Crea una tabla en el conjunto de datos de entrada. Propaga la tabla con RampID, dominios de destino y tipos de destino. Para obtener más detalles y ejemplos, consulta Columnas y descripciones de la tabla de entrada.
Crea una tabla de metadatos
La tabla de metadatos se usa para controlar la ejecución de la identidad incorporada de LiveRamp en BigQuery. Crea una tabla de metadatos en el conjunto de datos de entrada. Propaga la tabla de metadatos con los IDs de cliente, los modos de ejecución, los dominios de destino y los tipos de destino. Para obtener más detalles y ejemplos, consulta Columnas y descripciones de tablas de metadatos.
Comparte tablas con LiveRamp
Otorga a la cuenta de servicio de Google Cloud de LiveRamp acceso para ver y procesar datos en tu conjunto de datos de entrada. Para obtener detalles y ejemplos, consulta Comparte tablas y conjuntos de datos con LiveRamp.
Ejecuta un trabajo de identidad incorporado
Para ejecutar un trabajo de identidad incorporado con LiveRamp en BigQuery, haz lo siguiente:
- Confirma que todos los RampID que se codificaron en tu dominio estén en la tabla de entrada.
- Confirma que tu tabla de metadatos aún sea precisa antes de ejecutar el trabajo.
- Comunícate con LiveRampIdentitySupport@liveramp.com con una solicitud de proceso de trabajo. Incluye el ID del proyecto, el ID del conjunto de datos y el ID de la tabla (si corresponde) para la tabla de entrada, la tabla de metadatos y el conjunto de datos de salida. Si quieres obtener más información, consulta Notificar a LiveRamp para iniciar la transcodificación.
Por lo general, los resultados se envían a tu conjunto de datos de salida en un plazo de tres días hábiles.
Compatibilidad con LiveRamp
Para problemas de asistencia, comunícate con el equipo de asistencia de LiveRamp Identity.
Facturación de LiveRamp
LiveRamp controla la facturación de la resolución de entidades.
Flujo de trabajo para proveedores de identidad
En las siguientes secciones, se muestra a los proveedores de identidad cómo configurar la resolución de entidades en BigQuery. Para obtener una representación visual de la configuración completa, consulta la arquitectura para la resolución de entidades.
Antes de comenzar
- Crea un trabajo de Cloud Run o una función de Cloud Run para integrarlo a la función remota. Ambas opciones son adecuadas para este propósito.
Toma nota del nombre de la cuenta de servicio asociada con la función de Cloud Run o con Cloud Run:
En la consola de Google Cloud, ve a la página Cloud Functions.
Haz clic en el nombre de la función y, luego, en la pestaña Detalles.
En el panel Información general, busca y anota el nombre de la cuenta de servicio de la función remota.
Crea una función remota
Recopila los principales del usuario final desde el usuario final.
Roles obligatorios
A fin de obtener los permisos que necesitas para ejecutar los trabajos de resolución de entidades, pídele a tu administrador que te otorgue los siguientes roles de IAM:
-
Para la cuenta de servicio asociada con tu función para leer y escribir en conjuntos de datos asociados y trabajos de inicio, sigue estos pasos:
-
Editor de datos de BigQuery (
roles/bigquery.dataEditor
) en el proyecto -
Usuario de trabajo de BigQuery (
roles/bigquery.jobUser
) en el proyecto
-
Editor de datos de BigQuery (
-
Para que el principal del usuario final vea y se conecte a la función remota, sigue estos pasos:
-
Usuario de conexión de BigQuery (
roles/bigquery.connectionUser
) en la conexión -
Visualizador de datos de BigQuery (
roles/bigquery.dataViewer
) en el conjunto de datos del plano de control con la función remota
-
Usuario de conexión de BigQuery (
Si quieres obtener más información para otorgar roles, consulta Administra el acceso.
También puedes obtener los permisos necesarios a través de funciones personalizadas o cualquier otro rol predefinido.
Función remota de resolución de entidades de uso compartido
Modifica y comparte el siguiente código de la interfaz remota con el usuario final. El usuario final necesita este código para iniciar el trabajo de resolución de entidades.
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
Reemplaza LIST_OF_PARAMETERS por la lista de parámetros que se pasan a la función remota.
Opcional: Proporciona metadatos de trabajos
De forma opcional, puedes proporcionar metadatos de trabajo mediante una función remota separada o escribiendo una nueva tabla de estado en el conjunto de datos de salida del usuario. Algunos ejemplos de metadatos incluyen los estados y las métricas del trabajo.
Facturación para proveedores de identidad
Para optimizar la facturación y la integración del cliente, te recomendamos que integres el servicio de resolución de entidades en Google Cloud Marketplace. Esto te permite configurar un modelo de precios según el uso del trabajo de resolución de entidades, y Google puede controlar la facturación por ti. Para obtener más información, consulta Ofrece productos de software como servicio (SaaS).