Cloud Data Loss Prevention (Cloud DLP) ahora es parte de Sensitive Data Protection. El nombre de la API sigue siendo el mismo: API de Cloud Data Loss Prevention (API de DLP). Para obtener información sobre los servicios que conforman la protección de datos sensibles, consulta la descripción general de la protección de datos sensibles.

Se usó la API de Cloud Translation para traducir esta página.

Calcula la δ-presencia de un conjunto de datos

La delta-presencia (δ-presencia) es una métrica que cuantifica la probabilidad de que un individuo pertenezca a un conjunto de datos analizado. Al igual que con el k-mapa, puedes estimar valores de la δ-presencia con Sensitive Data Protection, que usa un modelo estadístico para estimar el conjunto de datos de ataque.

δ-presencia contrasta con los otros métodos de análisis de riesgos, en los que el conjunto de datos de ataque se conoce de forma explícita. Según el tipo de datos, Sensitive Data Protection usa conjuntos de datos disponibles de forma pública (por ejemplo, del Censo de EE.UU.) o un modelo estadístico personalizado (por ejemplo, una o más tablas de BigQuery que especifiques), o extrapola la distribución de valores en tu conjunto de datos de entrada.

En este tema, se muestra cómo calcular los valores de δ-presencia para un conjunto de datos con Protección de datos sensibles. Para obtener más información sobre δ-presencia o el análisis de riesgos en general, consulta el tema del concepto de análisis de riesgos antes de continuar.

Antes de comenzar

Antes de continuar, asegúrate de haber hecho lo siguiente:

Accede a tu Cuenta de Google.
En la Google Cloud consola, en la página del selector de proyectos, selecciona o crea un Google Cloud proyecto.

Ir al selector de proyectos

Asegúrate de tener habilitada la facturación para tu Google Cloud proyecto. Obtén información para confirmar que tienes habilitada la facturación para tu proyecto.
Habilita la protección de datos sensibles.

Habilita la protección de datos sensibles

Selecciona un conjunto de datos de BigQuery para analizar. La protección de datos sensibles calcula la métrica δ-presencia analizando una tabla de BigQuery.
Determina los tipos de conjuntos de datos que deseas usar para modelar el conjunto de datos de ataque. Para obtener más información, consulta la página de referencia del objeto DeltaPresenceEstimationConfig, así como los Términos y técnicas del análisis de riesgos.

Calcula las métricas de δ-presencia

Para calcular una estimación de δ-presencia con Sensitive Data Protection, envía una solicitud a la siguiente URL, en la que PROJECT_ID indica el identificador de proyecto:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

La solicitud contiene un objeto RiskAnalysisJobConfig, que se compone de lo siguiente:

Un objeto PrivacyMetric. Aquí debes especificar que deseas calcular δ-presencia mediante la especificación de un objeto DeltaPresenceEstimationConfig que contiene lo siguiente:
- quasiIds[]: Obligatorio. Los campos (objetos QuasiId) que se consideran cuasi identificadores para analizar y usar en el cálculo de la δ-presencia. No puede haber dos columnas con la misma etiqueta. Pueden ser cualquiera de los siguientes:
  - Un infoType: Esto hace que Sensitive Data Protection use el conjunto de datos públicos pertinente como un modelo estadístico de población, incluidos los códigos postales de EE.UU., los códigos regionales, las edades y los géneros.
  - Un Infotipo personalizado: una etiqueta personalizada en la que se indica una tabla auxiliar (un objeto AuxiliaryTable) que contiene información estadística sobre los posibles valores de esta columna.
  - La etiqueta inferred: si no se indica una etiqueta semántica, especifica inferred. Sensitive Data Protection infiere el modelo estadístico a partir de la distribución de valores en los datos de entrada.
- regionCode: Es un código regional ISO 3166-1 alfa-2 para que la Protección de datos sensibles lo use en el modelado estadístico. Este valor es obligatorio si ninguna columna está etiquetada con un Infotipo específico de una región (por ejemplo, un código postal de EE.UU.) o un código regional.
- auxiliaryTables[]: tablas auxiliares (objetos StatisticalTable) para usar en el análisis. Cada etiqueta personalizada que se usa para etiquetar una columna de cuasi identificadores (de quasiIds[]) debe aparecer en una sola columna de una tabla auxiliar.
Un objeto BigQueryTable. Incluye todo lo siguiente para especificar la tabla de BigQuery que se analizará:
- projectId: el ID del proyecto que contiene la tabla.
- datasetId: el ID del conjunto de datos de la tabla.
- tableId: el nombre de la tabla.
Un conjunto de uno o más objetos Action, que representan acciones para ejecutar, en el orden dado, cuando finaliza el trabajo. Cada objeto Action puede contener una de las siguientes acciones:
- Objeto SaveFindings: Guarda los resultados del análisis de riesgos en una tabla de BigQuery.
- Objeto PublishToPubSub: Publica una notificación en un tema de Cloud Pub/Sub.
Nota: Si hay problemas de configuración o permisos con el tema de Pub/Sub, la Protección de datos sensibles vuelve a intentar enviar la notificación de Pub/Sub durante un máximo de dos semanas. Después de dos semanas, se descarta la notificación.
- Objeto PublishSummaryToCscc: Guarda un resumen de los resultados en Security Command Center.
- Objeto PublishFindingsToCloudDataCatalog: Guarda los resultados en Data Catalog.
- Objeto JobNotificationEmails: Te envía un correo electrónico con los resultados.
- Objeto PublishToStackdriver: Guarda los resultados en Google Cloud Observability.

Visualiza los resultados del trabajo de δ-presencia

Para recuperar los resultados del trabajo de análisis de riesgo de δ-presencia mediante la API de REST, envía la siguiente solicitud GET al recurso projects.dlpJobs. Reemplaza PROJECT_ID por el ID del proyecto y JOB_ID por el identificador del trabajo del que deseas obtener los resultados. El ID de trabajo se mostró cuando iniciaste el trabajo y también se puede recuperar si enumeras todos los trabajos.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

La solicitud muestra un objeto JSON que contiene una instancia del trabajo. Los resultados del análisis se encuentran dentro de la clave "riskDetails", en un objeto AnalyzeDataSourceRiskDetails. Para obtener más información, consulta la referencia de la API del recurso DlpJob.

¿Qué sigue?

Obtén información para calcular el valor de k-anonimato para un conjunto de datos.
Obtén información para calcular el valor de l-diversidad para un conjunto de datos.
Obtén más información para calcular el valor k-mapa de un conjunto de datos.