Puedes usar Protección de Datos Sensibles para calcular estadísticas numéricas y categóricas de columnas concretas de tablas de BigQuery. Protección de Datos Sensibles puede calcular lo siguiente:
- Valor mínimo de la columna
- Valor máximo de la columna
- Valores de los cuantiles de la columna
- Un histograma de las frecuencias de los valores de la columna
Calcular estadísticas numéricas
Puedes determinar los valores mínimo, máximo y de cuantiles de una columna de BigQuery. Para calcular estos valores, configura un DlpJob
y define la métrica de privacidad NumericalStatsConfig
con el nombre de la columna que se va a analizar. Cuando ejecutas la tarea, Protección de Datos Sensibles calcula las estadísticas de la columna dada y devuelve los resultados en el objeto NumericalStatsResult
. Protección de Datos Sensibles puede calcular estadísticas de los siguientes tipos de números:
- entero
- flotante
- fecha
- datetime
- timestamp
- Tiempo
Las estadísticas que devuelve un análisis incluyen el valor mínimo, el valor máximo y 99 valores de cuantiles que dividen el conjunto de valores de campo en 100 segmentos de igual tamaño.
Ejemplos de código
A continuación, se muestra un código de ejemplo en varios lenguajes que explica cómo usar Protección de Datos Sensibles para calcular estadísticas numéricas.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Calcular estadísticas numéricas categóricas
Puedes calcular estadísticas numéricas categóricas de los contenedores de histogramas individuales de una columna de BigQuery, como las siguientes:
- Límite superior de la frecuencia de los valores en un segmento determinado.
- Límite inferior de la frecuencia de los valores de un segmento determinado.
- Tamaño de un segmento determinado
- Una muestra de las frecuencias de los valores de un segmento determinado (máximo 20)
Para calcular estos valores, configura un DlpJob
y define la métrica de privacidad CategoricalStatsConfig
con el nombre de la columna que se va a analizar. Cuando ejecutas la tarea, Protección de Datos Sensibles calcula las estadísticas de la columna dada y devuelve los resultados en el objeto CategoricalStatsResult
.
Ejemplos de código
A continuación, se muestra un código de ejemplo en varios lenguajes que explica cómo usar Protección de Datos Sensibles para calcular estadísticas categóricas.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.