Puedes usar la Protección de datos sensibles para calcular estadísticas numéricas y categóricas para columnas individuales en tablas de BigQuery. Sensitive Data Protection puede calcular lo siguiente:
- El valor mínimo de la columna
- El valor máximo de la columna
- Valores cuantiles de la columna
- Un histograma de frecuencias de valores en la columna
Calcula estadísticas numéricas
Puedes determinar los valores mínimo, máximo y cuantil para una columna individual de BigQuery. Si deseas calcular estos valores, configura una DlpJob
y establece la métrica de privacidad NumericalStatsConfig
en el nombre de la columna que se analizará. Cuando ejecutas el trabajo, Sensitive Data Protection calcula las estadísticas para la columna determinada y muestra los resultados en el objeto NumericalStatsResult
. Sensitive Data Protection puede calcular estadísticas para los siguientes tipos de números:
- integer
- flotante
- fecha
- fecha y hora
- marca de tiempo
- Hora
Las estadísticas que muestra el análisis incluyen el valor mínimo, el valor máximo y 99 valores cuantiles que dividen el conjunto de valores de campo en 100 buckets del mismo tamaño.
Ejemplos de código
A continuación, se muestra un código de muestra en varios lenguajes que demuestra cómo usar la Protección de datos sensibles para calcular estadísticas numéricas.
C#
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
PHP
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Calcula estadísticas numéricas categóricas
Puedes calcular estadísticas numéricas categóricas como las siguientes para los depósitos de histogramas individuales dentro de una columna de BigQuery:
- Límite superior de la frecuencia de valor dentro de un bucket dado
- Límite inferior de la frecuencia de valor dentro de un bucket dado
- Tamaño de un bucket dado
- Una muestra de frecuencias de valor dentro de un grupo dado (máximo: 20)
Si deseas calcular estos valores, configura una DlpJob
y establece la métrica de privacidad CategoricalStatsConfig
en el nombre de la columna que se analizará. Cuando ejecutas el trabajo, Sensitive Data Protection calcula las estadísticas para la columna determinada y muestra los resultados en el objeto CategoricalStatsResult
.
Ejemplos de código
A continuación, se muestran ejemplos de código en varios lenguajes que demuestran cómo usar la Protección de datos sensibles para calcular estadísticas categóricas.
C#
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
PHP
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.