É possível usar a Proteção de dados sensíveis para calcular estatísticas numéricas e categóricas para colunas individuais em tabelas do BigQuery. A Proteção de Dados Sensíveis pode calcular o seguinte:
- o valor mínimo da coluna
- o valor máximo da coluna
- Valores de quantil da coluna
- um histograma de frequências de valor na coluna
Calcular estatísticas numéricas
É possível determinar valores mínimos, máximos e de quantil para colunas individuais do BigQuery. Para calcular esses valores, configure um
DlpJob
,
definindo a
métrica de privacidade NumericalStatsConfig
como o nome. da coluna a ser verificada. Quando você executa o
job,
a Proteção de dados confidenciais calcula estatísticas para a coluna especificada e retorna
os resultados no objeto
NumericalStatsResult
. A Proteção de Dados Sensíveis pode calcular estatísticas para os seguintes
tipos de números:
- integer
- flutuante
- data
- data/hora
- carimbo de data/hora
- time
As estatísticas apresentadas pela verificação incluem o valor mínimo, o valor máximo e 99 valores de quantil que particionam o conjunto de valores de campo em 100 buckets de tamanhos iguais.
Exemplos de código
O exemplo de código a seguir demonstra em várias linguagens como usar a Proteção de dados sensíveis para calcular estatísticas numéricas.
C#
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Go
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
PHP
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Calcular estatísticas categóricas numéricas
É possível calcular estatísticas categóricas numéricas para os buckets de histograma individuais em uma coluna do BigQuery, incluindo:
- limite superior na frequência de valor de um determinado bucket;
- limite inferior na frequência de valor de um determinado bucket;
- tamanho de um determinado bucket;
- uma amostra de frequências de valor de um determinado bucket (máximo de 20).
Para calcular esses valores, configure um
DlpJob
,
definindo a
métrica de privacidade CategoricalStatsConfig
como o nome. da coluna a ser verificada. Quando você executa o
job,
a Proteção de dados confidenciais calcula estatísticas para a coluna especificada e retorna
os resultados no objeto
CategoricalStatsResult
.
Exemplos de código
O exemplo de código a seguir demonstra em várias linguagens como usar a Proteção de dados sensíveis para calcular estatísticas categóricas.
C#
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Go
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
PHP
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente para a Proteção de dados sensíveis, consulte Bibliotecas de cliente para a Proteção de dados sensíveis.
Para autenticar na Proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.