Pode usar a proteção de dados confidenciais para calcular estatísticas numéricas e categóricas para colunas individuais em tabelas do BigQuery. A Proteção de dados confidenciais pode calcular o seguinte:
- O valor mínimo da coluna
- O valor máximo da coluna
- Valores de quantil para a coluna
- Um histograma das frequências de valores na coluna
Calcular estatísticas numéricas
Pode determinar os valores mínimo, máximo e quantil para uma coluna do BigQuery individual. Para calcular estes valores, configure uma
DlpJob
,
definindo a
NumericalStatsConfig
métrica de privacidade com o nome da coluna a analisar. Quando executa a
tarefa,
a Proteção de dados confidenciais calcula estatísticas para a coluna especificada, devolvendo
os respetivos resultados no objeto
NumericalStatsResult
. A Proteção de dados confidenciais pode calcular estatísticas para os seguintes tipos de números:
- número inteiro
- flutuante
- data
- datetime
- timestamp
- tempo
As estatísticas devolvidas por uma execução de análise incluem o valor mínimo, o valor máximo e 99 valores de quantil que dividem o conjunto de valores de campos em 100 recipientes de tamanho igual.
Exemplos de código
Segue-se um exemplo de código em vários idiomas que demonstra como usar a proteção de dados confidenciais para calcular estatísticas numéricas.
C#
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Go
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
PHP
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Calcule estatísticas numéricas categóricas
Pode calcular estatísticas numéricas categóricas para os intervalos do histograma individuais numa coluna do BigQuery, incluindo:
- Limite superior da frequência de valores num determinado contentor
- Limite inferior da frequência de valores num determinado contentor
- Tamanho de um determinado segmento
- Uma amostra das frequências de valores num determinado grupo (máximo de 20)
Para calcular estes valores, configure uma
DlpJob
,
definindo a
CategoricalStatsConfig
métrica de privacidade com o nome da coluna a analisar. Quando executa a
tarefa,
a Proteção de dados confidenciais calcula estatísticas para a coluna especificada, devolvendo
os respetivos resultados no objeto
CategoricalStatsResult
.
Exemplos de código
Segue-se um exemplo de código em vários idiomas que demonstra como usar a proteção de dados confidenciais para calcular estatísticas categóricas.
C#
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Go
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
PHP
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.