Esta página lista e descreve todas as métricas coletadas nos perfis de dados.
Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.
Perfis de dados do projeto
Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.
Insights
Os perfis de dados do projeto oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do projeto. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados do projeto fornecem os seguintes metadados:
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- ID do projeto
- ID do projeto que recebeu um perfil.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
Perfis de dados da tabela
Cada perfil de dados de tabela tem os campos a seguir:
Insights
Os perfis de dados da tabela oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade da tabela. Para mais informações, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados de tabela fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a tabela com perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
- ID do conjunto de dados
- ID do conjunto de dados que contém a tabela.
- Encryption
- Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
- Expiração
- Opcional. A hora em que esta tabela expira.
- Contagem de colunas com falha
- O número de colunas ignoradas na tabela devido a um erro.
- Inspecionar snapshot de configuração
- Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
- Instância
- A instância que contém a tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Última atualização no BigQuery
- Data e hora em que a tabela foi modificada pela última vez.
- ID do projeto
- ID do projeto que contém a tabela.
- Público
Se a tabela está disponível para todos os usuários ou restrita a alguns.
- Rótulos de recursos
Rótulos que a tabela tinha no momento em que o perfil foi gerado.
- Tags de recurso
Tags que a tabela tinha no momento em que o perfil foi gerado.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Número de linhas
Número de linhas na tabela quando o perfil foi gerado.
- Contagem de colunas verificadas
O número de colunas com perfil na tabela.
- Conta de serviço
Número de contas de serviço com permissões do IAM para acessar a tabela.
- Status
Indicação de se o perfil foi gerado.
- ID da tabela
ID da tabela.
- Horário de criação da tabela
Data e hora em que a tabela foi criada.
- Tamanho da tabela
O tamanho da tabela quando o perfil foi gerado.
- Tipo
O tipo de descoberta realizada.
Perfis de dados da coluna
Cada perfil de dados de coluna tem os seguintes campos:
Insights
Os perfis de dados da coluna oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade da coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- InfoType previsto
Se um único infoType integrado ou personalizado predominar claramente sobre outros na coluna, a Proteção de dados sensíveis vai definir esse campo como esse infoType. Caso contrário, esse campo não terá valor.
Para ver uma lista de todos os infoTypes detectados na coluna, consulte o campo Outros infoTypes.
A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Assim, somente esses infoTypes podem aparecer no campo InfoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não vai conterEMAIL_ADDRESS
.Se os dados da coluna corresponderem predominantemente a vários infoTypes relacionados que pertencem à mesma categoria geral, a Proteção de Dados Sensíveis definirá esse campo como o infoType mais geral. Por exemplo, se a coluna tiver predominantemente uma mistura de infoTypes
PASSPORT
,AUSTRALIA_PASSPORT
eCANADA_PASSPORT
, o campo InfoType previsto será definido comoPASSPORT
. O campo Outros infoTypes mostra os infoTypes mais específicos e a prevalência estimada deles.- Outros InfoTypes
InfoTypes detectados na coluna que não têm um sinal forte o suficiente para serem considerados o infoType previsto da coluna. Neste documento, consulte InfoType previsto.
Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado nesse campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.
Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:
- InfoType previsto:
FDA_CODE
- Outros infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter endereços.
A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Assim, somente esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não vai conterEMAIL_ADDRESS
.- InfoType previsto:
- Proporção nula estimada
Proporção aproximada de valores nulos nesta coluna, classificada como alta, média, baixa ou muito baixa. Esse valor é alto se uma grande proporção de entradas nessa coluna for nula.
- Exclusividade estimada
Uma estimativa de quantos dados da coluna são exclusivos, categorizados como alto, médio ou baixo. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores únicos pode indicar que a coluna contém identificadores.
Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.
Se a Proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, o valor vai ficar em branco.
- Pontuação de texto livre
A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.
Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.
Metadados
Os perfis de dados da coluna fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a coluna da tabela que foi analisada. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Tipo de dado
- O tipo de dados do conteúdo da coluna.
- ID do conjunto de dados
- ID do conjunto de dados que contém a coluna da tabela.
- ID do campo
- Nome da coluna.
- Instância
- A instância que contém a coluna da tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Local da instância
- Local da instância que contém a coluna da tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Tags de política
- Indica se uma tag de política é aplicada à coluna. Para saber mais sobre as práticas recomendadas de uso das tags de política, consulte Como usar tags de política no BigQuery.
- ID do projeto
- ID do projeto que contém a coluna da tabela.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
- ID da tabela
- ID da tabela que contém a coluna.
Perfis de dados do repositório de arquivos
A Proteção de dados sensíveis usa o termo repositório de arquivos para se referir a um bucket ou contêiner de armazenamento de arquivos.
Cada perfil de dados do repositório de arquivos tem os seguintes campos.
Insights
Os perfis de dados do repositório de arquivos oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Clusters de arquivos
- Fornece um resumo de cada cluster de arquivos detectado quando o perfil desse repositório de arquivos foi criado. Para mais informações sobre cada resumo, consulte Resumos de clusters de arquivos nesta página.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do repositório de arquivos. Para mais informações, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados do repositório de arquivos fornecem os seguintes metadados:
- Locais de armazenamento dos dados
Se você criou um perfil de um bucket birregional do Cloud Storage, esse campo vai listar as duas regiões.
Se você criou um perfil de um armazenamento de arquivos de outro provedor de nuvem, esse valor é a região em que o provedor armazena o armazenamento de arquivos.
- Criptografia
Se a criptografia para esse armazenamento de arquivos é gerenciada pelo Google ou pela sua organização.
- Tipo de armazenamento de arquivo
A origem dos dados que foram analisados: Cloud Storage, Amazon S3 ou Azure Blob Storage.
- Caminho do armazenamento de arquivos
O nome do repositório de arquivos.
- Inspecionar snapshot de configuração
Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para mais informações, consulte Snapshots de perfil de dados.
- Tipo de local
Tipo de local onde o armazenamento de arquivos está armazenado:
region
,dual-region
oumulti-region
.- Perfil criado primeiro
Data e hora em que o perfil foi criado pela primeira vez.
- Última geração do perfil
Data e hora em que o perfil foi gerado pela última vez.
- ID pai
O recurso que possui os dados analisados.
- Se o perfil de dados for de um recurso Google Cloud , este será o ID do projeto que contém os dados.
- Se o perfil de dados for de um bucket do Amazon S3, esse será o ID da conta da AWS que contém o bucket.
- Se o perfil de dados for de um contêiner do Azure Blob Storage, este será o ID da assinatura do Azure que contém o contêiner.
- Público
Se o armazenamento de arquivos está disponível para todos os usuários ou restrito a alguns.
- Rótulos de recursos
Rótulos que o repositório de arquivos tinha quando o perfil foi gerado.
- Tags de recurso
Tags que o repositório de arquivos tinha quando o perfil foi gerado.
- Local do recurso
Região ou multirregião que contém o armazenamento de arquivos.
Se você criou um perfil de um bucket birregional do Cloud Storage, esse valor depende de se o bucket está armazenado em uma região dupla predefinida:
- Para birregiões predefinidas, a Proteção de Dados Sensíveis define esse valor como o nome da birregião predefinida.
- Para regiões duplas padrão, a Proteção de Dados Sensíveis define esse valor como a multirregião que contém as regiões duplas. Para saber como as regiões são mapeadas para multirregiões, consulte Regiões duplas.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Status
Indicação de se o perfil foi gerado.
Resumos de clusters de arquivos
Quando um perfil de dados do repositório de arquivos é gerado, os arquivos são agrupados em clusters. A Proteção de Dados Sensíveis fornece um resumo para cada cluster de arquivos.
Cada resumo de cluster de arquivo tem os seguintes campos:
- Risco de dados
- Nível de risco associado aos dados neste cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Erros
- Todos os erros detectados quando o perfil de dados do armazenamento de arquivos foi gerado.
- Extensões de arquivo verificadas
- Lista de tipos de arquivos detectados e verificados para gerar o perfil de dados do armazenamento de arquivos.
- Extensões de arquivo mostradas
- Lista de tipos de arquivo detectados, mas não necessariamente verificados.
- InfoTypes
- Lista de infoTypes integrados e personalizados detectados neste cluster de arquivos.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Tipo
Indica a categoria de arquivos neste cluster. Para mais informações sobre todos os clusters de arquivos compatíveis, consulte Clusters de arquivos compatíveis em operações de descoberta.