Referência de métricas

Esta página lista e descreve todas as métricas coletadas nos perfis de dados.

Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.

Perfis de dados do projeto

Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.

Insights

Os perfis de dados de projeto oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade do projeto. Para saber mais, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados do projeto fornecem os seguintes metadados:

Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
ID do projeto
ID do projeto que recebeu um perfil.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.

Perfis de dados da tabela

Cada perfil de dados de tabela tem os campos a seguir:

Insights

Os perfis de dados de tabela oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade da tabela. Para saber mais, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados de tabela fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a tabela que foi analisada. Esse campo se aplica apenas à detecção do Cloud SQL.
ID do conjunto de dados
ID do conjunto de dados que contém a tabela.
Encryption
Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
Expiração
Opcional. A hora em que esta tabela expira.
Contagem de colunas com falha
O número de colunas ignoradas na tabela devido a um erro.
Inspecionar snapshot de configuração
Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
Instância
A instância que contém a tabela que foi analisada. Esse campo se aplica apenas à detecção do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Última atualização no BigQuery
Data e hora em que a tabela foi modificada pela última vez.
ID do projeto
ID do projeto que contém a tabela.
Público

Se a tabela está disponível para todos os usuários ou restrita a alguns.

Rótulos de recursos

Rótulos que a tabela tinha no momento em que o perfil foi gerado.

Tags de recurso

Tags que a tabela tinha no momento em que o perfil foi gerado.

Nome do recurso

Nome totalmente qualificado do perfil de dados.

Número de linhas

Número de linhas na tabela quando o perfil foi gerado.

Contagem de colunas verificadas

O número de colunas com perfil na tabela.

Conta de serviço

Número de contas de serviço com permissões do IAM para acessar a tabela.

Status

Indica se a geração do perfil foi bem-sucedida.

ID da tabela

É o ID dessa tabela.

Horário de criação da tabela

Data e hora em que a tabela foi criada.

Tamanho da tabela

O tamanho da tabela quando o perfil foi gerado.

Tipo

O tipo de descoberta realizada.

Perfis de dados da coluna

Cada perfil de dados de coluna tem os seguintes campos:

Insights

Os perfis de dados de coluna oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade da coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
InfoType previsto

Se um único infoType integrado ou personalizado predomina claramente sobre outros na coluna, a Proteção de dados sensíveis define esse campo como esse infoType. Caso contrário, esse campo não tem valor.

Para conferir uma lista de todos os infoTypes detectados na coluna, consulte o campo Outros infoTypes.

A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Portanto, somente esses infoTypes podem aparecer no campo infoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não conterá EMAIL_ADDRESS.

Se os dados da coluna corresponderem predominantemente a vários infoTypes relacionados que pertencem à mesma categoria geral, a Proteção de dados confidenciais definirá esse campo como o infoType mais geral. Por exemplo, se a coluna tiver principalmente uma mistura de infoTypes PASSPORT, AUSTRALIA_PASSPORT e CANADA_PASSPORT, o campo infoType previsto será definido como PASSPORT. O campo Outros infoTypes mostra os infoTypes mais específicos e a prevalência estimada deles.

Outros InfoTypes

InfoTypes detectados na coluna que não têm um indicador forte o suficiente para serem considerados o infoType previsto da coluna. Neste documento, consulte InfoType previsto.

Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado neste campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.

Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:

  • InfoType previsto:FDA_CODE
  • Outros infoTypes: PERSON_NAME (2%), STREET_ADDRESS (1%)

Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A Proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% podem conter endereços.

A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Portanto, somente esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não conterá EMAIL_ADDRESS.

Proporção nula estimada

Proporção aproximada de valores nulos nesta coluna, categorizada como alta, média, baixa ou muito baixa. Esse valor é alto se uma grande proporção de entradas nessa coluna for nula.

Exclusividade estimada

Uma estimativa de quantos dados da coluna são exclusivos, categorizados como alto, médio ou baixo. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores exclusivos pode indicar que a coluna contém identificadores.

Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.

Se a Proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, esse valor vai ficar em branco.

Pontuação de texto livre

A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.

Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.

Metadados

Os perfis de dados de coluna fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a coluna da tabela que foi criada. Esse campo se aplica apenas à descoberta do Cloud SQL.
Tipo de dado
O tipo de dados do conteúdo da coluna.
ID do conjunto de dados
ID do conjunto de dados que contém a coluna da tabela.
ID do campo
Nome da coluna.
Instância
A instância que contém a coluna da tabela que foi analisada. Esse campo se aplica apenas à descoberta do Cloud SQL.
Local da instância
Local da instância que contém a coluna da tabela que recebeu o perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Tags de política
Indica se uma tag de política é aplicada à coluna. Para saber mais sobre as práticas recomendadas para usar tags de política, consulte Como usar tags de política no BigQuery.
ID do projeto
ID do projeto que contém a coluna da tabela.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.
ID da tabela
ID da tabela que contém a coluna.

Perfis de dados do repositório de arquivos

A Proteção de dados sensíveis usa o termo armazenamento de arquivos para se referir a um bucket de armazenamento de arquivos.

Cada perfil de dados do repositório de arquivos tem os seguintes campos.

Insights

Os perfis de dados do repositório de arquivos oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Clusters de arquivos
Fornece um resumo de cada cluster de arquivos detectado quando o perfil da loja de arquivos foi criado. Para mais informações sobre cada resumo, consulte Resumos de clusters de arquivos nesta página.
Confidencialidade
Pontuação que indica o nível de sensibilidade do repositório de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados do repositório de arquivos fornecem os seguintes metadados:

Locais de armazenamento dos dados

Se você criou o perfil de um bucket do Cloud Storage com duas regiões, este campo lista as duas regiões.

Se você criou um perfil de um bucket do Amazon S3, esse valor é a região da AWS em que o bucket está armazenado.

Encryption

Se a criptografia do armazenamento de arquivos é gerenciada pelo Google ou pela sua organização.

Tipo de armazenamento de arquivo

O tipo de dados que foi criado: dados do Cloud Storage ou do Amazon S3.

Caminho do armazenamento de arquivos

O nome do repositório de arquivos.

Inspecionar snapshot de configuração

Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para mais informações, consulte Snapshots de perfil de dados.

Tipo de local

Tipo de local onde o armazenamento de arquivos é armazenado: region, dual-region ou multi-region.

Perfil criado primeiro

Data e hora em que o perfil foi criado pela primeira vez.

Última geração do perfil

Data e hora em que o perfil foi gerado pela última vez.

ID pai

O recurso que detém os dados que foram criados.

  • Se o perfil de dados for de um recurso do Google Cloud, esse será o ID do projeto que contém os dados.
  • Se o perfil de dados for de um bucket do Amazon S3, esse será o ID da conta da AWS que contém o bucket.
Público

Se o armazenamento de arquivos está disponível para todos os usuários ou restrito a alguns deles.

Rótulos de recursos

Rótulos que o repositório de arquivos tinha no momento em que o perfil foi gerado.

Tags de recurso

Tags que o repositório de arquivos tinha no momento em que o perfil foi gerado.

Local do recurso

Região ou multirregião que contém o armazenamento de arquivos.

Se você criou um perfil de um bucket do Cloud Storage biregional, esse valor depende de se o bucket está armazenado em uma região dupla predefinida:

  • Para birregiões predefinidas, a Proteção de Dados Sensíveis define esse valor como o nome da birregião predefinida.
  • Para regiões duplas padrão, a Proteção de Dados Sensíveis define esse valor como a região multirregional que contém as regiões duplas. Para informações sobre como as regiões são mapeadas para multirregiões, consulte Regiões bilateral.
Nome do recurso

Nome totalmente qualificado do perfil de dados.

Status

Indica se a geração do perfil foi bem-sucedida.

Resumos de clusters de arquivos

Quando um perfil de dados do repositório de arquivos é gerado, os arquivos são agrupados em clusters de arquivos. A Proteção de Dados Sensíveis fornece um resumo para cada cluster de arquivos.

Cada resumo de cluster de arquivos tem os seguintes campos:

Risco de dados
Nível de risco associado aos dados neste cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Erros
Todos os erros detectados quando o perfil de dados do armazenamento de arquivos foi gerado.
Extensões de arquivo verificadas
Lista de tipos de arquivos detectados e verificados para gerar o perfil de dados do armazenamento de arquivos.
Extensões de arquivo exibidas
Lista de tipos de arquivos detectados, mas não necessariamente verificados.
InfoTypes
Lista de infoTypes integrados e personalizados detectados neste cluster de arquivos.
Confidencialidade
Pontuação que indica o nível de sensibilidade do cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Tipo
Indica a categoria dos arquivos neste cluster. Para mais informações sobre todos os clusters de arquivos com suporte, consulte Clusters de arquivos.