Referência de métricas

Esta página lista e descreve todas as métricas coletadas nos perfis de dados.

Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.

Perfis de dados do projeto

Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.

Insights

Os perfis de dados do projeto oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade do projeto. Para saber mais, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados do projeto fornecem os seguintes metadados:

Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
ID do projeto
ID do projeto que recebeu um perfil.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.

Perfis de dados da tabela

Cada perfil de dados de tabela tem os campos a seguir:

Insights

Os perfis de dados da tabela oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade da tabela. Para mais informações, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados de tabela fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a tabela com perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
ID do conjunto de dados
ID do conjunto de dados que contém a tabela.
Encryption
Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
Expiração
Opcional. A hora em que esta tabela expira.
Contagem de colunas com falha
O número de colunas ignoradas na tabela devido a um erro.
Inspecionar snapshot de configuração
Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
Instância
A instância que contém a tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Última atualização no BigQuery
Data e hora em que a tabela foi modificada pela última vez.
ID do projeto
ID do projeto que contém a tabela.
Público

Se a tabela está disponível para todos os usuários ou restrita a alguns.

Rótulos de recursos

Rótulos que a tabela tinha no momento em que o perfil foi gerado.

Tags de recurso

Tags que a tabela tinha no momento em que o perfil foi gerado.

Nome do recurso

Nome totalmente qualificado do perfil de dados.

Número de linhas

Número de linhas na tabela quando o perfil foi gerado.

Contagem de colunas verificadas

O número de colunas com perfil na tabela.

Conta de serviço

Número de contas de serviço com permissões do IAM para acessar a tabela.

Status

Indicação de se o perfil foi gerado.

ID da tabela

ID da tabela.

Horário de criação da tabela

Data e hora em que a tabela foi criada.

Tamanho da tabela

O tamanho da tabela quando o perfil foi gerado.

Tipo

O tipo de descoberta realizada.

Perfis de dados da coluna

Cada perfil de dados de coluna tem os seguintes campos:

Insights

Os perfis de dados da coluna oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Confidencialidade
Pontuação que indica o nível de sensibilidade da coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
InfoType previsto

Se um único infoType integrado ou personalizado predominar claramente sobre outros na coluna, a Proteção de dados sensíveis vai definir esse campo como esse infoType. Caso contrário, esse campo não terá valor.

Para ver uma lista de todos os infoTypes detectados na coluna, consulte o campo Outros infoTypes.

A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Assim, somente esses infoTypes podem aparecer no campo InfoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não vai conter EMAIL_ADDRESS.

Se os dados da coluna corresponderem predominantemente a vários infoTypes relacionados que pertencem à mesma categoria geral, a Proteção de Dados Sensíveis definirá esse campo como o infoType mais geral. Por exemplo, se a coluna tiver predominantemente uma mistura de infoTypes PASSPORT, AUSTRALIA_PASSPORT e CANADA_PASSPORT, o campo InfoType previsto será definido como PASSPORT. O campo Outros infoTypes mostra os infoTypes mais específicos e a prevalência estimada deles.

Outros InfoTypes

InfoTypes detectados na coluna que não têm um sinal forte o suficiente para serem considerados o infoType previsto da coluna. Neste documento, consulte InfoType previsto.

Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado nesse campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.

Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:

  • InfoType previsto:FDA_CODE
  • Outros infoTypes:PERSON_NAME (2%), STREET_ADDRESS (1%)

Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter endereços.

A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Assim, somente esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não vai conter EMAIL_ADDRESS.

Proporção nula estimada

Proporção aproximada de valores nulos nesta coluna, classificada como alta, média, baixa ou muito baixa. Esse valor é alto se uma grande proporção de entradas nessa coluna for nula.

Exclusividade estimada

Uma estimativa de quantos dados da coluna são exclusivos, categorizados como alto, médio ou baixo. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores únicos pode indicar que a coluna contém identificadores.

Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.

Se a Proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, o valor vai ficar em branco.

Pontuação de texto livre

A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.

Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.

Metadados

Os perfis de dados da coluna fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a coluna da tabela que foi analisada. Esse campo se aplica apenas à descoberta do Cloud SQL.
Tipo de dado
O tipo de dados do conteúdo da coluna.
ID do conjunto de dados
ID do conjunto de dados que contém a coluna da tabela.
ID do campo
Nome da coluna.
Instância
A instância que contém a coluna da tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
Local da instância
Local da instância que contém a coluna da tabela para a qual foi criado um perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Tags de política
Indica se uma tag de política é aplicada à coluna. Para saber mais sobre as práticas recomendadas de uso das tags de política, consulte Como usar tags de política no BigQuery.
ID do projeto
ID do projeto que contém a coluna da tabela.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.
ID da tabela
ID da tabela que contém a coluna.

Perfis de dados do repositório de arquivos

A Proteção de dados sensíveis usa o termo repositório de arquivos para se referir a um bucket ou contêiner de armazenamento de arquivos.

Cada perfil de dados do repositório de arquivos tem os seguintes campos.

Insights

Os perfis de dados do repositório de arquivos oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Clusters de arquivos
Fornece um resumo de cada cluster de arquivos detectado quando o perfil desse repositório de arquivos foi criado. Para mais informações sobre cada resumo, consulte Resumos de clusters de arquivos nesta página.
Confidencialidade
Pontuação que indica o nível de sensibilidade do repositório de arquivos. Para mais informações, consulte Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados do repositório de arquivos fornecem os seguintes metadados:

Locais de armazenamento dos dados

Se você criou um perfil de um bucket birregional do Cloud Storage, esse campo vai listar as duas regiões.

Se você criou um perfil de um armazenamento de arquivos de outro provedor de nuvem, esse valor é a região em que o provedor armazena o armazenamento de arquivos.

Criptografia

Se a criptografia para esse armazenamento de arquivos é gerenciada pelo Google ou pela sua organização.

Tipo de armazenamento de arquivo

A origem dos dados que foram analisados: Cloud Storage, Amazon S3 ou Azure Blob Storage.

Caminho do armazenamento de arquivos

O nome do repositório de arquivos.

Inspecionar snapshot de configuração

Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para mais informações, consulte Snapshots de perfil de dados.

Tipo de local

Tipo de local onde o armazenamento de arquivos está armazenado: region, dual-region ou multi-region.

Perfil criado primeiro

Data e hora em que o perfil foi criado pela primeira vez.

Última geração do perfil

Data e hora em que o perfil foi gerado pela última vez.

ID pai

O recurso que possui os dados analisados.

  • Se o perfil de dados for de um recurso Google Cloud , este será o ID do projeto que contém os dados.
  • Se o perfil de dados for de um bucket do Amazon S3, esse será o ID da conta da AWS que contém o bucket.
  • Se o perfil de dados for de um contêiner do Azure Blob Storage, este será o ID da assinatura do Azure que contém o contêiner.
Público

Se o armazenamento de arquivos está disponível para todos os usuários ou restrito a alguns.

Rótulos de recursos

Rótulos que o repositório de arquivos tinha quando o perfil foi gerado.

Tags de recurso

Tags que o repositório de arquivos tinha quando o perfil foi gerado.

Local do recurso

Região ou multirregião que contém o armazenamento de arquivos.

Se você criou um perfil de um bucket birregional do Cloud Storage, esse valor depende de se o bucket está armazenado em uma região dupla predefinida:

  • Para birregiões predefinidas, a Proteção de Dados Sensíveis define esse valor como o nome da birregião predefinida.
  • Para regiões duplas padrão, a Proteção de Dados Sensíveis define esse valor como a multirregião que contém as regiões duplas. Para saber como as regiões são mapeadas para multirregiões, consulte Regiões duplas.
Nome do recurso

Nome totalmente qualificado do perfil de dados.

Status

Indicação de se o perfil foi gerado.

Resumos de clusters de arquivos

Quando um perfil de dados do repositório de arquivos é gerado, os arquivos são agrupados em clusters. A Proteção de Dados Sensíveis fornece um resumo para cada cluster de arquivos.

Cada resumo de cluster de arquivo tem os seguintes campos:

Risco de dados
Nível de risco associado aos dados neste cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Erros
Todos os erros detectados quando o perfil de dados do armazenamento de arquivos foi gerado.
Extensões de arquivo verificadas
Lista de tipos de arquivos detectados e verificados para gerar o perfil de dados do armazenamento de arquivos.
Extensões de arquivo mostradas
Lista de tipos de arquivo detectados, mas não necessariamente verificados.
InfoTypes
Lista de infoTypes integrados e personalizados detectados neste cluster de arquivos.
Confidencialidade
Pontuação que indica o nível de sensibilidade do cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Tipo

Indica a categoria de arquivos neste cluster. Para mais informações sobre todos os clusters de arquivos compatíveis, consulte Clusters de arquivos compatíveis em operações de descoberta.