Referência de métricas

Esta página lista e descreve todas as métricas coletadas nos perfis de dados.

Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.

Perfis de dados do projeto

Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.

Insights

Os perfis de dados do projeto oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de sensibilidade do projeto. Para mais informações, consulte Sensibilidade e níveis de risco de dados.

Metadados

Os perfis de dados do projeto fornecem os seguintes metadados:

Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
ID
ID do projeto que recebeu um perfil.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.

Perfis de dados da tabela

Cada perfil de dados de tabela tem os campos a seguir:

Insights

Os perfis de dados da tabela oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de sensibilidade da tabela. Para mais informações, consulte Sensibilidade e níveis de risco de dados.

Metadados

Os perfis de dados da tabela fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
ID do conjunto de dados
ID do conjunto de dados que contém a tabela.
Criptografia
Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
Expiração
Opcional. A hora em que esta tabela expira.
Contagem de colunas com falha
O número de colunas ignoradas na tabela devido a um erro.
Inspecionar snapshot de configuração
Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
Instância
A instância que contém a tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Última atualização no BigQuery
Data e hora da última modificação desta tabela.
ID
ID do projeto que contém a tabela.
Público
Se a tabela está disponível para todos os usuários ou restrita a alguns.
Rótulos de recursos
Rótulos que a tabela tinha no momento em que o perfil foi gerado.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Número de linhas
Número de linhas na tabela quando o perfil foi gerado.
Contagem de colunas verificadas
O número de colunas com perfil na tabela.
Conta de serviço
Número de contas de serviço com permissões do IAM para acessar a tabela.
Status
Indicação do êxito da geração do perfil.
ID da tabela
ID da tabela.
Horário de criação da tabela
Data e hora em que a tabela foi criada.
Tamanho da tabela
O tamanho desta tabela quando o perfil foi gerado.
Tipo
O tipo de descoberta realizada.

Perfis de dados da coluna

Cada perfil de dados de coluna tem os seguintes campos:

Insights

Os perfis de dados da coluna oferecem os seguintes insights:

Risco de dados
Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de sensibilidade desta coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
InfoType previsto

Se um único infoType integrado ou personalizado predominar claramente sobre outros na coluna, a proteção de dados confidenciais definirá esse campo como esse infoType. Caso contrário, esse campo não terá valor.

Para ver uma lista de todos os InfoTypes detectados na coluna, consulte o campo Outros InfoTypes.

A proteção de dados confidenciais verifica apenas os infoTypes especificados no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo InfoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não tiver incluído o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não conterá EMAIL_ADDRESS.

Neste documento, consulte Outros infoTypes.

Outros InfoTypes

InfoTypes detectados na coluna que não têm um indicador forte o suficiente para serem considerados o InfoType previsto dessa coluna. Neste documento, consulte InfoType previsto.

Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado nesse campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.

Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:

  • InfoType previsto: FDA_CODE
  • Outros infoTypes:PERSON_NAME (2%) e STREET_ADDRESS (1%)

Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter endereços.

A proteção de dados confidenciais verifica apenas os infoTypes especificados no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não tiver incluído o detector de infoType EMAIL_ADDRESS no modelo de inspeção, esse campo não conterá EMAIL_ADDRESS.

Proporção nula estimada

Proporção aproximada de valores nulos nesta coluna, categorizados como alto, médio, baixo ou muito baixo. Esse valor será alto se uma grande proporção de entradas nessa coluna for nula.

Exclusividade estimada

Uma estimativa de quantos dados dessa coluna são exclusivos, categorizados como altos, médios ou baixos. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores exclusivos pode indicar que a coluna contém identificadores.

Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.

Se a proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, esse valor ficará em branco.

Pontuação de texto livre

A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.

Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.

Metadados

Os perfis de dados da coluna fornecem os seguintes metadados:

Banco de dados
O banco de dados que contém a coluna da tabela com o perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
Tipo de dado
O tipo de dados do conteúdo da coluna.
ID do conjunto de dados
ID do conjunto de dados que contém a coluna da tabela.
ID do campo
Nome da coluna.
Instância
A instância que contém a coluna da tabela com o perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
Local da instância
Local da instância que contém a coluna da tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Tags de política
Indica se uma tag de política é aplicada à coluna. Para mais informações sobre as práticas recomendadas para o uso de tags de política, consulte Como usar tags de política no BigQuery.
ID
ID do projeto que contém essa coluna da tabela.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Status
Ícone que indica o status da operação de criação de perfil.
ID da tabela
ID da tabela que contém esta coluna.