Esta página lista e descreve todas as métricas coletadas nos perfis de dados.
Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.
Perfis de dados do projeto
Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.
Insights
Os perfis de dados do projeto oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de sensibilidade do projeto. Para mais informações, consulte Sensibilidade e níveis de risco de dados.
Metadados
Os perfis de dados do projeto fornecem os seguintes metadados:
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- ID
- ID do projeto que recebeu um perfil.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
Perfis de dados da tabela
Cada perfil de dados de tabela tem os campos a seguir:
Insights
Os perfis de dados da tabela oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de sensibilidade da tabela. Para mais informações, consulte Sensibilidade e níveis de risco de dados.
Metadados
Os perfis de dados da tabela fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
- ID do conjunto de dados
- ID do conjunto de dados que contém a tabela.
- Criptografia
- Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
- Expiração
- Opcional. A hora em que esta tabela expira.
- Contagem de colunas com falha
- O número de colunas ignoradas na tabela devido a um erro.
- Inspecionar snapshot de configuração
- Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
- Instância
- A instância que contém a tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Última atualização no BigQuery
- Data e hora da última modificação desta tabela.
- ID
- ID do projeto que contém a tabela.
- Público
- Se a tabela está disponível para todos os usuários ou restrita a alguns.
- Rótulos de recursos
- Rótulos que a tabela tinha no momento em que o perfil foi gerado.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Número de linhas
- Número de linhas na tabela quando o perfil foi gerado.
- Contagem de colunas verificadas
- O número de colunas com perfil na tabela.
- Conta de serviço
- Número de contas de serviço com permissões do IAM para acessar a tabela.
- Status
- Indicação do êxito da geração do perfil.
- ID da tabela
- ID da tabela.
- Horário de criação da tabela
- Data e hora em que a tabela foi criada.
- Tamanho da tabela
- O tamanho desta tabela quando o perfil foi gerado.
- Tipo
- O tipo de descoberta realizada.
Perfis de dados da coluna
Cada perfil de dados de coluna tem os seguintes campos:
Insights
Os perfis de dados da coluna oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de sensibilidade desta coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- InfoType previsto
Se um único infoType integrado ou personalizado predominar claramente sobre outros na coluna, a proteção de dados confidenciais definirá esse campo como esse infoType. Caso contrário, esse campo não terá valor.
Para ver uma lista de todos os InfoTypes detectados na coluna, consulte o campo Outros InfoTypes.
A proteção de dados confidenciais verifica apenas os infoTypes especificados no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo InfoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não tiver incluído o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não conteráEMAIL_ADDRESS
.Neste documento, consulte Outros infoTypes.
- Outros InfoTypes
InfoTypes detectados na coluna que não têm um indicador forte o suficiente para serem considerados o InfoType previsto dessa coluna. Neste documento, consulte InfoType previsto.
Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado nesse campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.
Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:
- InfoType previsto:
FDA_CODE
- Outros infoTypes:
PERSON_NAME (2%)
eSTREET_ADDRESS (1%)
Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter endereços.
A proteção de dados confidenciais verifica apenas os infoTypes especificados no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não tiver incluído o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não conteráEMAIL_ADDRESS
.- InfoType previsto:
- Proporção nula estimada
Proporção aproximada de valores nulos nesta coluna, categorizados como alto, médio, baixo ou muito baixo. Esse valor será alto se uma grande proporção de entradas nessa coluna for nula.
- Exclusividade estimada
Uma estimativa de quantos dados dessa coluna são exclusivos, categorizados como altos, médios ou baixos. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores exclusivos pode indicar que a coluna contém identificadores.
Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.
Se a proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, esse valor ficará em branco.
- Pontuação de texto livre
A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.
Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.
Metadados
Os perfis de dados da coluna fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a coluna da tabela com o perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Tipo de dado
- O tipo de dados do conteúdo da coluna.
- ID do conjunto de dados
- ID do conjunto de dados que contém a coluna da tabela.
- ID do campo
- Nome da coluna.
- Instância
- A instância que contém a coluna da tabela com o perfil criado. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Local da instância
- Local da instância que contém a coluna da tabela com o perfil criado. Esse campo se aplica somente à descoberta do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Tags de política
- Indica se uma tag de política é aplicada à coluna. Para mais informações sobre as práticas recomendadas para o uso de tags de política, consulte Como usar tags de política no BigQuery.
- ID
- ID do projeto que contém essa coluna da tabela.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
- ID da tabela
- ID da tabela que contém esta coluna.