Esta página lista e descreve todas as métricas coletadas nos perfis de dados.
Existem três tipos de perfis de dados: perfis de dados do projeto, perfis de dados da tabela e perfis de dados da coluna.
Perfis de dados do projeto
Cada perfil de dados de projeto tem os campos a seguir. Os valores desses campos são agregados com base nos recursos criados no perfil do projeto.
Insights
Os perfis de dados de projeto oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do projeto. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados do projeto fornecem os seguintes metadados:
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- ID do projeto
- ID do projeto que recebeu um perfil.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
Perfis de dados da tabela
Cada perfil de dados de tabela tem os campos a seguir:
Insights
Os perfis de dados de tabela oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade da tabela. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados de tabela fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a tabela que foi criada. Esse campo se aplica apenas à detecção do Cloud SQL.
- ID do conjunto de dados
- ID do conjunto de dados que contém a tabela.
- Encryption
- Se a criptografia da tabela é gerenciada pelo Google ou pela sua organização.
- Expiração
- Opcional. A hora em que esta tabela expira.
- Contagem de colunas com falha
- O número de colunas ignoradas na tabela devido a um erro.
- Inspecionar snapshot de configuração
- Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para saber mais, consulte Snapshots de perfil de dados.
- Instância
- A instância que contém a tabela que foi analisada. Esse campo se aplica apenas à detecção do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Última atualização no BigQuery
- Data e hora em que a tabela foi modificada pela última vez.
- ID do projeto
- ID do projeto que contém a tabela.
- Público
Se a tabela está disponível para todos os usuários ou restrita a alguns.
- Rótulos de recursos
Rótulos que a tabela tinha no momento em que o perfil foi gerado.
- Tags de recurso
Tags que a tabela tinha no momento em que o perfil foi gerado.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Número de linhas
Número de linhas na tabela quando o perfil foi gerado.
- Contagem de colunas verificadas
O número de colunas com perfil na tabela.
- Conta de serviço
Número de contas de serviço com permissões do IAM para acessar a tabela.
- Status
Indica se a geração do perfil foi bem-sucedida.
- ID da tabela
É o ID dessa tabela.
- Horário de criação da tabela
Data e hora em que a tabela foi criada.
- Tamanho da tabela
O tamanho da tabela quando o perfil foi gerado.
- Tipo
O tipo de descoberta realizada.
Perfis de dados da coluna
Cada perfil de dados de coluna tem os seguintes campos:
Insights
Os perfis de dados de coluna oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade da coluna. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- InfoType previsto
Se um único infoType integrado ou personalizado predomina claramente sobre outros na coluna, a Proteção de dados sensíveis define esse campo como esse infoType. Caso contrário, esse campo não tem valor.
Para conferir uma lista de todos os infoTypes detectados na coluna, consulte o campo Outros infoTypes.
A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Portanto, somente esses infoTypes podem aparecer no campo infoType previsto. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não conteráEMAIL_ADDRESS
.Se os dados da coluna corresponderem predominantemente a vários infoTypes relacionados que pertencem à mesma categoria geral, a Proteção de dados confidenciais definirá esse campo como o infoType mais geral. Por exemplo, se a coluna tiver principalmente uma mistura de infoTypes
PASSPORT
,AUSTRALIA_PASSPORT
eCANADA_PASSPORT
, o campo infoType previsto será definido comoPASSPORT
. O campo Outros infoTypes mostra os infoTypes mais específicos e a prevalência estimada deles.- Outros InfoTypes
InfoTypes detectados na coluna que não têm um indicador forte o suficiente para serem considerados o infoType previsto da coluna. Neste documento, consulte InfoType previsto.
Para perfis de dados gerados após 13 de outubro de 2022, cada infoType listado neste campo tem uma prevalência estimada. A prevalência estimada é uma porcentagem aproximada de linhas não nulas em que o infoType foi detectado.
Por exemplo, suponha que você tenha uma coluna com as seguintes métricas:
- InfoType previsto:
FDA_CODE
- Outros infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
Neste exemplo, há uma forte indicação de que a coluna contém códigos da FDA. A Proteção de dados sensíveis também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% podem conter endereços.
A Proteção de dados sensíveis verifica apenas os infoTypes especificados no modelo de inspeção. Portanto, somente esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de e-mail, mas você não incluir o detector de infoType
EMAIL_ADDRESS
no modelo de inspeção, esse campo não conteráEMAIL_ADDRESS
.- InfoType previsto:
- Proporção nula estimada
Proporção aproximada de valores nulos nesta coluna, categorizada como alta, média, baixa ou muito baixa. Esse valor é alto se uma grande proporção de entradas nessa coluna for nula.
- Exclusividade estimada
Uma estimativa de quantos dados da coluna são exclusivos, categorizados como alto, médio ou baixo. Um nível alto de exclusividade sugere que a coluna contém valores distintos. Uma alta presença de valores exclusivos pode indicar que a coluna contém identificadores.
Um nível baixo de exclusividade sugere que a coluna contém muitos valores comuns, como tipos enumerados ou valores booleanos.
Se a Proteção de dados sensíveis determinar que não há linhas suficientes na tabela para calcular essa métrica, esse valor vai ficar em branco.
- Pontuação de texto livre
A probabilidade da coluna conter texto de forma livre. Um valor próximo de 1 indica que a coluna provavelmente terá texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.
Uma alta pontuação de texto livre pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.
Metadados
Os perfis de dados de coluna fornecem os seguintes metadados:
- Banco de dados
- O banco de dados que contém a coluna da tabela que foi criada. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Tipo de dado
- O tipo de dados do conteúdo da coluna.
- ID do conjunto de dados
- ID do conjunto de dados que contém a coluna da tabela.
- ID do campo
- Nome da coluna.
- Instância
- A instância que contém a coluna da tabela que foi analisada. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Local da instância
- Local da instância que contém a coluna da tabela que recebeu o perfil. Esse campo se aplica apenas à descoberta do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Tags de política
- Indica se uma tag de política é aplicada à coluna. Para saber mais sobre as práticas recomendadas para usar tags de política, consulte Como usar tags de política no BigQuery.
- ID do projeto
- ID do projeto que contém a coluna da tabela.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Status
- Ícone que indica o status da operação de criação de perfil.
- ID da tabela
- ID da tabela que contém a coluna.
Perfis de dados do repositório de arquivos
A Proteção de dados sensíveis usa o termo armazenamento de arquivos para se referir a um bucket de armazenamento de arquivos.
Cada perfil de dados do repositório de arquivos tem os seguintes campos.
Insights
Os perfis de dados do repositório de arquivos oferecem os seguintes insights:
- Risco de dados
- Nível de risco associado aos dados no estado atual. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Clusters de arquivos
- Fornece um resumo de cada cluster de arquivos detectado quando o perfil da loja de arquivos foi criado. Para mais informações sobre cada resumo, consulte Resumos de clusters de arquivos nesta página.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do repositório de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados do repositório de arquivos fornecem os seguintes metadados:
- Locais de armazenamento dos dados
Se você criou o perfil de um bucket do Cloud Storage com duas regiões, este campo lista as duas regiões.
Se você criou um perfil de um bucket do Amazon S3, esse valor é a região da AWS em que o bucket está armazenado.
- Encryption
Se a criptografia do armazenamento de arquivos é gerenciada pelo Google ou pela sua organização.
- Tipo de armazenamento de arquivo
O tipo de dados que foi criado: dados do Cloud Storage ou do Amazon S3.
- Caminho do armazenamento de arquivos
O nome do repositório de arquivos.
- Inspecionar snapshot de configuração
Snapshot do modelo de inspeção usado quando o perfil foi gerado. Para mais informações, consulte Snapshots de perfil de dados.
- Tipo de local
Tipo de local onde o armazenamento de arquivos é armazenado:
region
,dual-region
oumulti-region
.- Perfil criado primeiro
Data e hora em que o perfil foi criado pela primeira vez.
- Última geração do perfil
Data e hora em que o perfil foi gerado pela última vez.
- ID pai
O recurso que detém os dados que foram criados.
- Se o perfil de dados for de um recurso do Google Cloud, esse será o ID do projeto que contém os dados.
- Se o perfil de dados for de um bucket do Amazon S3, esse será o ID da conta da AWS que contém o bucket.
- Público
Se o armazenamento de arquivos está disponível para todos os usuários ou restrito a alguns deles.
- Rótulos de recursos
Rótulos que o repositório de arquivos tinha no momento em que o perfil foi gerado.
- Tags de recurso
Tags que o repositório de arquivos tinha no momento em que o perfil foi gerado.
- Local do recurso
Região ou multirregião que contém o armazenamento de arquivos.
Se você criou um perfil de um bucket do Cloud Storage biregional, esse valor depende de se o bucket está armazenado em uma região dupla predefinida:
- Para birregiões predefinidas, a Proteção de Dados Sensíveis define esse valor como o nome da birregião predefinida.
- Para regiões duplas padrão, a Proteção de Dados Sensíveis define esse valor como a região multirregional que contém as regiões duplas. Para saber como as regiões são mapeadas para multirregiões, consulte Regiões bilateral.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Status
Indica se a geração do perfil foi bem-sucedida.
Resumos de clusters de arquivos
Quando um perfil de dados do repositório de arquivos é gerado, os arquivos são agrupados em clusters de arquivos. A Proteção de Dados Sensíveis fornece um resumo para cada cluster de arquivos.
Cada resumo de cluster de arquivos tem os seguintes campos:
- Risco de dados
- Nível de risco associado aos dados neste cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Erros
- Todos os erros detectados quando o perfil de dados do armazenamento de arquivos foi gerado.
- Extensões de arquivo verificadas
- Lista de tipos de arquivos detectados e verificados para gerar o perfil de dados do armazenamento de arquivos.
- Extensões de arquivo exibidas
- Lista de tipos de arquivos detectados, mas não necessariamente verificados.
- InfoTypes
- Lista de infoTypes integrados e personalizados detectados neste cluster de arquivos.
- Confidencialidade
- Pontuação que indica o nível de sensibilidade do cluster de arquivos. Para saber mais, consulte Níveis de sensibilidade e risco de dados.
- Tipo
- Indica a categoria dos arquivos neste cluster. Para mais informações sobre todos os clusters de arquivos com suporte, consulte Clusters de arquivos.