Referencia de métricas

En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.

Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.

Perfiles de datos de proyectos

Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.

Insights

Los perfiles de datos del proyecto proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.

Metadatos

Los perfiles de datos del proyecto proporcionan los siguientes metadatos:

Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
ID del proyecto
El ID del proyecto para el que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.

Perfiles de datos de tablas

Cada perfil de datos de tabla tiene los siguientes campos:

Insights

Los perfiles de datos de tablas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de los datos.

Metadatos

Los perfiles de datos de tablas proporcionan los siguientes metadatos:

ID de conjunto de datos
El ID del conjunto de datos que contiene esta tabla.
Encriptación
Si Google o tu organización administran la encriptación de esta tabla.
Hora de vencimiento
Opcional. La hora a la que vence esta tabla.
Cantidad de columnas con errores
La cantidad de columnas omitidas en esta tabla debido a un error.
Instantánea de configuración de inspección
Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Actualización más reciente en BigQuery
Fecha y hora en que se modificó esta tabla por última vez.
ID del proyecto
El ID del proyecto que contiene esta tabla.
Pública
Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Cantidad de filas
Cantidad de filas que tenía esta tabla cuando se generó el perfil.
Recuento de columnas analizadas
La cantidad de columnas perfiladas en esta tabla.
Cuenta de servicio
La cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
Estado
Indica si el perfil se generó de forma correcta en la generación.
ID de la tabla
El ID de esta tabla.
Hora de creación de la tabla
Fecha y hora de creación de la tabla.
Tamaño de la tabla
El tamaño de esta tabla cuando se generó el perfil.

Perfiles de datos de columnas

Cada perfil de datos de columna tiene los siguientes campos:

Insights

Los perfiles de datos de columnas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Infotipo previsto

Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, Cloud DLP establece este campo en ese Infotipo. De lo contrario, este campo no tiene valor.

Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.

Cloud DLP analiza solo los Infotipos que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipos EMAIL_ADDRESS en tu plantilla de inspección, este campo no contendrá EMAIL_ADDRESS.

En este documento, consulta Otros infotipos.

Otros Infotipos

Los Infotipos detectados en la columna que no tienen una señal lo suficientemente fuerte para ser considerado en el Infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.

Para los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo enumerado en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el Infotipo.

Por ejemplo, supongamos que tienes una columna que tiene las siguientes métricas:

  • Infotipo previsto: FDA_CODE
  • Otros infotipos: PERSON_NAME (2%), STREET_ADDRESS (1%)

En este ejemplo, hay un indicio importante de que la columna contiene códigos de la FDA. Cloud DLP también determinó que aproximadamente el 2% de las filas no nulas en la columna pueden contener nombres de personas y el 1% pueden contener direcciones.

Cloud DLP analiza solo los Infotipos que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, este campo no contendrá EMAIL_ADDRESS.

Proporción de valor nulo estimada

Proporción aproximada de los valores nulos de esta columna, categorizados como alto, medio, bajo o muy bajo. Este valor es alto si una gran proporción de entradas en esta columna es nula.

Singularidad estimada

Una estimación de cuánto de los datos de esta columna es único, categorizado como alto, medio o bajo Un nivel de exclusividad alto sugiere que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.

Un nivel de unicidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.

Si Cloud DLP determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor está en blanco.

Puntuación del texto libre

La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.

Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.

Metadatos

Los perfiles de datos de columnas proporcionan los siguientes metadatos:

Tipo de datos
El tipo de datos del contenido de esta columna.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta columna de la tabla.
ID del campo
El nombre de la columna.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Etiquetas de política
Indica si se aplicó una etiqueta de política a la columna. Si deseas obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
ID del proyecto
ID del proyecto que contiene esta columna de tabla.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.
ID de la tabla
ID de la tabla que contiene esta columna.