En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.
Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.
Perfiles de datos de proyectos
Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.
Insights
Los perfiles de datos del proyecto proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.
Metadatos
Los perfiles de datos del proyecto proporcionan los siguientes metadatos:
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- ID del proyecto
- El ID del proyecto para el que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
Perfiles de datos de tablas
Cada perfil de datos de tabla tiene los siguientes campos:
Insights
Los perfiles de datos de tablas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de los datos.
Metadatos
Los perfiles de datos de tablas proporcionan los siguientes metadatos:
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta tabla.
- Encriptación
- Si Google o tu organización administran la encriptación de esta tabla.
- Hora de vencimiento
- Opcional. La hora a la que vence esta tabla.
- Cantidad de columnas con errores
- La cantidad de columnas omitidas en esta tabla debido a un error.
- Instantánea de configuración de inspección
- Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Actualización más reciente en BigQuery
- Fecha y hora en que se modificó esta tabla por última vez.
- ID del proyecto
- El ID del proyecto que contiene esta tabla.
- Pública
- Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
- Etiquetas de recursos
- Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Cantidad de filas
- Cantidad de filas que tenía esta tabla cuando se generó el perfil.
- Recuento de columnas analizadas
- La cantidad de columnas perfiladas en esta tabla.
- Cuenta de servicio
- La cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
- Estado
- Indica si el perfil se generó de forma correcta en la generación.
- ID de la tabla
- El ID de esta tabla.
- Hora de creación de la tabla
- Fecha y hora de creación de la tabla.
- Tamaño de la tabla
- El tamaño de esta tabla cuando se generó el perfil.
Perfiles de datos de columnas
Cada perfil de datos de columna tiene los siguientes campos:
Insights
Los perfiles de datos de columnas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Infotipo previsto
Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, Cloud DLP establece este campo en ese Infotipo. De lo contrario, este campo no tiene valor.
Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.
Cloud DLP analiza solo los Infotipos que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipos
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contendráEMAIL_ADDRESS
.En este documento, consulta Otros infotipos.
- Otros Infotipos
Los Infotipos detectados en la columna que no tienen una señal lo suficientemente fuerte para ser considerado en el Infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.
Para los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo enumerado en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el Infotipo.
Por ejemplo, supongamos que tienes una columna que tiene las siguientes métricas:
- Infotipo previsto:
FDA_CODE
- Otros infotipos:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
En este ejemplo, hay un indicio importante de que la columna contiene códigos de la FDA. Cloud DLP también determinó que aproximadamente el 2% de las filas no nulas en la columna pueden contener nombres de personas y el 1% pueden contener direcciones.
Cloud DLP analiza solo los Infotipos que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contendráEMAIL_ADDRESS
.- Infotipo previsto:
- Proporción de valor nulo estimada
Proporción aproximada de los valores nulos de esta columna, categorizados como alto, medio, bajo o muy bajo. Este valor es alto si una gran proporción de entradas en esta columna es nula.
- Singularidad estimada
Una estimación de cuánto de los datos de esta columna es único, categorizado como alto, medio o bajo Un nivel de exclusividad alto sugiere que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.
Un nivel de unicidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.
Si Cloud DLP determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor está en blanco.
- Puntuación del texto libre
La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.
Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.
Metadatos
Los perfiles de datos de columnas proporcionan los siguientes metadatos:
- Tipo de datos
- El tipo de datos del contenido de esta columna.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta columna de la tabla.
- ID del campo
- El nombre de la columna.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Etiquetas de política
- Indica si se aplicó una etiqueta de política a la columna. Si deseas obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
- ID del proyecto
- ID del proyecto que contiene esta columna de tabla.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
- ID de la tabla
- ID de la tabla que contiene esta columna.