En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.
Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.
Perfiles de datos de proyectos
Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.
Estadísticas
Los perfiles de datos del proyecto proporcionan las siguientes conclusiones:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.
Metadata
Los perfiles de datos del proyecto proporcionan los siguientes metadatos:
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- ID del proyecto
- El ID del proyecto para el que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
Perfiles de datos de tablas
Cada perfil de datos de tabla tiene los siguientes campos:
Estadísticas
Los perfiles de datos de tabla proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.
Metadata
Los perfiles de datos de tabla proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta tabla.
- Encriptación
- Si Google o tu organización administran la encriptación de esta tabla.
- Hora de vencimiento
- Opcional. La hora a la que vence esta tabla.
- Cantidad de columnas con errores
- La cantidad de columnas omitidas en esta tabla debido a un error.
- Instantánea de configuración de inspección
- Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Instancia
- La instancia que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Actualización más reciente en BigQuery
- Fecha y hora en que se modificó esta tabla por última vez.
- ID del proyecto
- El ID del proyecto que contiene esta tabla.
- Pública
- Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
- Etiquetas de recursos
- Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Cantidad de filas
- Cantidad de filas que tenía esta tabla cuando se generó el perfil.
- Recuento de columnas analizadas
- La cantidad de columnas perfiladas en esta tabla.
- Cuenta de servicio
- La cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
- Estado
- Indica si el perfil se generó correctamente.
- ID de la tabla
- El ID de esta tabla.
- Hora de creación de la tabla
- Fecha y hora en que se creó la tabla.
- Tamaño de la tabla
- El tamaño de esta tabla cuando se generó el perfil.
- Tipo
- Es el tipo de descubrimiento que se realizó.
Perfiles de datos de columnas
Cada perfil de datos de columna tiene los siguientes campos:
Estadísticas
Los perfiles de datos de las columnas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Es una puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Infotipo previsto
Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la protección de datos sensibles establece este campo en ese Infotipo. De lo contrario, este campo no tiene valor.
Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.
La protección de datos sensibles analiza solo los Infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.En este documento, consulta Otros Infotipos.
- Otros Infotipos
Los infotipos detectados en la columna que no tienen una señal lo suficientemente fuerte para ser considerados el Infotipo predicho de esa columna. En este documento, consulta Infotipo previsto.
En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo enumerado en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el Infotipo.
Por ejemplo, supongamos que tienes una columna con las siguientes métricas:
- Infotipo previsto:
FDA_CODE
- Otros Infotipos:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
En este ejemplo, hay una fuerte indicación de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna pueden contener nombres de personas y el 1% puede contener direcciones.
La protección de datos sensibles analiza solo los Infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros Infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.- Infotipo previsto:
- Proporción de valor nulo estimada
Proporción aproximada de los valores nulos en esta columna, categorizados como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas en esta columna es nula.
- Singularidad estimada
Una estimación de cuántos de los datos de esta columna son únicos, categorizados como altos, medios o bajos. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.
Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.
Si la protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor está en blanco.
- Puntuación del texto libre
La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.
Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.
Metadata
Los perfiles de datos de las columnas proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Tipo de datos
- El tipo de datos del contenido de esta columna.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta columna de la tabla.
- ID del campo
- El nombre de la columna.
- Instancia
- La instancia que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Ubicación de instancias
- Ubicación de la instancia que contiene la columna de la tabla para la que se generó el perfil. Este campo se aplica solo al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Etiquetas de política
- Indica si se aplica una etiqueta de política a la columna. Si deseas obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
- ID del proyecto
- ID del proyecto que contiene esta columna de la tabla.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
- ID de la tabla
- ID de la tabla que contiene esta columna.