En esta página se enumeran y describen todas las métricas que se recogen en los perfiles de datos.
Hay tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.
Perfiles de datos de proyectos
Cada perfil de datos de proyecto tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados en el proyecto.
Estadísticas
Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:
- Riesgo de datos
- Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de proyectos proporcionan los siguientes metadatos:
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- ID del proyecto
- ID del proyecto del que se ha creado un perfil.
- Nombre del recurso
- Nombre completo del perfil de datos.
- Estado
- Icono que indica el estado de la operación de creación de perfiles.
Perfiles de datos de tablas
Cada perfil de datos de tabla tiene los siguientes campos:
Estadísticas
Los perfiles de datos de las tablas proporcionan las siguientes estadísticas:
- Riesgo de datos
- Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de las tablas proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la tabla de la que se ha creado el perfil. Este campo solo se aplica a la detección de Cloud SQL.
- ID de conjunto de datos
- ID del conjunto de datos que contiene esta tabla.
- Cifrado
- Si el cifrado de esta tabla lo gestiona Google o tu organización.
- Plazo de vencimiento
- Opcional. La hora en la que caduca esta tabla.
- Recuento de columnas con errores
- Número de columnas de esta tabla que se han omitido debido a un error.
- Inspeccionar la vista general de la configuración
- Captura de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Capturas de perfiles de datos.
- Instancia
- La instancia que contiene la tabla de la que se ha creado un perfil. Este campo solo se aplica a la detección de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Última actualización en BigQuery
- Fecha y hora en las que se modificó esta tabla por última vez.
- ID del proyecto
- ID del proyecto que contiene esta tabla.
- Público
Indica si la tabla está disponible para todos los usuarios o solo para algunos.
- Etiquetas de recurso
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Nombre del recurso
Nombre completo del perfil de datos.
- Total de filas
Número de filas de esta tabla cuando se generó el perfil.
- Número de columnas analizadas
Número de columnas analizadas en esta tabla.
- Cuenta de servicio
Número de cuentas de servicio con permisos de gestión de identidades y accesos para acceder a esta tabla.
- Estado
Indica si el perfil se ha generado correctamente.
- ID de tabla
ID de esta tabla.
- Hora de creación de la tabla
Fecha y hora en que se creó la tabla.
- Tamaño de la tabla
Tamaño de esta tabla cuando se generó el perfil.
- Tipo
El tipo de descubrimiento que se ha realizado.
Perfiles de datos de columna
Cada perfil de datos de columna tiene los siguientes campos:
Estadísticas
Los perfiles de datos de las columnas proporcionan las siguientes estadísticas:
- Riesgo de datos
- Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- InfoType predicho
Si un solo infoType integrado o personalizado predomina claramente sobre los demás en la columna, Protección de Datos Sensibles asigna a este campo ese infoType. De lo contrario, este campo no tendrá ningún valor.
Para ver una lista de todos los infoTypes detectados en la columna, consulta el campo Otros infoTypes.
Protección de Datos Sensibles solo busca los infoTypes que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos infoTypes pueden aparecer en el campo InfoType previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no has incluido el detector de
EMAIL_ADDRESS
infoType en tu plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.Si los datos de la columna coinciden principalmente con varios infoTypes estrechamente relacionados que pertenecen a la misma categoría general, Protección de Datos Sensibles asigna a este campo el infoType más general. Por ejemplo, si la columna tiene principalmente una mezcla de infoTypes
PASSPORT
,AUSTRALIA_PASSPORT
yCANADA_PASSPORT
, el campo infoType previsto se define comoPASSPORT
. En el campo Otros infoTypes se muestran los infoTypes más específicos y su prevalencia estimada.- Otros infoTypes
infoTypes detectados en la columna que no tienen una señal lo suficientemente fuerte como para considerarse el infoType previsto de esa columna. En este documento, consulta infoType previsto.
En los perfiles de datos generados después del 13 de octubre del 2022, cada infoType que aparece en este campo tiene una prevalencia estimada. La prevalencia estimada es el porcentaje aproximado de filas no nulas en las que se ha detectado el infoType.
Por ejemplo, supongamos que tiene una columna con las siguientes métricas:
- InfoType previsto:
FDA_CODE
- Otros infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
En este ejemplo, hay un claro indicio de que la columna contiene códigos de la FDA. Protección de Datos Sensibles también ha determinado que aproximadamente el 2% de las filas no nulas de la columna pueden contener nombres de personas y el 1% puede contener direcciones postales.
Protección de Datos Sensibles solo busca los infoTypes que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos infoTypes pueden aparecer en el campo Otros infoTypes. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no ha incluido el detector de
EMAIL_ADDRESS
infoType en su plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.- InfoType previsto:
- Proporción nula estimada
Proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de las entradas de esta columna es nula.
- Estimación de la singularidad
Estimación de la cantidad de datos únicos de esta columna, categorizada como alta, media o baja. Un nivel de unicidad alto indica que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.
Un nivel de singularidad bajo indica que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.
Si Protección de Datos Sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor estará en blanco.
- Puntuación de texto libre
La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que es probable que la columna contenga texto de formato libre o en lenguaje natural. Los valores posibles van de 0 a 1.
Una puntuación alta de texto libre puede aumentar los niveles de riesgo y sensibilidad de los datos de una columna.
Metadatos
Los perfiles de datos de las columnas proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la columna de la tabla de la que se ha creado el perfil. Este campo solo se aplica a la detección de Cloud SQL.
- Tipo de datos
- El tipo de datos del contenido de esta columna.
- ID de conjunto de datos
- ID del conjunto de datos que contiene esta columna de tabla.
- ID de campo
- Nombre de la columna.
- Instancia
- La instancia que contiene la columna de la tabla que se ha perfilado. Este campo solo se aplica a la detección de Cloud SQL.
- Ubicación de la instancia
- Ubicación de la instancia que contiene la columna de la tabla que se ha perfilado. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Etiquetas de política
- Indica si se ha aplicado una etiqueta de política a la columna. Para obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta el artículo Usar etiquetas de política en BigQuery .
- ID del proyecto
- ID del proyecto que contiene esta columna de la tabla.
- Nombre del recurso
- Nombre completo del perfil de datos.
- Estado
- Icono que indica el estado de la operación de creación de perfiles.
- ID de tabla
- ID de la tabla que contiene esta columna.
Perfiles de datos de almacén de archivos
La protección de datos sensibles usa el término almacén de archivos para hacer referencia a un segmento o contenedor de almacenamiento de archivos.
Cada perfil de datos de almacén de archivos tiene los siguientes campos.
Estadísticas
Los perfiles de datos de la tienda de archivos proporcionan las siguientes estadísticas:
- Riesgo de datos
- Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Clústeres de archivos
- Proporciona un resumen de cada clúster de archivos que se detectó cuando se creó el perfil de este almacén de archivos. Para obtener más información sobre cada resumen, consulta la sección Resúmenes de clústeres de archivos de esta página.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de almacén de archivos proporcionan los siguientes metadatos:
- Ubicaciones de almacenamiento de datos
Si has creado un perfil de un segmento de Cloud Storage birregional, este campo muestra las dos regiones.
Si has creado un perfil de un almacén de archivos de otro proveedor de servicios en la nube, este valor es la región en la que el proveedor almacena el almacén de archivos.
- Cifrado
Si el cifrado de este almacén de archivos lo gestiona Google o tu organización.
- Tipo de almacenamiento de archivos
La fuente de los datos de los que se ha creado el perfil: Cloud Storage, Amazon S3 o Azure Blob Storage.
- Ruta de File Store
El nombre del almacén de archivos.
- Inspeccionar la vista general de la configuración
Una captura de pantalla de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Capturas de perfiles de datos.
- Tipo de ubicación
Tipo de ubicación en la que se almacena el archivo:
region
,dual-region
omulti-region
.- Perfil creado por primera vez
Fecha y hora en que se creó el perfil por primera vez.
- Perfil generado por última vez
Fecha y hora en que se generó el perfil por última vez.
- ID principal
El recurso propietario de los datos que se han perfilado.
- Si el perfil de datos es de un recurso Google Cloud , este es el ID del proyecto que contiene los datos.
- Si el perfil de datos es de un segmento de Amazon S3, este es el ID de la cuenta de AWS que contiene el segmento.
- Si el perfil de datos es de un contenedor de Azure Blob Storage, este es el ID de la suscripción de Azure que contiene el contenedor.
- Público
Indica si este almacén de archivos está disponible para todos los usuarios o solo para algunos.
- Etiquetas de recurso
Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía el archivo en el momento en que se generó el perfil.
- Ubicación del recurso
Región o multirregión que contiene el almacén de archivos.
Si has creado un perfil de un segmento de Cloud Storage de dos regiones, este valor dependerá de si el segmento está almacenado en una región dual predefinida:
- En el caso de las regiones duales predefinidas, Protección de Datos Sensibles asigna a este valor el nombre de la región dual predefinida.
- En el caso de las regiones duales estándar, Protección de Datos Sensibles asigna a este valor la multirregión que contiene las regiones duales. Para obtener información sobre cómo se asignan las regiones a las multirregiones, consulta Regiones duales.
- Nombre del recurso
Nombre completo del perfil de datos.
- Estado
Indica si el perfil se ha generado correctamente.
Resúmenes de clústeres de archivos
Cuando se genera un perfil de datos de un almacén de archivos, los archivos se agrupan en clústeres de archivos. Protección de Datos Sensibles proporciona un resumen de cada clúster de archivos.
Cada resumen de clúster de archivos tiene los siguientes campos:
- Riesgo de datos
- Nivel de riesgo asociado a los datos de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Errores
- Los errores detectados al generar el perfil de datos del almacén de archivos.
- Extensiones de archivo analizadas
- Lista de tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
- Extensiones de archivo vistas
- Lista de tipos de archivos detectados, pero no necesariamente analizados.
- InfoTypes
- Lista de infoTypes integrados y personalizados que se han detectado en este clúster de archivos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Tipo
Indica la categoría de los archivos de este clúster. Para obtener más información sobre todos los clústeres de archivos admitidos, consulta Clústeres de archivos admitidos en operaciones de descubrimiento.