Referencia sobre métricas

En esta página se enumeran y describen todas las métricas que se recogen en los perfiles de datos.

Hay tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.

Perfiles de datos de proyectos

Cada perfil de datos de proyecto tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados en el proyecto.

Estadísticas

Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:

Riesgo de datos
Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de proyectos proporcionan los siguientes metadatos:

Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
ID del proyecto
ID del proyecto del que se ha creado un perfil.
Nombre del recurso
Nombre completo del perfil de datos.
Estado
Icono que indica el estado de la operación de creación de perfiles.

Perfiles de datos de tablas

Cada perfil de datos de tabla tiene los siguientes campos:

Estadísticas

Los perfiles de datos de las tablas proporcionan las siguientes estadísticas:

Riesgo de datos
Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de las tablas proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la tabla de la que se ha creado el perfil. Este campo solo se aplica a la detección de Cloud SQL.
ID de conjunto de datos
ID del conjunto de datos que contiene esta tabla.
Cifrado
Si el cifrado de esta tabla lo gestiona Google o tu organización.
Plazo de vencimiento
Opcional. La hora en la que caduca esta tabla.
Recuento de columnas con errores
Número de columnas de esta tabla que se han omitido debido a un error.
Inspeccionar la vista general de la configuración
Captura de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Capturas de perfiles de datos.
Instancia
La instancia que contiene la tabla de la que se ha creado un perfil. Este campo solo se aplica a la detección de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Última actualización en BigQuery
Fecha y hora en las que se modificó esta tabla por última vez.
ID del proyecto
ID del proyecto que contiene esta tabla.
Público

Indica si la tabla está disponible para todos los usuarios o solo para algunos.

Etiquetas de recurso

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Nombre del recurso

Nombre completo del perfil de datos.

Total de filas

Número de filas de esta tabla cuando se generó el perfil.

Número de columnas analizadas

Número de columnas analizadas en esta tabla.

Cuenta de servicio

Número de cuentas de servicio con permisos de gestión de identidades y accesos para acceder a esta tabla.

Estado

Indica si el perfil se ha generado correctamente.

ID de tabla

ID de esta tabla.

Hora de creación de la tabla

Fecha y hora en que se creó la tabla.

Tamaño de la tabla

Tamaño de esta tabla cuando se generó el perfil.

Tipo

El tipo de descubrimiento que se ha realizado.

Perfiles de datos de columna

Cada perfil de datos de columna tiene los siguientes campos:

Estadísticas

Los perfiles de datos de las columnas proporcionan las siguientes estadísticas:

Riesgo de datos
Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
InfoType predicho

Si un solo infoType integrado o personalizado predomina claramente sobre los demás en la columna, Protección de Datos Sensibles asigna a este campo ese infoType. De lo contrario, este campo no tendrá ningún valor.

Para ver una lista de todos los infoTypes detectados en la columna, consulta el campo Otros infoTypes.

Protección de Datos Sensibles solo busca los infoTypes que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos infoTypes pueden aparecer en el campo InfoType previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no has incluido el detector de EMAIL_ADDRESS infoType en tu plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

Si los datos de la columna coinciden principalmente con varios infoTypes estrechamente relacionados que pertenecen a la misma categoría general, Protección de Datos Sensibles asigna a este campo el infoType más general. Por ejemplo, si la columna tiene principalmente una mezcla de infoTypes PASSPORT, AUSTRALIA_PASSPORT y CANADA_PASSPORT, el campo infoType previsto se define como PASSPORT. En el campo Otros infoTypes se muestran los infoTypes más específicos y su prevalencia estimada.

Otros infoTypes

infoTypes detectados en la columna que no tienen una señal lo suficientemente fuerte como para considerarse el infoType previsto de esa columna. En este documento, consulta infoType previsto.

En los perfiles de datos generados después del 13 de octubre del 2022, cada infoType que aparece en este campo tiene una prevalencia estimada. La prevalencia estimada es el porcentaje aproximado de filas no nulas en las que se ha detectado el infoType.

Por ejemplo, supongamos que tiene una columna con las siguientes métricas:

  • InfoType previsto: FDA_CODE
  • Otros infoTypes: PERSON_NAME (2%), STREET_ADDRESS (1%)

En este ejemplo, hay un claro indicio de que la columna contiene códigos de la FDA. Protección de Datos Sensibles también ha determinado que aproximadamente el 2% de las filas no nulas de la columna pueden contener nombres de personas y el 1% puede contener direcciones postales.

Protección de Datos Sensibles solo busca los infoTypes que hayas especificado en la plantilla de inspección. Por lo tanto, solo esos infoTypes pueden aparecer en el campo Otros infoTypes. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no ha incluido el detector de EMAIL_ADDRESSinfoType en su plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

Proporción nula estimada

Proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de las entradas de esta columna es nula.

Estimación de la singularidad

Estimación de la cantidad de datos únicos de esta columna, categorizada como alta, media o baja. Un nivel de unicidad alto indica que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.

Un nivel de singularidad bajo indica que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.

Si Protección de Datos Sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor estará en blanco.

Puntuación de texto libre

La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que es probable que la columna contenga texto de formato libre o en lenguaje natural. Los valores posibles van de 0 a 1.

Una puntuación alta de texto libre puede aumentar los niveles de riesgo y sensibilidad de los datos de una columna.

Metadatos

Los perfiles de datos de las columnas proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la columna de la tabla de la que se ha creado el perfil. Este campo solo se aplica a la detección de Cloud SQL.
Tipo de datos
El tipo de datos del contenido de esta columna.
ID de conjunto de datos
ID del conjunto de datos que contiene esta columna de tabla.
ID de campo
Nombre de la columna.
Instancia
La instancia que contiene la columna de la tabla que se ha perfilado. Este campo solo se aplica a la detección de Cloud SQL.
Ubicación de la instancia
Ubicación de la instancia que contiene la columna de la tabla que se ha perfilado. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Etiquetas de política
Indica si se ha aplicado una etiqueta de política a la columna. Para obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta el artículo Usar etiquetas de política en BigQuery
.
ID del proyecto
ID del proyecto que contiene esta columna de la tabla.
Nombre del recurso
Nombre completo del perfil de datos.
Estado
Icono que indica el estado de la operación de creación de perfiles.
ID de tabla
ID de la tabla que contiene esta columna.

Perfiles de datos de almacén de archivos

La protección de datos sensibles usa el término almacén de archivos para hacer referencia a un segmento o contenedor de almacenamiento de archivos.

Cada perfil de datos de almacén de archivos tiene los siguientes campos.

Estadísticas

Los perfiles de datos de la tienda de archivos proporcionan las siguientes estadísticas:

Riesgo de datos
Nivel de riesgo asociado a los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Clústeres de archivos
Proporciona un resumen de cada clúster de archivos que se detectó cuando se creó el perfil de este almacén de archivos. Para obtener más información sobre cada resumen, consulta la sección Resúmenes de clústeres de archivos de esta página.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de almacén de archivos proporcionan los siguientes metadatos:

Ubicaciones de almacenamiento de datos

Si has creado un perfil de un segmento de Cloud Storage birregional, este campo muestra las dos regiones.

Si has creado un perfil de un almacén de archivos de otro proveedor de servicios en la nube, este valor es la región en la que el proveedor almacena el almacén de archivos.

Cifrado

Si el cifrado de este almacén de archivos lo gestiona Google o tu organización.

Tipo de almacenamiento de archivos

La fuente de los datos de los que se ha creado el perfil: Cloud Storage, Amazon S3 o Azure Blob Storage.

Ruta de File Store

El nombre del almacén de archivos.

Inspeccionar la vista general de la configuración

Una captura de pantalla de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Capturas de perfiles de datos.

Tipo de ubicación

Tipo de ubicación en la que se almacena el archivo: region, dual-region o multi-region.

Perfil creado por primera vez

Fecha y hora en que se creó el perfil por primera vez.

Perfil generado por última vez

Fecha y hora en que se generó el perfil por última vez.

ID principal

El recurso propietario de los datos que se han perfilado.

  • Si el perfil de datos es de un recurso Google Cloud , este es el ID del proyecto que contiene los datos.
  • Si el perfil de datos es de un segmento de Amazon S3, este es el ID de la cuenta de AWS que contiene el segmento.
  • Si el perfil de datos es de un contenedor de Azure Blob Storage, este es el ID de la suscripción de Azure que contiene el contenedor.
Público

Indica si este almacén de archivos está disponible para todos los usuarios o solo para algunos.

Etiquetas de recurso

Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía el archivo en el momento en que se generó el perfil.

Ubicación del recurso

Región o multirregión que contiene el almacén de archivos.

Si has creado un perfil de un segmento de Cloud Storage de dos regiones, este valor dependerá de si el segmento está almacenado en una región dual predefinida:

  • En el caso de las regiones duales predefinidas, Protección de Datos Sensibles asigna a este valor el nombre de la región dual predefinida.
  • En el caso de las regiones duales estándar, Protección de Datos Sensibles asigna a este valor la multirregión que contiene las regiones duales. Para obtener información sobre cómo se asignan las regiones a las multirregiones, consulta Regiones duales.
Nombre del recurso

Nombre completo del perfil de datos.

Estado

Indica si el perfil se ha generado correctamente.

Resúmenes de clústeres de archivos

Cuando se genera un perfil de datos de un almacén de archivos, los archivos se agrupan en clústeres de archivos. Protección de Datos Sensibles proporciona un resumen de cada clúster de archivos.

Cada resumen de clúster de archivos tiene los siguientes campos:

Riesgo de datos
Nivel de riesgo asociado a los datos de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Errores
Los errores detectados al generar el perfil de datos del almacén de archivos.
Extensiones de archivo analizadas
Lista de tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
Extensiones de archivo vistas
Lista de tipos de archivos detectados, pero no necesariamente analizados.
InfoTypes
Lista de infoTypes integrados y personalizados que se han detectado en este clúster de archivos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Tipo

Indica la categoría de los archivos de este clúster. Para obtener más información sobre todos los clústeres de archivos admitidos, consulta Clústeres de archivos admitidos en operaciones de descubrimiento.