Referencia de métricas

En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.

Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.

Perfiles de datos de proyectos

Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.

Estadísticas

Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos del proyecto proporcionan los siguientes metadatos:

Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
ID del proyecto
El ID del proyecto para el que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.

Perfiles de datos de tablas

Cada perfil de datos de tabla tiene los siguientes campos:

Estadísticas

Los perfiles de datos de tablas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de tablas proporcionan los siguientes metadatos:

Base de datos
Es la base de datos que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta tabla.
Encriptación
Si Google o tu organización administran la encriptación de esta tabla.
Hora de vencimiento
Opcional. La hora a la que vence esta tabla.
Cantidad de columnas con errores
La cantidad de columnas omitidas en esta tabla debido a un error.
Instantánea de configuración de inspección
Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
Instancia
Es la instancia que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Actualización más reciente en BigQuery
Fecha y hora en que se modificó esta tabla por última vez.
ID del proyecto
El ID del proyecto que contiene esta tabla.
Pública

Indica si esta tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.

Etiquetas de recursos

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Nombre del recurso

El nombre completamente calificado del perfil de datos.

Cantidad de filas

Cantidad de filas que tenía esta tabla cuando se generó el perfil.

Recuento de columnas analizadas

Es la cantidad de columnas perfiladas en esta tabla.

Cuenta de servicio

Cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.

Estado

Indicación de si el perfil se generó correctamente.

ID de la tabla

Es el ID de esta tabla.

Hora de creación de la tabla

Fecha y hora en que se creó la tabla.

Tamaño de la tabla

Tamaño de esta tabla cuando se generó el perfil.

Tipo

Es el tipo de detección que se realizó.

Perfiles de datos de columnas

Cada perfil de datos de columna tiene los siguientes campos:

Estadísticas

Los perfiles de datos de columnas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Infotipo previsto

Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la Protección de datos sensibles configura este campo con ese Infotipo. De lo contrario, este campo no tiene valor.

Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.

Sensitive Data Protection solo analiza los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

Si los datos de la columna coinciden principalmente con varios Infotipos estrechamente relacionados que pertenecen a la misma categoría general, Sensitive Data Protection establece este campo en el Infotipo más general. Por ejemplo, si la columna tiene principalmente una combinación de infotipos PASSPORT, AUSTRALIA_PASSPORT y CANADA_PASSPORT, el campo Infotipo previsto se establece en PASSPORT. En el campo Otros Infotipos, se muestran los Infotipos más específicos y su prevalencia estimada.

Otros Infotipos

Son los Infotipos detectados en la columna que no tienen un indicador lo suficientemente sólido como para considerarse el infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.

En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo que se incluye en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de las filas no nulas en las que se detectó el infotipo.

Por ejemplo, supongamos que tienes una columna con las siguientes métricas:

  • Infotipo previsto: FDA_CODE
  • Otros Infotipos: PERSON_NAME (2%), STREET_ADDRESS (1%)

En este ejemplo, hay una clara indicación de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna podrían contener nombres de personas y el 1%, direcciones.

Sensitive Data Protection solo analiza los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros Infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

Proporción de valor nulo estimada

Proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas en esta columna son nulas.

Singularidad estimada

Es una estimación de cuántos de los datos de esta columna son únicos, categorizada como alta, media o baja. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una gran presencia de valores únicos puede indicar que la columna contiene identificadores.

Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.

Si la Protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor estará en blanco.

Puntuación del texto libre

La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.

Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.

Metadatos

Los perfiles de datos de columnas proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Tipo de datos
El tipo de datos del contenido de esta columna.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta columna de la tabla.
ID del campo
El nombre de la columna.
Instancia
Es la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Ubicación de instancias
Ubicación de la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Etiquetas de política
Indica si se aplica una etiqueta de política a la columna. Si quieres obtener información acerca de las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
ID del proyecto
ID del proyecto que contiene esta columna de la tabla.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.
ID de la tabla
ID de la tabla que contiene esta columna.

Perfiles de datos de almacén de archivos

Sensitive Data Protection usa el término almacén de archivos para hacer referencia a un bucket o contenedor de almacenamiento de archivos.

Cada perfil de datos de almacén de archivos tiene los siguientes campos.

Estadísticas

Los perfiles de datos de almacén de archivos proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Clústeres de archivos
Proporciona un resumen de cada clúster de archivos que se detectó cuando se generó el perfil de este almacén de archivos. Para obtener más información sobre cada resumen, consulta Resúmenes de clústeres de archivos en esta página.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de almacén de archivos proporcionan los siguientes metadatos:

Ubicaciones de almacén de datos

Si creaste un perfil de un bucket de Cloud Storage birregional, en este campo se enumeran las dos regiones.

Si creaste un perfil de un almacén de archivos de otro proveedor de servicios en la nube, este valor es la región en la que el proveedor de servicios en la nube almacena el almacén de archivos.

Encriptación

Indica si Google o tu organización administran la encriptación de este almacén de archivos.

Tipo de almacén de archivos

Es la fuente de los datos a los que se les creó el perfil: Cloud Storage, Amazon S3 o Azure Blob Storage.

Ruta de acceso al almacén de archivos

Es el nombre del almacén de archivos.

Instantánea de configuración de inspección

Es una instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.

Tipo de ubicación

Tipo de ubicación en la que se almacena el almacén de archivos: region, dual-region o multi-region.

Creación del perfil

Fecha y hora en que se creó el perfil por primera vez.

Última generación del perfil

Fecha y hora en que se generó el perfil por última vez.

ID superior

Es el recurso que posee los datos de los que se generó el perfil.

  • Si el perfil de datos es para un recurso Google Cloud , este es el ID del proyecto que contiene los datos.
  • Si el perfil de datos es para un bucket de Amazon S3, este es el ID de la cuenta de AWS que contiene el bucket.
  • Si el perfil de datos es para un contenedor de Azure Blob Storage, este es el ID de la suscripción de Azure que contiene el contenedor.
Público

Indica si este almacén de archivos está disponible para todos los usuarios o si está restringido a ciertos usuarios.

Etiquetas de recursos

Son las etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.

Ubicación del recurso

Región o multirregión que contiene el almacén de archivos.

Si creaste un perfil de un bucket birregional de Cloud Storage, este valor dependerá de si el bucket se almacena en una región doble predefinida:

  • Para las regiones dobles predefinidas, Sensitive Data Protection establece este valor en el nombre de la región doble predefinida.
  • Para las regiones dobles estándar, Sensitive Data Protection establece este valor en la región múltiple que contiene las regiones dobles. Para obtener información sobre cómo se asignan las regiones a las multirregiones, consulta Regiones dobles.
Nombre del recurso

El nombre completamente calificado del perfil de datos.

Estado

Indicación de si el perfil se generó correctamente.

Resúmenes de clústeres de archivos

Cuando se genera un perfil de datos de almacén de archivos, los archivos se agrupan en clústeres de archivos. Sensitive Data Protection proporciona un resumen para cada clúster de archivos.

Cada resumen de clúster de archivos tiene los siguientes campos:

Riesgo de datos
Nivel de riesgo asociado con los datos en este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Errores
Son los errores detectados cuando se generó el perfil de datos del almacén de archivos.
Extensiones de archivo analizadas
Lista de los tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
Extensiones de archivo vistas
Lista de tipos de archivos detectados, pero no necesariamente analizados.
Infotipos
Lista de Infotipos integrados y personalizados que se detectaron en este clúster de archivos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Tipo

Indica la categoría de los archivos en este clúster. Para obtener más información sobre todos los clústeres de archivos admitidos, consulta Clústeres de archivos admitidos en operaciones de detección.