Referencia de métricas

En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.

Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.

Perfiles de datos de proyectos

Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.

Estadísticas

Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de proyectos proporcionan los siguientes metadatos:

Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
ID del proyecto
El ID del proyecto para el que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.

Perfiles de datos de tablas

Cada perfil de datos de tabla tiene los siguientes campos:

Estadísticas

Los perfiles de datos de tablas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de tabla proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta tabla.
Encriptación
Si Google o tu organización administran la encriptación de esta tabla.
Hora de vencimiento
Opcional. La hora a la que vence esta tabla.
Cantidad de columnas con errores
La cantidad de columnas omitidas en esta tabla debido a un error.
Instantánea de configuración de inspección
Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
Instancia
La instancia que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Actualización más reciente en BigQuery
Fecha y hora de la última modificación de esta tabla.
ID del proyecto
El ID del proyecto que contiene esta tabla.
Pública

Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.

Etiquetas de recursos

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía la tabla en el momento en que se generó el perfil.

Nombre del recurso

El nombre completamente calificado del perfil de datos.

Cantidad de filas

Cantidad de filas que tenía esta tabla cuando se generó el perfil.

Recuento de columnas analizadas

La cantidad de columnas perfiladas en esta tabla.

Cuenta de servicio

Es la cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.

Estado

Indica si se pudo generar el perfil.

ID de la tabla

El ID de esta tabla.

Hora de creación de la tabla

Es la fecha y hora en que se creó la tabla.

Tamaño de la tabla

Es el tamaño de esta tabla cuando se generó el perfil.

Tipo

El tipo de descubrimiento que se realizó

Perfiles de datos de columnas

Cada perfil de datos de columna tiene los siguientes campos:

Estadísticas

Los perfiles de datos de columnas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Infotipo previsto

Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la Protección de datos sensibles configura este campo con ese Infotipo. De lo contrario, este campo no tiene valor.

Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.

La protección de datos sensibles solo busca los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, entonces, este campo no contiene EMAIL_ADDRESS.

Si los datos de la columna coinciden principalmente con varios Infotipos estrechamente relacionados que pertenecen a la misma categoría general, la Protección de datos sensibles establece este campo en el Infotipo más general. Por ejemplo, si la columna tiene principalmente una combinación de infotipos PASSPORT, AUSTRALIA_PASSPORT y CANADA_PASSPORT, el campo Infotipo previsto se establece en PASSPORT. El campo Otros Infotipos muestra los infotipos más específicos y su prevalencia estimada.

Otros Infotipos

Son los infotipos detectados en la columna que no tienen una señal lo suficientemente sólida como para considerarse el infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.

En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo que se indica en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el infotipo.

Por ejemplo, supongamos que tienes una columna que tiene las siguientes métricas:

  • Infotipo previsto: FDA_CODE
  • Otros infotipos: PERSON_NAME (2%), STREET_ADDRESS (1%)

En este ejemplo, hay una indicación clara de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna podría contener nombres de personas y el 1% podría contener direcciones.

La protección de datos sensibles solo busca los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos infotipos pueden aparecer en el campo Otros infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, entonces, este campo no contiene EMAIL_ADDRESS.

Proporción de valor nulo estimada

Es la proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas de esta columna es nula.

Singularidad estimada

Una estimación de cuántos de los datos de esta columna son únicos, categorizados como altos, medios o bajos. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una gran presencia de valores únicos puede indicar que la columna contiene identificadores.

Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.

Si la Protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor aparecerá en blanco.

Puntuación del texto libre

La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.

Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.

Metadatos

Los perfiles de datos de columnas proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Tipo de datos
El tipo de datos del contenido de esta columna.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta columna de la tabla.
ID del campo
El nombre de la columna.
Instancia
La instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Ubicación de instancias
Ubicación de la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Etiquetas de política
Indica si se aplica una etiqueta de política a la columna. Si quieres obtener información acerca de las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
ID del proyecto
El ID del proyecto que contiene esta columna de la tabla.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.
ID de la tabla
El ID de la tabla que contiene esta columna.

Perfiles de datos de almacén de archivos

La Protección de datos sensibles usa el término tienda de archivos para referirse a un bucket de almacenamiento de archivos.

Cada perfil de datos de almacén de archivos tiene los siguientes campos.

Estadísticas

Los perfiles de datos de almacén de archivos proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Clústeres de archivos
Proporciona un resumen de cada clúster de archivos que se detectó cuando se generó el perfil de este almacenamiento de archivos. Para obtener más información sobre cada resumen, consulta Resumen de clústeres de archivos en esta página.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.

Metadatos

Los perfiles de datos de Filestore proporcionan los siguientes metadatos:

Ubicaciones de almacén de datos

Si creaste un perfil de un bucket de Cloud Storage birregional, este campo muestra las dos regiones.

Si creaste un perfil de un bucket de Amazon S3, este valor es la región de AWS en la que se almacena el bucket.

Encriptación

Si Google o tu organización administran la encriptación de este almacén de archivos.

Tipo de almacén de archivos

El tipo de datos de los que se creó el perfil (datos de Cloud Storage o datos de Amazon S3)

Ruta de acceso al almacén de archivos

Es el nombre del almacén de archivos.

Instantánea de configuración de inspección

Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.

Tipo de ubicación

Es el tipo de ubicación en la que se almacena el almacén de archivos: region, dual-region o multi-region.

Creación del perfil

Fecha y hora en que se creó el perfil por primera vez.

Última generación del perfil

Fecha y hora en que se generó el perfil por última vez.

ID superior

Es el recurso al que pertenecen los datos de los que se creó el perfil.

  • Si el perfil de datos es para un recurso de Google Cloud, este es el ID del proyecto que contiene los datos.
  • Si el perfil de datos es para un bucket de Amazon S3, este es el ID de la cuenta de AWS que contiene el bucket.
Pública

Si el almacenamiento de archivos está disponible para todos los usuarios o si está restringido a ciertos usuarios.

Etiquetas de recursos

Son las etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.

Etiquetas de recursos

Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.

Ubicación del recurso

Región o multirregión que contiene la tienda de archivos.

Si generaste un perfil de un bucket de Cloud Storage birregional, este valor depende de si el bucket se almacena en una región doble predefinida:

  • Para las regiones dobles predefinidas, Sensitive Data Protection establece este valor en el nombre de la región doble predefinida.
  • Para las regiones dobles estándar, Sensitive Data Protection establece este valor en la región multirregional que contiene las regiones dobles. Para obtener información sobre cómo las regiones se asignan a multirregiones, consulta Regiones dobles.
Nombre del recurso

El nombre completamente calificado del perfil de datos.

Estado

Indica si se pudo generar el perfil.

Resúmenes de clústeres de archivos

Cuando se genera un perfil de datos de almacén de archivos, los archivos se agrupan en clústeres de archivos. Sensitive Data Protection proporciona un resumen de cada clúster de archivos.

Cada resumen de clúster de archivos tiene los siguientes campos:

Riesgo de datos
Es el nivel de riesgo asociado con los datos de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Errores
Los errores detectados cuando se generó el perfil de datos del almacén de archivos.
Extensiones de archivo analizadas
Es la lista de tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
Extensiones de archivo vistas
Es una lista de los tipos de archivos detectados, pero no necesariamente analizados.
Infotipos
Es la lista de Infotipos integrados y personalizados que se detectaron en este clúster de archivos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Tipo
Indica la categoría de archivos en este clúster. Para obtener más información sobre todos los clústeres de archivos compatibles, consulta Clústeres de archivos.