Referencia de métricas

En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.

Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.

Perfiles de datos de proyectos

Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.

Estadísticas

Los perfiles de datos del proyecto proporcionan las siguientes conclusiones:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.

Metadata

Los perfiles de datos del proyecto proporcionan los siguientes metadatos:

Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
ID del proyecto
El ID del proyecto para el que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.

Perfiles de datos de tablas

Cada perfil de datos de tabla tiene los siguientes campos:

Estadísticas

Los perfiles de datos de tabla proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de riesgo de sensibilidad y datos.

Metadata

Los perfiles de datos de tabla proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta tabla.
Encriptación
Si Google o tu organización administran la encriptación de esta tabla.
Hora de vencimiento
Opcional. La hora a la que vence esta tabla.
Cantidad de columnas con errores
La cantidad de columnas omitidas en esta tabla debido a un error.
Instantánea de configuración de inspección
Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
Instancia
La instancia que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Actualización más reciente en BigQuery
Fecha y hora en que se modificó esta tabla por última vez.
ID del proyecto
El ID del proyecto que contiene esta tabla.
Pública
Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Cantidad de filas
Cantidad de filas que tenía esta tabla cuando se generó el perfil.
Recuento de columnas analizadas
La cantidad de columnas perfiladas en esta tabla.
Cuenta de servicio
La cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
Estado
Indica si el perfil se generó correctamente.
ID de la tabla
El ID de esta tabla.
Hora de creación de la tabla
Fecha y hora en que se creó la tabla.
Tamaño de la tabla
El tamaño de esta tabla cuando se generó el perfil.
Tipo
Es el tipo de descubrimiento que se realizó.

Perfiles de datos de columnas

Cada perfil de datos de columna tiene los siguientes campos:

Estadísticas

Los perfiles de datos de las columnas proporcionan las siguientes estadísticas:

Riesgo de datos
El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Sensibilidad
Es una puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Infotipo previsto

Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la protección de datos sensibles establece este campo en ese Infotipo. De lo contrario, este campo no tiene valor.

Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.

La protección de datos sensibles analiza solo los Infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

En este documento, consulta Otros Infotipos.

Otros Infotipos

Los infotipos detectados en la columna que no tienen una señal lo suficientemente fuerte para ser considerados el Infotipo predicho de esa columna. En este documento, consulta Infotipo previsto.

En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo enumerado en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el Infotipo.

Por ejemplo, supongamos que tienes una columna con las siguientes métricas:

  • Infotipo previsto: FDA_CODE
  • Otros Infotipos: PERSON_NAME (2%), STREET_ADDRESS (1%)

En este ejemplo, hay una fuerte indicación de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna pueden contener nombres de personas y el 1% puede contener direcciones.

La protección de datos sensibles analiza solo los Infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros Infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo EMAIL_ADDRESS en tu plantilla de inspección, este campo no contiene EMAIL_ADDRESS.

Proporción de valor nulo estimada

Proporción aproximada de los valores nulos en esta columna, categorizados como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas en esta columna es nula.

Singularidad estimada

Una estimación de cuántos de los datos de esta columna son únicos, categorizados como altos, medios o bajos. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una alta presencia de valores únicos puede indicar que la columna contiene identificadores.

Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.

Si la protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor está en blanco.

Puntuación del texto libre

La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.

Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.

Metadata

Los perfiles de datos de las columnas proporcionan los siguientes metadatos:

Base de datos
La base de datos que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Tipo de datos
El tipo de datos del contenido de esta columna.
ID de conjunto de datos
El ID del conjunto de datos que contiene esta columna de la tabla.
ID del campo
El nombre de la columna.
Instancia
La instancia que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
Ubicación de instancias
Ubicación de la instancia que contiene la columna de la tabla para la que se generó el perfil. Este campo se aplica solo al descubrimiento de Cloud SQL.
Último perfil generado
Fecha y hora en que se generó el perfil por última vez.
Etiquetas de política
Indica si se aplica una etiqueta de política a la columna. Si deseas obtener información sobre las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
ID del proyecto
ID del proyecto que contiene esta columna de la tabla.
Nombre del recurso
El nombre completamente calificado del perfil de datos.
Estado
Ícono que indica el estado de la operación de generación de perfiles.
ID de la tabla
ID de la tabla que contiene esta columna.