En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.
Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.
Perfiles de datos de proyectos
Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.
Estadísticas
Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de proyectos proporcionan los siguientes metadatos:
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- ID del proyecto
- El ID del proyecto para el que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
Perfiles de datos de tablas
Cada perfil de datos de tabla tiene los siguientes campos:
Estadísticas
Los perfiles de datos de tablas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de tabla proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta tabla.
- Encriptación
- Si Google o tu organización administran la encriptación de esta tabla.
- Hora de vencimiento
- Opcional. La hora a la que vence esta tabla.
- Cantidad de columnas con errores
- La cantidad de columnas omitidas en esta tabla debido a un error.
- Instantánea de configuración de inspección
- Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Instancia
- La instancia que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Actualización más reciente en BigQuery
- Fecha y hora de la última modificación de esta tabla.
- ID del proyecto
- El ID del proyecto que contiene esta tabla.
- Pública
Si la tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
- Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Nombre del recurso
El nombre completamente calificado del perfil de datos.
- Cantidad de filas
Cantidad de filas que tenía esta tabla cuando se generó el perfil.
- Recuento de columnas analizadas
La cantidad de columnas perfiladas en esta tabla.
- Cuenta de servicio
Es la cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
- Estado
Indica si se pudo generar el perfil.
- ID de la tabla
El ID de esta tabla.
- Hora de creación de la tabla
Es la fecha y hora en que se creó la tabla.
- Tamaño de la tabla
Es el tamaño de esta tabla cuando se generó el perfil.
- Tipo
El tipo de descubrimiento que se realizó
Perfiles de datos de columnas
Cada perfil de datos de columna tiene los siguientes campos:
Estadísticas
Los perfiles de datos de columnas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Infotipo previsto
Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la Protección de datos sensibles configura este campo con ese Infotipo. De lo contrario, este campo no tiene valor.
Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.
La protección de datos sensibles solo busca los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, entonces, este campo no contieneEMAIL_ADDRESS
.Si los datos de la columna coinciden principalmente con varios Infotipos estrechamente relacionados que pertenecen a la misma categoría general, la Protección de datos sensibles establece este campo en el Infotipo más general. Por ejemplo, si la columna tiene principalmente una combinación de infotipos
PASSPORT
,AUSTRALIA_PASSPORT
yCANADA_PASSPORT
, el campo Infotipo previsto se establece enPASSPORT
. El campo Otros Infotipos muestra los infotipos más específicos y su prevalencia estimada.- Otros Infotipos
Son los infotipos detectados en la columna que no tienen una señal lo suficientemente sólida como para considerarse el infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.
En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo que se indica en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de filas no nulas en las que se detectó el infotipo.
Por ejemplo, supongamos que tienes una columna que tiene las siguientes métricas:
- Infotipo previsto:
FDA_CODE
- Otros infotipos:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
En este ejemplo, hay una indicación clara de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna podría contener nombres de personas y el 1% podría contener direcciones.
La protección de datos sensibles solo busca los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos infotipos pueden aparecer en el campo Otros infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, entonces, este campo no contieneEMAIL_ADDRESS
.- Infotipo previsto:
- Proporción de valor nulo estimada
Es la proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas de esta columna es nula.
- Singularidad estimada
Una estimación de cuántos de los datos de esta columna son únicos, categorizados como altos, medios o bajos. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una gran presencia de valores únicos puede indicar que la columna contiene identificadores.
Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.
Si la Protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor aparecerá en blanco.
- Puntuación del texto libre
La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.
Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.
Metadatos
Los perfiles de datos de columnas proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Tipo de datos
- El tipo de datos del contenido de esta columna.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta columna de la tabla.
- ID del campo
- El nombre de la columna.
- Instancia
- La instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Ubicación de instancias
- Ubicación de la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Etiquetas de política
- Indica si se aplica una etiqueta de política a la columna. Si quieres obtener información acerca de las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
- ID del proyecto
- El ID del proyecto que contiene esta columna de la tabla.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
- ID de la tabla
- El ID de la tabla que contiene esta columna.
Perfiles de datos de almacén de archivos
La Protección de datos sensibles usa el término tienda de archivos para referirse a un bucket de almacenamiento de archivos.
Cada perfil de datos de almacén de archivos tiene los siguientes campos.
Estadísticas
Los perfiles de datos de almacén de archivos proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Clústeres de archivos
- Proporciona un resumen de cada clúster de archivos que se detectó cuando se generó el perfil de este almacenamiento de archivos. Para obtener más información sobre cada resumen, consulta Resumen de clústeres de archivos en esta página.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de Filestore proporcionan los siguientes metadatos:
- Ubicaciones de almacén de datos
Si creaste un perfil de un bucket de Cloud Storage birregional, este campo muestra las dos regiones.
Si creaste un perfil de un bucket de Amazon S3, este valor es la región de AWS en la que se almacena el bucket.
- Encriptación
Si Google o tu organización administran la encriptación de este almacén de archivos.
- Tipo de almacén de archivos
El tipo de datos de los que se creó el perfil (datos de Cloud Storage o datos de Amazon S3)
- Ruta de acceso al almacén de archivos
Es el nombre del almacén de archivos.
- Instantánea de configuración de inspección
Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Tipo de ubicación
Es el tipo de ubicación en la que se almacena el almacén de archivos:
region
,dual-region
omulti-region
.- Creación del perfil
Fecha y hora en que se creó el perfil por primera vez.
- Última generación del perfil
Fecha y hora en que se generó el perfil por última vez.
- ID superior
Es el recurso al que pertenecen los datos de los que se creó el perfil.
- Si el perfil de datos es para un recurso de Google Cloud, este es el ID del proyecto que contiene los datos.
- Si el perfil de datos es para un bucket de Amazon S3, este es el ID de la cuenta de AWS que contiene el bucket.
- Pública
Si el almacenamiento de archivos está disponible para todos los usuarios o si está restringido a ciertos usuarios.
- Etiquetas de recursos
Son las etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.
- Ubicación del recurso
Región o multirregión que contiene la tienda de archivos.
Si generaste un perfil de un bucket de Cloud Storage birregional, este valor depende de si el bucket se almacena en una región doble predefinida:
- Para las regiones dobles predefinidas, Sensitive Data Protection establece este valor en el nombre de la región doble predefinida.
- Para las regiones dobles estándar, Sensitive Data Protection establece este valor en la región multirregional que contiene las regiones dobles. Para obtener información sobre cómo las regiones se asignan a multirregiones, consulta Regiones dobles.
- Nombre del recurso
El nombre completamente calificado del perfil de datos.
- Estado
Indica si se pudo generar el perfil.
Resúmenes de clústeres de archivos
Cuando se genera un perfil de datos de almacén de archivos, los archivos se agrupan en clústeres de archivos. Sensitive Data Protection proporciona un resumen de cada clúster de archivos.
Cada resumen de clúster de archivos tiene los siguientes campos:
- Riesgo de datos
- Es el nivel de riesgo asociado con los datos de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Errores
- Los errores detectados cuando se generó el perfil de datos del almacén de archivos.
- Extensiones de archivo analizadas
- Es la lista de tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
- Extensiones de archivo vistas
- Es una lista de los tipos de archivos detectados, pero no necesariamente analizados.
- Infotipos
- Es la lista de Infotipos integrados y personalizados que se detectaron en este clúster de archivos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Tipo
- Indica la categoría de archivos en este clúster. Para obtener más información sobre todos los clústeres de archivos compatibles, consulta Clústeres de archivos.