En esta página, se enumeran y describen todas las métricas que se recopilan en los perfiles de datos.
Existen tres tipos de perfiles de datos: perfiles de datos de proyectos, perfiles de datos de tablas y perfiles de datos de columnas.
Perfiles de datos de proyectos
Cada perfil de datos de proyectos tiene los siguientes campos. Los valores de estos campos se agregan en función de los recursos perfilados dentro del proyecto.
Estadísticas
Los perfiles de datos de proyectos proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este proyecto. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos del proyecto proporcionan los siguientes metadatos:
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- ID del proyecto
- El ID del proyecto para el que se generó el perfil.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
Perfiles de datos de tablas
Cada perfil de datos de tabla tiene los siguientes campos:
Estadísticas
Los perfiles de datos de tablas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta tabla. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de tablas proporcionan los siguientes metadatos:
- Base de datos
- Es la base de datos que contiene la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta tabla.
- Encriptación
- Si Google o tu organización administran la encriptación de esta tabla.
- Hora de vencimiento
- Opcional. La hora a la que vence esta tabla.
- Cantidad de columnas con errores
- La cantidad de columnas omitidas en esta tabla debido a un error.
- Instantánea de configuración de inspección
- Instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Instancia
- Es la instancia que contiene la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Actualización más reciente en BigQuery
- Fecha y hora en que se modificó esta tabla por última vez.
- ID del proyecto
- El ID del proyecto que contiene esta tabla.
- Pública
Indica si esta tabla está disponible para todos los usuarios o si está restringida a ciertos usuarios.
- Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía la tabla en el momento en que se generó el perfil.
- Nombre del recurso
El nombre completamente calificado del perfil de datos.
- Cantidad de filas
Cantidad de filas que tenía esta tabla cuando se generó el perfil.
- Recuento de columnas analizadas
Es la cantidad de columnas perfiladas en esta tabla.
- Cuenta de servicio
Cantidad de cuentas de servicio con permisos de IAM para acceder a esta tabla.
- Estado
Indicación de si el perfil se generó correctamente.
- ID de la tabla
Es el ID de esta tabla.
- Hora de creación de la tabla
Fecha y hora en que se creó la tabla.
- Tamaño de la tabla
Tamaño de esta tabla cuando se generó el perfil.
- Tipo
Es el tipo de detección que se realizó.
Perfiles de datos de columnas
Cada perfil de datos de columna tiene los siguientes campos:
Estadísticas
Los perfiles de datos de columnas proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de esta columna. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Infotipo previsto
Si un solo Infotipo integrado o personalizado prevalece por sobre los demás en la columna, la Protección de datos sensibles configura este campo con ese Infotipo. De lo contrario, este campo no tiene valor.
Para ver una lista de todos los Infotipos detectados en la columna, consulta el campo Otros Infotipos.
Sensitive Data Protection solo analiza los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Infotipo previsto. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.Si los datos de la columna coinciden principalmente con varios Infotipos estrechamente relacionados que pertenecen a la misma categoría general, Sensitive Data Protection establece este campo en el Infotipo más general. Por ejemplo, si la columna tiene principalmente una combinación de infotipos
PASSPORT
,AUSTRALIA_PASSPORT
yCANADA_PASSPORT
, el campo Infotipo previsto se establece enPASSPORT
. En el campo Otros Infotipos, se muestran los Infotipos más específicos y su prevalencia estimada.- Otros Infotipos
Son los Infotipos detectados en la columna que no tienen un indicador lo suficientemente sólido como para considerarse el infotipo previsto de esa columna. En este documento, consulta Infotipo previsto.
En el caso de los perfiles de datos generados después del 13 de octubre de 2022, cada Infotipo que se incluye en este campo tiene una prevalencia estimada. La prevalencia estimada es un porcentaje aproximado de las filas no nulas en las que se detectó el infotipo.
Por ejemplo, supongamos que tienes una columna con las siguientes métricas:
- Infotipo previsto:
FDA_CODE
- Otros Infotipos:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
En este ejemplo, hay una clara indicación de que la columna contiene códigos de la FDA. La Protección de datos sensibles también determinó que aproximadamente el 2% de las filas no nulas de la columna podrían contener nombres de personas y el 1%, direcciones.
Sensitive Data Protection solo analiza los infotipos que especificaste en la plantilla de inspección. Por lo tanto, solo esos Infotipos pueden aparecer en el campo Otros Infotipos. Por ejemplo, si la columna tiene direcciones de correo electrónico, pero no incluiste el detector de Infotipo
EMAIL_ADDRESS
en tu plantilla de inspección, este campo no contieneEMAIL_ADDRESS
.- Infotipo previsto:
- Proporción de valor nulo estimada
Proporción aproximada de valores nulos en esta columna, categorizada como alta, media, baja o muy baja. Este valor es alto si una gran proporción de entradas en esta columna son nulas.
- Singularidad estimada
Es una estimación de cuántos de los datos de esta columna son únicos, categorizada como alta, media o baja. Un nivel de singularidad alto sugiere que la columna contiene valores distintos. Una gran presencia de valores únicos puede indicar que la columna contiene identificadores.
Un nivel de singularidad bajo sugiere que la columna contiene muchos valores comunes, como enumeraciones o valores booleanos.
Si la Protección de datos sensibles determina que no hay suficientes filas en la tabla para calcular esta métrica, este valor estará en blanco.
- Puntuación del texto libre
La probabilidad de que esta columna contenga texto de formato libre. Un valor cercano a 1 indica que la columna puede contener texto de formato libre o de lenguaje natural. Los valores posibles varían de 0 a 1.
Una puntuación de texto libre alta puede aumentar los niveles de riesgo de datos y sensibilidad de una columna.
Metadatos
Los perfiles de datos de columnas proporcionan los siguientes metadatos:
- Base de datos
- La base de datos que contiene la columna de la tabla para la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Tipo de datos
- El tipo de datos del contenido de esta columna.
- ID de conjunto de datos
- El ID del conjunto de datos que contiene esta columna de la tabla.
- ID del campo
- El nombre de la columna.
- Instancia
- Es la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Ubicación de instancias
- Ubicación de la instancia que contiene la columna de la tabla de la que se generó el perfil. Este campo solo se aplica al descubrimiento de Cloud SQL.
- Último perfil generado
- Fecha y hora en que se generó el perfil por última vez.
- Etiquetas de política
- Indica si se aplica una etiqueta de política a la columna. Si quieres obtener información acerca de las prácticas recomendadas para usar etiquetas de política, consulta Usa etiquetas de política en BigQuery.
- ID del proyecto
- ID del proyecto que contiene esta columna de la tabla.
- Nombre del recurso
- El nombre completamente calificado del perfil de datos.
- Estado
- Ícono que indica el estado de la operación de generación de perfiles.
- ID de la tabla
- ID de la tabla que contiene esta columna.
Perfiles de datos de almacén de archivos
Sensitive Data Protection usa el término almacén de archivos para hacer referencia a un bucket o contenedor de almacenamiento de archivos.
Cada perfil de datos de almacén de archivos tiene los siguientes campos.
Estadísticas
Los perfiles de datos de almacén de archivos proporcionan las siguientes estadísticas:
- Riesgo de datos
- El nivel de riesgo asociado con los datos en su estado actual. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Clústeres de archivos
- Proporciona un resumen de cada clúster de archivos que se detectó cuando se generó el perfil de este almacén de archivos. Para obtener más información sobre cada resumen, consulta Resúmenes de clústeres de archivos en esta página.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este almacén de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
Metadatos
Los perfiles de datos de almacén de archivos proporcionan los siguientes metadatos:
- Ubicaciones de almacén de datos
Si creaste un perfil de un bucket de Cloud Storage birregional, en este campo se enumeran las dos regiones.
Si creaste un perfil de un almacén de archivos de otro proveedor de servicios en la nube, este valor es la región en la que el proveedor de servicios en la nube almacena el almacén de archivos.
- Encriptación
Indica si Google o tu organización administran la encriptación de este almacén de archivos.
- Tipo de almacén de archivos
Es la fuente de los datos a los que se les creó el perfil: Cloud Storage, Amazon S3 o Azure Blob Storage.
- Ruta de acceso al almacén de archivos
Es el nombre del almacén de archivos.
- Instantánea de configuración de inspección
Es una instantánea de la plantilla de inspección que se usó cuando se generó el perfil. Para obtener más información, consulta Instantáneas de perfiles de datos.
- Tipo de ubicación
Tipo de ubicación en la que se almacena el almacén de archivos:
region
,dual-region
omulti-region
.- Creación del perfil
Fecha y hora en que se creó el perfil por primera vez.
- Última generación del perfil
Fecha y hora en que se generó el perfil por última vez.
- ID superior
Es el recurso que posee los datos de los que se generó el perfil.
- Si el perfil de datos es para un recurso Google Cloud , este es el ID del proyecto que contiene los datos.
- Si el perfil de datos es para un bucket de Amazon S3, este es el ID de la cuenta de AWS que contiene el bucket.
- Si el perfil de datos es para un contenedor de Azure Blob Storage, este es el ID de la suscripción de Azure que contiene el contenedor.
- Público
Indica si este almacén de archivos está disponible para todos los usuarios o si está restringido a ciertos usuarios.
- Etiquetas de recursos
Son las etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.
- Etiquetas de recursos
Etiquetas que tenía el almacén de archivos en el momento en que se generó el perfil.
- Ubicación del recurso
Región o multirregión que contiene el almacén de archivos.
Si creaste un perfil de un bucket birregional de Cloud Storage, este valor dependerá de si el bucket se almacena en una región doble predefinida:
- Para las regiones dobles predefinidas, Sensitive Data Protection establece este valor en el nombre de la región doble predefinida.
- Para las regiones dobles estándar, Sensitive Data Protection establece este valor en la región múltiple que contiene las regiones dobles. Para obtener información sobre cómo se asignan las regiones a las multirregiones, consulta Regiones dobles.
- Nombre del recurso
El nombre completamente calificado del perfil de datos.
- Estado
Indicación de si el perfil se generó correctamente.
Resúmenes de clústeres de archivos
Cuando se genera un perfil de datos de almacén de archivos, los archivos se agrupan en clústeres de archivos. Sensitive Data Protection proporciona un resumen para cada clúster de archivos.
Cada resumen de clúster de archivos tiene los siguientes campos:
- Riesgo de datos
- Nivel de riesgo asociado con los datos en este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Errores
- Son los errores detectados cuando se generó el perfil de datos del almacén de archivos.
- Extensiones de archivo analizadas
- Lista de los tipos de archivos detectados y analizados para generar el perfil de datos del almacén de archivos.
- Extensiones de archivo vistas
- Lista de tipos de archivos detectados, pero no necesariamente analizados.
- Infotipos
- Lista de Infotipos integrados y personalizados que se detectaron en este clúster de archivos.
- Sensibilidad
- Puntuación que indica el nivel de sensibilidad de este clúster de archivos. Para obtener más información, consulta Niveles de sensibilidad y riesgo de datos.
- Tipo
Indica la categoría de los archivos en este clúster. Para obtener más información sobre todos los clústeres de archivos admitidos, consulta Clústeres de archivos admitidos en operaciones de detección.