Descubrimiento de datos sensibles en Vertex AI

En esta página se describe el descubrimiento de Protección de Datos Sensibles para usarlo con Vertex AI.

El descubrimiento de Protección de Datos Sensibles te ayuda a conocer los datos de entrenamiento incluidos en tus conjuntos de datos de Vertex AI. Discovery genera perfiles de datos que proporcionan información valiosa, como los tipos de información (infoTypes) detectados y el nivel de sensibilidad de los datos de entrenamiento.

Ventajas

Esta función ofrece las siguientes ventajas:

  • Puede monitorizar sus conjuntos de datos de Vertex AI (a nivel de organización, carpeta o proyecto) para detectar datos sensibles y generar informes sobre los resultados.
  • Puedes enviar los resultados de la detección a Security Command Center para que se tengan en cuenta tus cargas de trabajo con datos potencialmente sensibles al evaluar la postura de seguridad de tu organización.
  • Si la detección descubre datos de entrenamiento sensibles, puedes usar los perfiles de datos para identificar qué recursos deben investigarse más a fondo. Puedes realizar una inspección a fondo y encontrar todas las instancias sensibles de un recurso.

Fuente de datos admitida

Esta función puede crear perfiles de los siguientes tipos de datos de entrenamiento a los que se hace referencia en sus conjuntos de datos de Vertex AI:

  • Datos de entrenamiento en segmentos de Cloud Storage. Para obtener información sobre los tipos de archivo admitidos, consulta Clústeres de archivos.
  • Datos de entrenamiento en tablas de BigQuery.

Cómo funciona

Cuando creas un perfil de un conjunto de datos de Vertex AI, Protección de Datos Sensibles genera un perfil de datos de almacén de archivos o un perfil de datos de tabla, en función de dónde se almacenen los datos de entrenamiento: en un segmento de Cloud Storage o en una tabla de BigQuery. Un perfil de datos proporciona estadísticas y metadatos sobre los datos de entrenamiento asociados a tu conjunto de datos. En cada conjunto de datos de Vertex AI, el perfil de datos generado incluye la siguiente información.

  • Los niveles de sensibilidad y riesgo de los datos de entrenamiento
  • Los tipos de información sensible que se encuentran en los datos de entrenamiento (por ejemplo, los IDs de los permisos de conducir y las direcciones de correo electrónico)

Para ver una lista completa de las estadísticas y los metadatos de cada perfil de datos de almacén de archivos, consulta Perfiles de datos de almacén de archivos.

Para ver una lista completa de las estadísticas y los metadatos de cada perfil de datos de tabla, consulte Perfiles de datos de tabla.

Para obtener más información sobre el servicio de descubrimiento, consulta Perfiles de datos.

Precios

Cuando creas perfiles de datos de Vertex AI, se te aplican cargos de Protección de Datos Sensibles según el modelo de precios de descubrimiento que hayas elegido.

Además, si tus datos de entrenamiento están en un segmento de Cloud Storage, Cloud Storage te cobrará por las solicitudes que Protección de Datos Sensibles haga para crear perfiles de los datos de entrenamiento. En las siguientes secciones se describen los cargos de Cloud Storage asociados que se te aplican.

Operaciones de clase B

Se te cobra por las operaciones de clase B (storage.buckets.get) que realiza Protección de Datos Sensibles durante el proceso de creación de perfiles de los datos de entrenamiento en tus segmentos de Cloud Storage.

Para obtener información sobre cuánto cobra Cloud Storage por las operaciones de clase B, consulta la sección Cargos por operaciones de la documentación de Cloud Storage.

Tarifas de recuperación

En el caso de los objetos que tienen una clase de almacenamiento que no es Standard, se te cobran tarifas de recuperación. Para obtener información sobre cuánto cobra Cloud Storage por la recuperación de datos, consulta las tarifas de recuperación en la documentación de Cloud Storage.

Siguientes pasos