Descubrimiento de datos sensibles para Vertex AI

En esta página, se describe el descubrimiento de Sensitive Data Protection para usar con Vertex AI.

El descubrimiento de Sensitive Data Protection te ayuda a obtener información sobre los datos de entrenamiento que se incluyen en tus conjuntos de datos de Vertex AI. El descubrimiento genera perfiles de datos que proporcionan estadísticas, como los tipos de información (infoTypes) detectados y el nivel de sensibilidad de tus datos de entrenamiento.

Para unirte a esta Versión preliminar, envía un correo electrónico a cloud-dlp-feedback@google.com.

Beneficios

Esta función ofrece los siguientes beneficios:

  • Puedes supervisar tus conjuntos de datos de Vertex AI, a nivel de la organización, la carpeta o el proyecto, en busca de datos sensibles y informar sobre los resultados.
  • Puedes enviar los resultados del descubrimiento a Security Command Center para que se tengan en cuenta tus cargas de trabajo con datos potencialmente sensibles cuando evalúes la postura de seguridad de tu organización.
  • Si el descubrimiento detecta datos de entrenamiento sensibles, puedes usar los perfiles de datos para identificar qué recursos se deben investigar más a fondo. Puedes realizar una inspección profunda y encontrar todas las instancias sensibles en un recurso.

Fuente de datos compatible

Esta función puede generar perfiles de los siguientes tipos de datos de entrenamiento a los que se hace referencia en tus conjuntos de datos de Vertex AI:

  • Datos de entrenamiento en buckets de Cloud Storage Para obtener información sobre los tipos de archivos compatibles, consulta Clústeres de archivos.
  • Datos de entrenamiento en tablas de BigQuery

Cómo funciona

Cuando creas un perfil de un conjunto de datos de Vertex AI, la Protección de datos sensibles genera un perfil de datos del almacén de archivos o un perfil de datos de la tabla, según dónde se almacenen los datos de entrenamiento: un bucket de Cloud Storage o una tabla de BigQuery. Un perfil de datos proporciona estadísticas y metadatos sobre los datos de entrenamiento asociados con tu conjunto de datos. Para cada conjunto de datos de Vertex AI, el perfil de datos generado incluye la siguiente información.

  • Los niveles de sensibilidad y riesgo de datos de los datos de entrenamiento
  • Los tipos de información sensible que se encuentran en los datos de entrenamiento, por ejemplo, IDs de licencias de conducir y direcciones de correo electrónico

Para obtener una lista completa de las estadísticas y los metadatos de cada perfil de datos de almacén de archivos, consulta Perfiles de datos de almacén de archivos.

Para obtener una lista completa de las estadísticas y los metadatos de cada perfil de datos de la tabla, consulta Perfiles de datos de tablas.

Para obtener más información sobre el servicio de descubrimiento, consulta Perfiles de datos.

Precios

Cuando creas perfiles de datos de Vertex AI, se aplican cargos de Sensitive Data Protection según el modo de precios de descubrimiento que elijas.

Además, si tus datos de entrenamiento están en un bucket de Cloud Storage, Cloud Storage te cobra por las solicitudes que hace la Protección de datos sensibles para crear perfiles de los datos de entrenamiento. En las siguientes secciones, se describen los cargos asociados de Cloud Storage que incurras.

Operaciones de clase B

Se te cobra por las operaciones de clase B (storage.buckets.get) que realiza Sensitive Data Protection en el proceso de creación de perfiles de datos de entrenamiento en tus buckets de Cloud Storage.

Para obtener información sobre los cargos de Cloud Storage por operaciones de clase B, consulta Cargos por operaciones en la documentación de Cloud Storage.

Tarifas de recuperación

En el caso de los objetos que tienen una clase de almacenamiento que no es estándar, se te cobran tarifas de recuperación. Para obtener información sobre cuánto cobra Cloud Storage por la recuperación de datos, consulta Tarifas de recuperación en la documentación de Cloud Storage.

¿Qué sigue?