En este tema se describe en detalle cómo crear una tarea de inspección de Protección de Datos Sensibles y cómo programar tareas de inspección periódicas creando un activador de tareas. Para ver una guía rápida sobre cómo crear un nuevo activador de tareas con la interfaz de usuario de Protección de Datos Sensibles, consulta Guía de inicio rápido: crear un activador de tareas de Protección de Datos Sensibles.
Acerca de las tareas de inspección y los activadores de tareas
Cuando Protección de Datos Sensibles realiza un análisis de inspección para identificar datos sensibles, cada análisis se ejecuta como un trabajo. Protección de Datos Sensibles crea y ejecuta un recurso de trabajo cada vez que le indica que inspeccione sus Google Cloud repositorios de almacenamiento, incluidos los contenedores de Cloud Storage, las tablas de BigQuery, los tipos de Datastore y los datos externos.
Para programar tareas de análisis de inspección de Protección de Datos Sensibles, crea activadores de tareas. Un activador de tareas automatiza la creación de tareas de Protección de Datos Sensibles de forma periódica y también se puede ejecutar bajo demanda.
Para obtener más información sobre las tareas y los activadores de tareas en Protección de Datos Sensibles, consulta la página conceptual Tareas y activadores de tareas.
Crear una tarea de inspección
Para crear una tarea de inspección de Protección de Datos Sensibles, sigue estos pasos:
Consola
En la sección Protección de Datos Sensibles de la Google Cloud consola, ve a la página Crear tarea o activador de tarea.
Ir a Crear tarea o activador de tareas
La página Crear tarea o activador de tareas contiene las siguientes secciones:
Elegir datos de entrada
Nombre
Asigna un nombre al trabajo. Puedes usar letras, números y guiones. Ponerle un nombre a tu trabajo es opcional. Si no introduces ningún nombre, Protección de Datos Sensibles asignará a la tarea un identificador numérico único.
Ubicación
En el menú Tipo de almacenamiento, elija el tipo de repositorio que almacena los datos que quiere analizar:
- Cloud Storage: introduce la URL del bucket que quieras analizar o elige Incluir/excluir en el menú Tipo de ubicación y, a continuación, haz clic en Buscar para ir al bucket o a la subcarpeta que quieras analizar. Selecciona la casilla Analizar carpeta de forma recursiva para analizar el directorio especificado y todos los directorios que contenga. Déjala sin seleccionar para analizar solo el directorio especificado y no profundizar más.
- BigQuery: introduce los identificadores del proyecto, el conjunto de datos y la tabla que quieras analizar.
- Datastore: introduce los identificadores del proyecto, el espacio de nombres (opcional) y el tipo que quieras analizar.
- Híbrido: puedes añadir etiquetas obligatorias, etiquetas opcionales y opciones para gestionar datos tabulares. Para obtener más información, consulta Tipos de metadatos que puedes proporcionar.
Muestreo
El muestreo es una forma opcional de ahorrar recursos si tienes un volumen de datos muy grande.
En Muestreo, puede elegir si quiere analizar todos los datos seleccionados o tomar una muestra de los datos analizando un porcentaje determinado. El muestreo funciona de forma diferente en función del tipo de repositorio de almacenamiento que estés analizando:
- En BigQuery, puedes tomar una muestra de un subconjunto del total de filas seleccionadas, que se corresponderá con el porcentaje de archivos que especifiques para incluir en el análisis.
- En Cloud Storage, si algún archivo supera el tamaño especificado en Tamaño máximo en bytes que se puede analizar por archivo, Protección de Datos Sensibles lo analiza hasta ese tamaño máximo y, a continuación, pasa al siguiente archivo.
Para activar el muestreo, elige una de las siguientes opciones en el primer menú:
- Iniciar el muestreo desde el principio: Protección de Datos Sensibles empieza el análisis parcial al principio de los datos. En BigQuery, esto inicia el análisis en la primera fila. En Cloud Storage, se inicia el análisis al principio de cada archivo y se detiene cuando Sensitive Data Protection ha analizado hasta el tamaño máximo de archivo especificado.
- Iniciar el muestreo desde un punto aleatorio: Protección de Datos Sensibles empieza el análisis parcial en una ubicación aleatoria de los datos. En BigQuery, se inicia el análisis en una fila aleatoria. En Cloud Storage, este ajuste solo se aplica a los archivos que superen el tamaño máximo especificado. Protección de Datos Sensibles analiza los archivos que no superan el tamaño máximo en su totalidad y los que superan el tamaño máximo hasta alcanzarlo.
Para realizar un análisis parcial, también debe elegir el porcentaje de datos que quiere analizar. Usa el control deslizante para definir el porcentaje.
También puedes acotar los archivos o registros que quieres analizar por fecha. Para saber cómo hacerlo, consulta la sección Programar, que aparece más adelante en este artículo.
Configuración avanzada
Cuando creas un trabajo para analizar los buckets de Cloud Storage o las tablas de BigQuery, puedes acotar la búsqueda especificando una configuración avanzada. En concreto, puedes configurar lo siguiente:
- Archivos (solo Cloud Storage): los tipos de archivo que se van a analizar, incluidos los archivos de texto, binarios y de imagen.
- Campos de identificación (solo en BigQuery): identificadores de fila únicos en la tabla.
- En Cloud Storage, si algún archivo supera el tamaño especificado en Tamaño máximo en bytes que se puede analizar por archivo, Protección de Datos Sensibles lo analiza hasta ese tamaño máximo y, a continuación, pasa al siguiente archivo.
Para activar el muestreo, elija el porcentaje de datos que quiera analizar. Usa el control deslizante para definir el porcentaje. A continuación, elige una de las siguientes opciones del primer menú:
- Iniciar el muestreo desde el principio: Protección de Datos Sensibles empieza el análisis parcial al principio de los datos. En BigQuery, esto inicia el análisis en la primera fila. En Cloud Storage, el análisis empieza al principio de cada archivo y se detiene cuando Protección de Datos Sensibles ha analizado hasta el tamaño máximo de archivo especificado (consulta la información anterior).
- Iniciar el muestreo desde un punto aleatorio: Protección de Datos Sensibles empieza el análisis parcial en una ubicación aleatoria de los datos. En BigQuery, se inicia el análisis en una fila aleatoria. En Cloud Storage, este ajuste solo se aplica a los archivos que superen el tamaño máximo especificado. Protección de Datos Sensibles analiza los archivos que no superan el tamaño máximo en su totalidad y los que superan el tamaño máximo hasta alcanzarlo.
Archivos
En el caso de los archivos almacenados en Cloud Storage, puede especificar los tipos que quiere incluir en el análisis en Archivos.
Puedes elegir entre archivos binarios, de texto, de imagen, CSV, TSV, de Microsoft Word, de Microsoft Excel, de Microsoft PowerPoint, PDF y de Apache Avro. Para ver una lista completa de las extensiones de archivo que Protección de Datos Sensibles puede analizar en los segmentos de Cloud Storage, consulta FileType
.
Si eliges Binario, Protección de Datos Sensibles analizará los archivos de tipos no reconocidos.
Campos identificativos
En el caso de las tablas de BigQuery, en el campo Campos de identificación, puede indicar a Protección de Datos Sensibles que incluya los valores de las columnas de clave principal de la tabla en los resultados. De esta forma, puede vincular los hallazgos a las filas de la tabla que los contienen.
Introduzca los nombres de las columnas que identifican de forma única cada fila de la tabla. Si es necesario, usa la notación de punto para especificar campos anidados. Puedes añadir todos los campos que quieras.
También debe activar la acción Guardar en BigQuery para exportar las detecciones a BigQuery. Cuando los resultados se exportan a BigQuery, cada uno de ellos contiene los valores respectivos de los campos de identificación. Para obtener más información, consulta identifyingFields
.
Configurar detección
En la sección Configurar detección, especifica los tipos de datos sensibles que quieres buscar. Completar esta sección es opcional. Si omite esta sección, Protección de Datos Sensibles analizará sus datos en busca de un conjunto predeterminado de infoTypes.
Template
También puede usar una plantilla de Protección de Datos Sensibles para reutilizar la información de configuración que haya especificado anteriormente.
Si ya has creado una plantilla que quieres usar, haz clic en el campo Nombre de la plantilla para ver una lista de plantillas de inspección. Elige o escribe el nombre de la plantilla que quieras usar.
Para obtener más información sobre cómo crear plantillas, consulta el artículo Crear plantillas de inspección de Protección de Datos Sensibles.
InfoTypes
Los detectores de infoType buscan datos sensibles de un tipo concreto. Por ejemplo, el
detector de infoTypes integrado de Protección de Datos Sensibles US_SOCIAL_SECURITY_NUMBER
busca números de la seguridad social de EE. UU. Además de los detectores de infoType integrados, puede crear sus propios detectores de infoType personalizados.
En InfoTypes, elige el detector de infoType que corresponda al tipo de datos que quieras buscar. No te recomendamos que dejes esta sección en blanco. Si lo haces, Protección de Datos Sensibles analizará tus datos con un conjunto predeterminado de infoTypes, que puede incluir infoTypes que no necesites. Para obtener más información sobre cada detector, consulta la referencia del detector de infoType.
Para obtener más información sobre cómo gestionar los infoTypes integrados y personalizados en esta sección, consulta Gestionar infoTypes a través de la consola de Google Cloud .
Conjuntos de reglas de inspección
Umbral de confianza
Cada vez que Protección de Datos Sensibles detecta una posible coincidencia de datos sensibles, le asigna un valor de probabilidad en una escala que va de "Muy improbable" a "Muy probable". Cuando asignas un valor de probabilidad aquí, indicas a Protección de Datos Sensibles que solo busque coincidencias en los datos que correspondan a ese valor de probabilidad o a uno superior.
El valor predeterminado "Posible" es suficiente para la mayoría de los propósitos. Si sueles obtener resultados demasiado genéricos, mueve el control deslizante hacia arriba. Si obtienes demasiados pocos resultados, mueve el control deslizante hacia abajo.
Cuando hayas terminado, haz clic en Continuar.
Añadir acciones
En Añadir acciones, selecciona una o varias acciones que la protección de datos sensibles debe llevar a cabo una vez completado el trabajo. Para obtener más información, consulta el artículo Habilitar las acciones de inspección o análisis de riesgos.
Después de seleccionar las acciones, haga clic en Continuar.
Revisar
La sección Revisar contiene un resumen en formato JSON de los ajustes del trabajo que acabas de especificar.
Haz clic en Crear para crear el trabajo (si no has especificado una programación) y para ejecutarlo una vez. Aparecerá la página de información del trabajo, que contiene el estado y otra información. Si el trabajo se está ejecutando, puedes hacer clic en el botón Cancelar para detenerlo. También puedes eliminar el trabajo haciendo clic en Eliminar.
Para volver a la página principal Protección de datos sensibles, haz clic en la flecha Atrás de la consola Google Cloud .
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
En la API DLP, los trabajos se representan mediante el recurso
DlpJobs
. Para crear un trabajo, puedes usar el método projects.dlpJobs.create
del recurso DlpJob
.
Este JSON de ejemplo se puede enviar en una solicitud POST al endpoint REST de Protección de Datos Sensibles especificado. En este ejemplo de JSON se muestra cómo crear un trabajo en Protección de Datos Sensibles. La tarea es un análisis de inspección de Datastore.
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Ten en cuenta que una solicitud correcta, incluso una creada en el Explorador de APIs, creará un trabajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Entrada JSON:
{
"inspectJob": {
"storageConfig": {
"bigQueryOptions": {
"tableReference": {
"projectId": "bigquery-public-data",
"datasetId": "san_francisco_sfpd_incidents",
"tableId": "sfpd_incidents"
}
},
"timespanConfig": {
"startTime": "2020-01-01T00:00:01Z",
"endTime": "2020-01-31T23:59:59Z",
"timestampField": {
"name": "timestamp"
}
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "PERSON_NAME"
},
{
"name": "STREET_ADDRESS"
}
],
"excludeInfoTypes": false,
"includeQuote": true,
"minLikelihood": "LIKELY"
},
"actions": [
{
"saveFindings": {
"outputConfig": {
"table": {
"projectId": "[PROJECT-ID]",
"datasetId": "[DATASET-ID]"
}
}
}
}
]
}
}
Salida JSON:
El siguiente resultado indica que el trabajo se ha creado correctamente.
{
"name": "projects/[PROJECT-ID]/dlpJobs/[JOB-ID]",
"type": "INSPECT_JOB",
"state": "PENDING",
"inspectDetails": {
"requestedOptions": {
"snapshotInspectTemplate": {},
"jobConfig": {
"storageConfig": {
"bigQueryOptions": {
"tableReference": {
"projectId": "bigquery-public-data",
"datasetId": "san_francisco_sfpd_incidents",
"tableId": "sfpd_incidents"
}
},
"timespanConfig": {
"startTime": "2020-01-01T00:00:01Z",
"endTime": "2020-01-31T23:59:59Z",
"timestampField": {
"name": "timestamp"
}
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "PERSON_NAME"
},
{
"name": "STREET_ADDRESS"
}
],
"minLikelihood": "LIKELY",
"limits": {},
"includeQuote": true
},
"actions": [
{
"saveFindings": {
"outputConfig": {
"table": {
"projectId": "[PROJECT-ID]",
"datasetId": "[DATASET-ID]",
"tableId": "[TABLE-ID]"
}
}
}
}
]
}
},
"result": {}
},
"createTime": "2020-07-10T07:26:33.643Z"
}
Crear un activador de tarea
Para crear un activador de tareas de Protección de Datos Sensibles, siga estos pasos:
Consola
En la sección Protección de Datos Sensibles de la Google Cloud consola, ve a la página Crear tarea o activador de tarea.
Ir a Crear tarea o activador de tareas
La página Crear tarea o activador de tareas contiene las siguientes secciones:
Elegir datos de entrada
Nombre
Escribe un nombre para el activador de la tarea. Puedes usar letras, números y guiones. Ponerle un nombre al activador de trabajo es opcional. Si no introduces un nombre, Protección de Datos Sensibles asignará al activador de la tarea un identificador numérico único.
Ubicación
En el menú Tipo de almacenamiento, elija el tipo de repositorio que almacena los datos que quiere analizar:
- Cloud Storage: introduce la URL del bucket que quieras analizar o elige Incluir/excluir en el menú Tipo de ubicación y, a continuación, haz clic en Buscar para ir al bucket o a la subcarpeta que quieras analizar. Selecciona la casilla Analizar carpeta de forma recursiva para analizar el directorio especificado y todos los directorios que contenga. Déjala sin seleccionar para analizar solo el directorio especificado y no profundizar más.
- BigQuery: introduce los identificadores del proyecto, el conjunto de datos y la tabla que quieras analizar.
- Datastore: introduce los identificadores del proyecto, el espacio de nombres (opcional) y el tipo que quieras analizar.
Muestreo
El muestreo es una forma opcional de ahorrar recursos si tienes un volumen de datos muy grande.
En Muestreo, puede elegir si quiere analizar todos los datos seleccionados o tomar una muestra de los datos analizando un porcentaje determinado. El muestreo funciona de forma diferente en función del tipo de repositorio de almacenamiento que estés analizando:
- En BigQuery, puedes tomar una muestra de un subconjunto del total de filas seleccionadas, que se corresponderá con el porcentaje de archivos que especifiques para incluir en el análisis.
- En Cloud Storage, si algún archivo supera el tamaño especificado en Tamaño máximo en bytes que se puede analizar por archivo, Protección de Datos Sensibles lo analiza hasta ese tamaño máximo y, a continuación, pasa al siguiente archivo.
Para activar el muestreo, elige una de las siguientes opciones en el primer menú:
- Iniciar el muestreo desde el principio: Protección de Datos Sensibles empieza el análisis parcial al principio de los datos. En BigQuery, esto inicia el análisis en la primera fila. En Cloud Storage, el análisis empieza al principio de cada archivo y se detiene cuando Protección de Datos Sensibles ha analizado hasta el tamaño máximo de archivo especificado (consulta la información anterior).
- Iniciar el muestreo desde un punto aleatorio: Protección de Datos Sensibles empieza el análisis parcial en una ubicación aleatoria de los datos. En BigQuery, se inicia el análisis en una fila aleatoria. En Cloud Storage, este ajuste solo se aplica a los archivos que superen el tamaño máximo especificado. Protección de Datos Sensibles analiza los archivos que no superan el tamaño máximo en su totalidad y los que superan el tamaño máximo hasta alcanzarlo.
Para realizar un análisis parcial, también debe elegir el porcentaje de datos que quiere analizar. Usa el control deslizante para definir el porcentaje.
Configuración avanzada
Cuando creas un activador de trabajo para analizar los contenedores de Cloud Storage o las tablas de BigQuery, puedes acotar la búsqueda especificando una configuración avanzada. En concreto, puedes configurar lo siguiente:
- Archivos (solo Cloud Storage): los tipos de archivo que se van a analizar, incluidos los archivos de texto, binarios y de imagen.
- Campos de identificación (solo en BigQuery): identificadores de fila únicos en la tabla.
- En Cloud Storage, si algún archivo supera el tamaño especificado en Tamaño máximo en bytes que se puede analizar por archivo, Protección de Datos Sensibles lo analiza hasta ese tamaño máximo y, a continuación, pasa al siguiente archivo.
Para activar el muestreo, elija el porcentaje de datos que quiera analizar. Usa el control deslizante para definir el porcentaje. A continuación, elige una de las siguientes opciones del primer menú:
- Iniciar el muestreo desde el principio: Protección de Datos Sensibles empieza el análisis parcial al principio de los datos. En BigQuery, esto inicia el análisis en la primera fila. En Cloud Storage, el análisis empieza al principio de cada archivo y se detiene cuando Protección de Datos Sensibles ha analizado hasta el tamaño máximo de archivo especificado (consulta la información anterior).
- Iniciar el muestreo desde un punto aleatorio: Protección de Datos Sensibles empieza el análisis parcial en una ubicación aleatoria de los datos. En BigQuery, se inicia el análisis en una fila aleatoria. En Cloud Storage, este ajuste solo se aplica a los archivos que superen el tamaño máximo especificado. Protección de Datos Sensibles analiza los archivos que no superan el tamaño máximo en su totalidad y los que superan el tamaño máximo hasta alcanzarlo.
Archivos
En el caso de los archivos almacenados en Cloud Storage, puede especificar los tipos que quiere incluir en el análisis en Archivos.
Puedes elegir entre archivos binarios, de texto, de imagen, de Microsoft Word, de Microsoft Excel, de Microsoft PowerPoint, PDF y Apache Avro. Para ver una lista exhaustiva de las extensiones de archivo que Protección de Datos Sensibles puede analizar en los segmentos de Cloud Storage, consulta FileType
.
Si eliges Binario, Protección de Datos Sensibles analizará los archivos de tipos no reconocidos.
Campos identificativos
En el caso de las tablas de BigQuery, en el campo Campos de identificación, puede indicar a Protección de Datos Sensibles que incluya los valores de las columnas de clave principal de la tabla en los resultados. De esta forma, puede vincular los hallazgos a las filas de la tabla que los contienen.
Introduzca los nombres de las columnas que identifican de forma única cada fila de la tabla. Si es necesario, usa la notación de punto para especificar campos anidados. Puedes añadir todos los campos que quieras.
También debe activar la acción Guardar en BigQuery para exportar las detecciones a BigQuery. Cuando los resultados se exportan a BigQuery, cada uno de ellos contiene los valores respectivos de los campos de identificación. Para obtener más información, consulta identifyingFields
.
Configurar detección
En la sección Configurar detección, especifica los tipos de datos sensibles que quieres buscar. Completar esta sección es opcional. Si omite esta sección, Protección de Datos Sensibles analizará sus datos en busca de un conjunto predeterminado de infoTypes.
Template
También puede usar una plantilla de Protección de Datos Sensibles para reutilizar la información de configuración que haya especificado anteriormente.
Si ya has creado una plantilla que quieres usar, haz clic en el campo Nombre de la plantilla para ver una lista de plantillas de inspección. Elige o escribe el nombre de la plantilla que quieras usar.
Para obtener más información sobre cómo crear plantillas, consulta el artículo Crear plantillas de inspección de Protección de Datos Sensibles.
InfoTypes
Los detectores de infoType buscan datos sensibles de un tipo concreto. Por ejemplo, el
detector de infoTypes integrado de Protección de Datos Sensibles US_SOCIAL_SECURITY_NUMBER
busca números de la seguridad social de EE. UU. Además de los detectores de infoType integrados, puedes crear tus propios detectores de infoType personalizados.
En InfoTypes, elige el detector de infoType que corresponda al tipo de datos que quieras buscar. También puede dejar este campo en blanco para buscar todos los infoTypes predeterminados. Para obtener más información sobre cada detector, consulta la referencia del detector de infoType.
También puede añadir detectores de infoType personalizados en la sección InfoTypes personalizados y personalizar tanto los detectores de infoType integrados como los personalizados en la sección Conjuntos de reglas de inspección.
InfoTypes personalizados
Conjuntos de reglas de inspección
Umbral de confianza
Cada vez que Protección de Datos Sensibles detecta una posible coincidencia de datos sensibles, le asigna un valor de probabilidad en una escala que va de "Muy improbable" a "Muy probable". Cuando asignas un valor de probabilidad aquí, indicas a Protección de Datos Sensibles que solo busque coincidencias en los datos que correspondan a ese valor de probabilidad o a uno superior.
El valor predeterminado "Posible" es suficiente para la mayoría de los propósitos. Si sueles obtener resultados demasiado genéricos, mueve el control deslizante hacia arriba. Si obtienes demasiados pocos resultados, mueve el control deslizante hacia abajo.
Cuando hayas terminado, haz clic en Continuar.
Añadir acciones
En Añadir acciones, selecciona una o varias acciones que la protección de datos sensibles debe llevar a cabo una vez completado el trabajo. Para obtener más información, consulta el artículo Habilitar las acciones de inspección o análisis de riesgos.
Después de seleccionar las acciones, haga clic en Continuar.
Programar
En la sección Programación, puedes hacer dos cosas:
- Especificar periodo: esta opción limita los archivos o las filas que se van a analizar por fecha. Haz clic en Hora de inicio para especificar la marca de tiempo del archivo más antiguo que quieras incluir. Deje este valor en blanco para especificar todos los archivos. Haz clic en Hora de finalización para especificar la marca de tiempo del archivo más reciente que quieras incluir. Deje este valor en blanco para no especificar ningún límite superior de marca de tiempo.
Crear un activador para que la tarea se ejecute según una programación periódica: esta opción convierte la tarea en un activador de tarea que se ejecuta según una programación periódica. Si no especificas una programación, se creará un único trabajo que se iniciará inmediatamente y se ejecutará una vez. Para crear un activador de tarea que se ejecute con regularidad, debes definir esta opción.
El valor predeterminado también es el valor mínimo: 24 horas. El valor máximo es de 60 días.
Si quiere que Protección de Datos Sensibles analice solo los archivos o las filas nuevos, seleccione Limitar el análisis solo al contenido nuevo. En la inspección de BigQuery, solo se incluyen en el análisis las filas que tengan al menos tres horas de antigüedad. Consulta el problema conocido relacionado con esta operación.
Revisar
La sección Revisar contiene un resumen en formato JSON de los ajustes del trabajo que acabas de especificar.
Haz clic en Crear para crear el activador de tarea (si has especificado una programación). Aparecerá la página de información del activador de trabajo, que contiene el estado y otra información. Si el trabajo se está ejecutando, puedes hacer clic en el botón Cancelar para detenerlo. También puedes eliminar el activador de trabajo haciendo clic en Eliminar.
Para volver a la página principal Protección de datos sensibles, haz clic en la flecha Atrás de la consola Google Cloud .
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
En la API DLP, un activador de tareas se representa mediante el recurso JobTrigger
. Puedes crear un nuevo activador de trabajo mediante el método projects.jobTriggers.create
del recurso JobTrigger
.
Este JSON de ejemplo se puede enviar en una solicitud POST al endpoint REST de Protección de Datos Sensibles especificado. En este ejemplo de JSON se muestra cómo crear un activador de trabajo en Protección de Datos Sensibles. La tarea que activará este activador es un análisis de inspección de Datastore. El activador de tareas que se crea se ejecuta cada 86.400 segundos (24 horas).
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Ten en cuenta que, si la solicitud se completa correctamente, aunque se haya creado en Explorador de APIs, se creará un nuevo activador de tarea programada. Para obtener información general sobre el uso de JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Entrada JSON:
{
"jobTrigger":{
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"status":"HEALTHY",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"kind":{
"name":"Example-Kind"
},
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"excludeInfoTypes":false,
"includeQuote":true,
"minLikelihood":"LIKELY"
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
}
}
}
Salida JSON:
El siguiente resultado indica que el activador de la tarea se ha creado correctamente.
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
},
"kind":{
"name":"Example-Kind"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2018-11-30T01:52:41.171857Z",
"updateTime":"2018-11-30T01:52:41.171857Z",
"status":"HEALTHY"
}
Mostrar todas las tareas
Para mostrar todos los trabajos del proyecto actual, haz lo siguiente:
Consola
En la Google Cloud consola, ve a la página Protección de datos sensibles.
Haga clic en la pestaña Inspección y, a continuación, en la subpestaña Inspeccionar trabajos.
La consola muestra una lista de todos los trabajos del proyecto actual, incluidos sus identificadores, su estado, su hora de creación y su hora de finalización. Para obtener más información sobre cualquier tarea, incluido un resumen de sus resultados, haz clic en su identificador.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
El recurso DlpJob
tiene un método projects.dlpJobs.list
con el que puedes enumerar todos los trabajos.
Para ver una lista de todos los trabajos definidos en tu proyecto, envía una solicitud GET al endpoint dlpJobs
, como se muestra a continuación:
URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs?key={YOUR_API_KEY}
En la siguiente salida JSON se muestra uno de los trabajos devueltos. Ten en cuenta que la estructura del trabajo es similar a la del recurso DlpJob
.
Salida JSON:
{
"jobs":[
{
"name":"projects/[PROJECT-ID]/dlpJobs/i-5270277269264714623",
"type":"INSPECT_JOB",
"state":"DONE",
"inspectDetails":{
"requestedOptions":{
"snapshotInspectTemplate":{
},
"jobConfig":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"[CLOUD-STORAGE-URL]"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"startTime":"2019-09-08T22:43:16.623Z",
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_SOCIAL_SECURITY_NUMBER"
},
{
"name":"CANADA_SOCIAL_INSURANCE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT-ID]",
"datasetId":"[DATASET-ID]",
"tableId":"[TABLE-ID]"
}
}
}
}
]
}
},
"result":{
...
}
},
"createTime":"2019-09-09T22:43:16.918Z",
"startTime":"2019-09-09T22:43:16.918Z",
"endTime":"2019-09-09T22:43:53.091Z",
"jobTriggerName":"projects/[PROJECT-ID]/jobTriggers/sample-trigger2"
},
...
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Mostrar todos los activadores de tareas
Para mostrar todos los activadores de trabajos del proyecto actual, haz lo siguiente:
Consola
En la Google Cloud consola, ve a la página Protección de datos sensibles.
Ir a Protección de Datos Sensibles
En la pestaña Inspección, en la subpestaña Activadores de trabajos, la consola muestra una lista de todos los activadores de trabajos del proyecto actual.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
El recurso JobTrigger
tiene un método projects.jobTriggers.list
con el que puedes enumerar todos los activadores de trabajos.
Para enumerar todos los activadores de tareas definidos en tu proyecto, envía una solicitud GET al endpoint jobTriggers
, como se muestra a continuación:
URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/jobTriggers?key={YOUR_API_KEY}
En la siguiente salida JSON se muestra el activador de trabajo que hemos creado en la sección anterior. Ten en cuenta que la estructura del activador de tareas es similar a la del recurso JobTrigger
.
Salida JSON:
{
"jobTriggers":[
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
},
"kind":{
"name":"Example-Kind"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2018-11-30T01:52:41.171857Z",
"updateTime":"2018-11-30T01:52:41.171857Z",
"status":"HEALTHY"
},
...
],
"nextPageToken":"KkwKCQjivJ2UpPreAgo_Kj1wcm9qZWN0cy92ZWx2ZXR5LXN0dWR5LTE5NjEwMS9qb2JUcmlnZ2Vycy8xNTA5NzEyOTczMDI0MDc1NzY0"
}
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Eliminar una tarea
Para eliminar un trabajo de tu proyecto, incluidos sus resultados, haz lo siguiente: Esta operación no afecta a los resultados guardados externamente (por ejemplo, en BigQuery).
Consola
En la Google Cloud consola, ve a la página Protección de datos sensibles.
Haga clic en la pestaña Inspección y, a continuación, en la subpestaña Inspeccionar trabajos. La Google Cloud consola muestra una lista de todos los trabajos del proyecto actual.
En la columna Acciones del activador de trabajo que quieras eliminar, haz clic en el menú Más acciones (tres puntos verticales)
y, a continuación, en Eliminar.
También puedes hacer clic en el identificador del trabajo que quieras eliminar en la lista de trabajos. En la página de detalles del empleo, haz clic en Eliminar.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
Para eliminar un trabajo del proyecto actual, envía una solicitud DELETE al endpoint dlpJobs
, como se muestra aquí. Sustituye el campo [JOB-IDENTIFIER]
por el identificador del trabajo, que empieza por i-
.
URL:
DELETE https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs/[JOB-IDENTIFIER]?key={YOUR_API_KEY}
Si la solicitud se ha realizado correctamente, la API DLP devolverá una respuesta de éxito. Para verificar que la tarea se ha eliminado correctamente, lista todas las tareas.
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Eliminar un activador de tarea
Consola
En la Google Cloud consola, ve a la página Protección de datos sensibles.
Ir a Protección de Datos Sensibles
En la pestaña Inspección, en la subpestaña Activadores de trabajos, la consola muestra una lista de todos los activadores de trabajos del proyecto actual.
En la columna Acciones del activador de trabajo que quieras eliminar, haz clic en el menú Más acciones (tres puntos verticales)
y, a continuación, en Eliminar.
También puedes hacer clic en el nombre del activador de trabajo que quieras eliminar en la lista de activadores de trabajo. En la página de detalles del activador de la tarea, haz clic en Eliminar.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
Para eliminar un activador de trabajo del proyecto actual, envía una solicitud DELETE al endpoint jobTriggers
, como se muestra a continuación. Sustituye el campo [JOB-TRIGGER-NAME]
por el nombre del activador de trabajo.
URL:
DELETE https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/jobTriggers/[JOB-TRIGGER-NAME]?key={YOUR_API_KEY}
Si la solicitud se ha realizado correctamente, la API DLP devolverá una respuesta de éxito. Para verificar que el activador de la tarea se ha eliminado correctamente, lista todos los activadores de tareas.
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Obtener una tarea
Para obtener un trabajo de tu proyecto, incluidos sus resultados, haz lo siguiente. Esta operación no afecta a los resultados guardados externamente (por ejemplo, en BigQuery).
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
Para obtener un trabajo del proyecto actual, envía una solicitud GET al endpoint dlpJobs
, como se muestra aquí. Sustituye el campo [JOB-IDENTIFIER]
por el identificador del trabajo, que empieza por i-
.
URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs/[JOB-IDENTIFIER]?key={YOUR_API_KEY}
Si la solicitud se ha realizado correctamente, la API DLP devolverá una respuesta de éxito.
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Forzar la ejecución inmediata de un activador de tarea
Una vez que se ha creado un activador de trabajo, puedes forzar una ejecución inmediata del activador para probarlo activándolo. Para ello, ejecuta el siguiente comando:
curl --request POST \
-H "Content-Type: application/json" \
-H "Accept: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "X-Goog-User-Project: PROJECT_ID" \
'https://dlp.googleapis.com/v2/JOB_TRIGGER_NAME:activate'
Haz los cambios siguientes:
- PROJECT_ID: el ID del Google Cloud proyecto al que se facturarán los cargos de acceso asociados a la solicitud.
- JOB_TRIGGER_NAME: nombre completo del recurso del activador del trabajo (por ejemplo,
projects/my-project/locations/global/jobTriggers/123456789
).
Actualizar un activador de tarea
Además de crear, enumerar y eliminar activadores de tareas, también puedes actualizar un activador de tarea. Para cambiar la configuración de un activador de trabajo, sigue estos pasos:
Consola
En la Google Cloud consola, ve a la página Protección de datos sensibles.
Haz clic en la pestaña Inspección y, a continuación, en la subpestaña Activadores de trabajos.
La consola muestra una lista de todos los activadores de trabajos del proyecto actual.
En la columna Acciones del activador de trabajo que quieras eliminar, haz clic en Más more_vert y, a continuación, en Ver detalles.
En la página de detalles del activador de la tarea, haz clic en Editar.
En la página Editar activador, puede cambiar la ubicación de los datos de entrada, los detalles de detección (como plantillas, infoTipos o probabilidad), las acciones posteriores al análisis y la programación del activador de la tarea. Cuando hayas terminado de hacer los cambios, haz clic en Guardar.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
Usa el método
projects.jobTriggers.patch
para enviar nuevos valores de JobTrigger
a la API DLP
y actualizar esos valores en un activador de trabajo específico.
Por ejemplo, considera el siguiente activador de trabajo sencillo. Este JSON representa el activador de trabajo y se devolvió después de enviar una solicitud GET al endpoint del activador de trabajo del proyecto actual.
Salida JSON:
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"inspectJob":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"gs://dlptesting/*"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_SOCIAL_SECURITY_NUMBER"
}
],
"minLikelihood":"POSSIBLE",
"limits":{
}
},
"actions":[
{
"jobNotificationEmails":{
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2019-03-06T21:19:45.774841Z",
"updateTime":"2019-03-06T21:19:45.774841Z",
"status":"HEALTHY"
}
El siguiente JSON, cuando se envía con una solicitud PATCH al endpoint especificado, actualiza el activador de trabajo indicado con un nuevo infoType que buscar, así como una nueva probabilidad mínima. Tenga en cuenta que también debe especificar el atributo updateMask
y que su valor debe tener el formato FieldMask
.
Entrada JSON:
PATCH https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]?key={YOUR_API_KEY}
{
"jobTrigger":{
"inspectJob":{
"inspectConfig":{
"infoTypes":[
{
"name":"US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER"
}
],
"minLikelihood":"LIKELY"
}
}
},
"updateMask":"inspectJob(inspectConfig(infoTypes,minLikelihood))"
}
Después de enviar este JSON a la URL especificada, se devuelve lo siguiente, que representa el activador de trabajo actualizado. Ten en cuenta que los valores originales de infoType y likelihood se han sustituido por los nuevos.
Salida JSON:
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"inspectJob":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"gs://dlptesting/*"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
}
},
"actions":[
{
"jobNotificationEmails":{
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2019-03-06T21:19:45.774841Z",
"updateTime":"2019-03-06T21:27:01.650183Z",
"lastRunTime":"1970-01-01T00:00:00Z",
"status":"HEALTHY"
}
Para probarlo rápidamente, puedes usar el Explorador de APIs que se incluye más abajo. Para obtener información general sobre cómo usar JSON para enviar solicitudes a la API DLP, consulta la guía de inicio rápido de JSON.
Latencia de las tareas
No se garantiza ningún objetivo de nivel de servicio para los trabajos ni los activadores de trabajos. La latencia se ve afectada por varios factores, como la cantidad de datos que se van a analizar, el repositorio de almacenamiento que se va a analizar, el tipo y el número de infoTypes que se van a buscar, la región en la que se procesa el trabajo y los recursos de computación disponibles en esa región. Por lo tanto, la latencia de las tareas de inspección no se puede determinar de antemano.
Para reducir la latencia de los trabajos, puedes probar lo siguiente:
- Si el muestreo está disponible para tu tarea o activador de tareas, habilítalo.
Evita habilitar infoTypes que no necesites. Aunque los siguientes tipos de información son útiles en determinados casos, pueden hacer que las solicitudes se ejecuten mucho más lentamente que las que no los incluyen:
PERSON_NAME
FEMALE_NAME
MALE_NAME
FIRST_NAME
LAST_NAME
DATE_OF_BIRTH
LOCATION
STREET_ADDRESS
ORGANIZATION_NAME
Especifica siempre los infoTypes de forma explícita. No utilices una lista infoTypes vacía.
Si es posible, usa otra región de procesamiento.
Si sigues teniendo problemas de latencia con los trabajos después de probar estas técnicas, considera la posibilidad de usar solicitudes content.inspect
o content.deidentify
en lugar de trabajos. Estos métodos se rigen por el Acuerdo de Nivel de Servicio. Para obtener más información, consulta el acuerdo de nivel de servicio de Protección de Datos Sensibles.
Limitar el análisis solo al contenido nuevo
Puedes configurar el activador de la tarea para que defina automáticamente la fecha del periodo de los archivos almacenados en Cloud Storage o BigQuery. Cuando asignas el valor de autocompletar al objeto TimespanConfig
, Protección de Datos Sensibles solo analiza los datos que se han añadido o modificado desde la última vez que se activó el activador:
...
timespan_config {
enable_auto_population_of_timespan_config: true
}
...
En el caso de la inspección de BigQuery, solo se incluyen en el análisis las filas que tengan al menos tres horas. Consulta el problema conocido relacionado con esta operación.
Activar tareas al subir archivos
Además de la compatibilidad con los activadores de tareas, que está integrada en Protección de Datos Sensibles,Google Cloud también tiene otros componentes que puedes usar para integrar o activar tareas de Protección de Datos Sensibles. Por ejemplo, puedes usar Cloud Run Functions para activar un análisis de Protección de Datos Sensibles cada vez que se suba un archivo a Cloud Storage.
Para obtener información sobre cómo configurar esta operación, consulta el artículo Automatizar la clasificación de datos subidos a Cloud Storage.
Tareas completadas correctamente sin datos inspeccionados
Un trabajo puede completarse correctamente aunque no se haya analizado ningún dato. Los siguientes ejemplos pueden provocar que esto ocurra:
- La tarea está configurada para inspeccionar un recurso de datos específico, como un archivo, que existe pero está vacío.
- El trabajo está configurado para inspeccionar un recurso de datos que no existe o que ya no existe.
- La tarea está configurada para inspeccionar un segmento de Cloud Storage que está vacío.
- La tarea está configurada para inspeccionar un segmento y el análisis recursivo está inhabilitado. En el nivel superior, el segmento solo contiene carpetas que, a su vez, contienen los archivos.
- El trabajo está configurado para inspeccionar solo un tipo de archivo específico en un contenedor, pero el contenedor no tiene ningún archivo de ese tipo.
- El trabajo está configurado para inspeccionar solo el contenido nuevo, pero no ha habido actualizaciones desde la última vez que se ejecutó.
En la Google Cloud consola, en la página Detalles del trabajo, el campo Bytes analizados especifica la cantidad de datos que ha inspeccionado el trabajo. En la API DLP, el campo processedBytes
especifica la cantidad de datos que se han inspeccionado.