La protección de datos sensibles contiene muchos detectores de Infotipos integrados, pero también puedes crear los tuyos. Puedes personalizar el comportamiento de detección mediante la definición de tus propios detectores de Infotipo personalizados, de modo que la Protección de datos sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Los siguientes son los tipos de detectores de Infotipo personalizados:
- Los detectores de diccionarios personalizados normales son listas de palabras y frases sencillas con las que la Protección de datos sensibles genera coincidencias. Usa los detectores de diccionarios personalizados regulares cuando tengas como máximo varios cientos de miles de palabras.
- La Protección de datos sensibles genera detectores de diccionarios personalizados grandes con listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa los detectores de diccionarios personalizados grandes cuando tengas listas grandes de palabras o frases de hasta decenas de millones.
- Los detectores de expresiones regulares (regex) permiten que la Protección de datos sensibles detecte coincidencias basadas en un patrón de expresión regular.
- Los detectores de Infotipo de subrogados detectan la salida de la transformación de desidentificación de la Protección de datos sensibles
CryptoReplaceFfxFpeConfig
. Este detector de Infotipo personalizados solo se usa con el métodocontent:reidentify
para revertir la desidentificación mediante la encriptación de preservación de formato (FPE) en modo FFX. Por este motivo, los sustitutos no se describen en detalle en estos temas. Para obtener más información sobre cómo y cuándo usar los detectores de Infotipo personalizados subrogados, consulta Seudonimización.
Además, la Protección de datos sensibles incluye el concepto de reglas de inspección, que te permiten ajustar con precisión los resultados del análisis con las siguientes reglas:
- Las reglas de exclusión te permiten excluir los resultados falsos o no deseados si agregas reglas a un detector de Infotipo integrado o personalizado.
- Las reglas de palabra clave te permiten aumentar la cantidad o precisión de los resultados que se muestran si agregas reglas a un detector de Infotipo integrado o personalizado.
Si quieres obtener más información sobre los detectores de Infotipos personalizados, consulta la página de conceptos de Infotipos y detectores de Infotipos. Para ver varios ejemplos que puedes usar o modificar según tus necesidades, consulta Ejemplos de detectores de Infotipos personalizados. En el resto de este tema, se describe cómo usar la Protección de datos sensibles para crear tus propios detectores de Infotipo personalizados.
Dónde usar los detectores de Infotipo personalizados
Los detectores de Infotipos personalizados se definen en el objeto CustomInfoType
. Debes especificar un CustomInfoType
en el objeto InspectConfig
cuando configuras lo siguiente:
- Inspección mediante
projects.content.inspect
- Trabajos de inspección en
InspectJobConfig
- Plantillas de inspección dentro de
InspectTemplate
- Desidentificación mediante
projects.content.deidentify
- Plantillas de desidentificación dentro de
DeidentifyTemplate
- Reidentificación del contenido que se desidentificó con FPE en modo FFX mediante
projects.content.reidentify
. Esta situación es específica para subrogar los detectores de Infotipos personalizados
Descripción general de la API
El objeto CustomInfoType
te permite crear un detector de Infotipos personalizado para contenido nuevo o ajustar los resultados que muestran los detectores de Infotipos predefinidos.
El objeto CustomInfoType
consta de los siguientes campos, que se establecen como se describe:
"infotype"
: Es el nombre del detector de Infotipos personalizado, contenido en un objetoInfoType
."likelihood"
: Es el valorLikelihood
predeterminado que se mostrará para este detector de Infotipos personalizado. Puedes especificar valoresLikelihood
alternativos en"detectionRules"
, que reemplazarán estaLikelihood
base si el resultado cumple con los criterios especificados por la regla. Si no incluyes el campo"likelihood"
, el detector de Infotipos personalizado seráVERY_LIKELY
de forma predeterminada. Para obtener más información sobre la probabilidad, consulta la página del concepto Probabilidad."detectionRules"
: Es un conjunto de objetosDetectionRule
para aplicar de manera adicional a todos los resultados de este detector de Infotipos personalizado. Aquí es donde se especifican las reglas de palabra clave, como objetosHotwordRule
. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetosSurrogateType
."sensitivityScore"
: Es el valorSensitivityScore
que se mostrará para este detector de Infotipo personalizado. Si no incluyes el campo"sensitivityScore"
, el detector de Infotipo personalizado seráVERY_LIKELY
de forma predeterminada.Las puntuaciones de sensibilidad se usan en los perfiles de datos. Cuando se crea un perfil de tus datos, Sensitive Data Protection usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.
Uno de los siguientes campos, según el tipo de detector de Infotipo personalizados que creas:
"dictionary"
: Es un objetoDictionary
que contiene una lista de palabras o frases para buscar."regex"
: Es un objetoRegex
que contiene un patrón único que define la expresión regular."surrogateType"
: Es un objetoSurrogateType
; si está presente, indica que el detector de Infotipos personalizado es un subrogado. Para obtener más información sobre cómo usar los detectores de Infotipos personalizados subrogados, consulta Seudonimización."storedType"
: Es una referencia a un objetoStoredInfoType
existente. Este campo es obligatorio cuando se crea un detector de diccionario personalizado grande. Si bien puedes crear detectores de diccionario normales o detectores de expresión regular si defines este campo, es más sencillo crearlos si defines el campodictionary
oregex
, respectivamente.
Próximos pasos
Obtén más información sobre cómo crear un Infotipo personalizado a partir de los siguientes temas:
- Crea un detector de diccionarios personalizados normales: aprende a crear un detector de Infotipos personalizados para hacer coincidir los resultados en una lista de palabras y frases.
- Crea un detector de diccionarios personalizados grandes: aprende a hacer coincidir los resultados en una lista grande de palabras y frases. Los detectores de Infotipos personalizados almacenados pueden coincidir con hasta decenas de millones de palabras.
- Crea un detector regex personalizado: aprende a crear un detector de Infotipo personalizados para hacer coincidir los resultados en una expresión regular.
- Modifica los detectores de Infotipo a fin de definir mejor los resultados del análisis: aprende a crear modificadores para detectores de Infotipos integrados y personalizados que pueden ajustar con precisión los resultados del análisis.
- Personaliza la probabilidad de coincidencia: aprende cómo usar las reglas de detección y palabras clave para personalizar los valores de probabilidad que se asignan a las coincidencias del detector personalizado.
- Ejemplos de detectores de Infotipos personalizados: varios ejemplos de definiciones de detectores de Infotipos personalizados JSON que puedes usar o modificar de acuerdo a tus necesidades.