La protección de datos sensibles contiene muchos detectores de Infotipos integrados, pero también puedes crear el tuyo. Puedes personalizar el comportamiento de detección si defines tus propios detectores de Infotipo personalizados para que la Protección de datos sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Los siguientes son los tipos de detectores de Infotipo personalizados:
- Los detectores de diccionarios personalizados normales son listas de palabras y frases simples con las que coincide la protección de datos sensibles. Usa los detectores de diccionarios personalizados regulares cuando tengas como máximo varios cientos de miles de palabras.
- La protección de datos sensibles genera detectores de diccionarios personalizados grandes con listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa detectores de diccionarios personalizados grandes cuando tengas listas extensas de palabras o frases de hasta decenas de millones.
- Los detectores de expresiones regulares (regex) permiten que la protección de datos sensibles detecte coincidencias basadas en un patrón de expresión regular.
- Los detectores de Infotipo subrogados detectan el resultado de la transformación de desidentificación de la protección de datos sensibles
CryptoReplaceFfxFpeConfig
. Este detector de Infotipo personalizado solo se usa con el métodocontent:reidentify
para revertir la desidentificación mediante la encriptación de preservación de formato (FPE) en modo FFX. Por este motivo, los subrogados no se describen detalladamente en estos temas. Para obtener más información sobre cómo y cuándo usar los detectores de Infotipo personalizados subrogados, consulta seudonimización.
Además, la protección de datos sensibles incluye el concepto de reglas de inspección, que te permiten ajustar los resultados del análisis mediante las siguientes opciones:
- Las reglas de exclusión te permiten excluir los resultados falsos o no deseados si agregas reglas a un detector de Infotipo integrado o personalizado.
- Las reglas de palabra clave te permiten aumentar la cantidad o precisión de los resultados que se muestran si agregas reglas a un detector de Infotipo integrado o personalizado.
Si quieres obtener más información sobre los detectores de Infotipos personalizados, consulta la página de conceptos de Infotipos y detectores de Infotipos. Para ver varios ejemplos que puedes usar o modificar según tus necesidades, consulta Ejemplos de detectores de Infotipos personalizados. En el resto de este tema, se describe cómo usar la protección de datos sensibles para crear tus propios detectores de Infotipo personalizados.
Dónde usar los detectores de Infotipo personalizados
Los detectores de Infotipos personalizados se definen en el objeto CustomInfoType
. Debes especificar un CustomInfoType
en el objeto InspectConfig
cuando configuras lo siguiente:
- Inspección mediante
projects.content.inspect
- Trabajos de inspección en
InspectJobConfig
- Plantillas de inspección dentro de
InspectTemplate
- Desidentificación mediante
projects.content.deidentify
- Plantillas de desidentificación dentro de
DeidentifyTemplate
- Reidentificación del contenido que se desidentificó con FPE en modo FFX mediante
projects.content.reidentify
. Esta situación es específica para subrogar los detectores de Infotipos personalizados
Descripción general de la API
El objeto CustomInfoType
te permite crear un detector de Infotipos personalizado para contenido nuevo o ajustar los resultados que muestran los detectores de Infotipos predefinidos.
El objeto CustomInfoType
consta de los siguientes campos, que se establecen como se describe:
"infotype"
: Es el nombre del detector de Infotipos personalizado, contenido en un objetoInfoType
."likelihood"
: Es el valorLikelihood
predeterminado que se mostrará para este detector de Infotipos personalizado. Puedes especificar valoresLikelihood
alternativos en"detectionRules"
, que reemplazarán estaLikelihood
base si el resultado cumple con los criterios especificados por la regla. Si no incluyes el campo"likelihood"
, el detector de Infotipos personalizado seráVERY_LIKELY
de forma predeterminada. Para obtener más información sobre la probabilidad, consulta la página del concepto Probabilidad."detectionRules"
: Es un conjunto de objetosDetectionRule
para aplicar de manera adicional a todos los resultados de este detector de Infotipos personalizado. Aquí es donde se especifican las reglas de palabra clave, como objetosHotwordRule
. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetosSurrogateType
."sensitivityScore"
: Es el valorSensitivityScore
que se mostrará para este detector de Infotipo personalizado. Si no incluyes el campo"sensitivityScore"
, el detector de Infotipo personalizado seráVERY_LIKELY
de forma predeterminada.Las puntuaciones de sensibilidad se usan en los perfiles de datos. Cuando generas perfiles de tus datos, la protección de datos sensibles usa las puntuaciones de sensibilidad de los Infotipos para calcular el nivel de sensibilidad.
Uno de los siguientes campos, según el tipo de detector de Infotipo personalizados que creas:
"dictionary"
: Es un objetoDictionary
que contiene una lista de palabras o frases para buscar."regex"
: Es un objetoRegex
que contiene un patrón único que define la expresión regular."surrogateType"
: Es un objetoSurrogateType
; si está presente, indica que el detector de Infotipos personalizado es un subrogado. Para obtener más información sobre cómo usar los detectores de Infotipos personalizados subrogados, consulta Seudonimización."storedType"
: Es una referencia a un objetoStoredInfoType
existente. Este campo es obligatorio cuando se crea un detector de diccionario personalizado grande. Aunque puedes crear detectores de diccionarios regulares o detectores de expresiones regulares mediante la definición de este campo, es más fácil crearlos mediante la definición del campodictionary
o el camporegex
, respectivamente.
Próximos pasos
Obtén más información sobre cómo crear un Infotipo personalizado a partir de los siguientes temas:
- Crea un detector de diccionarios personalizados normales: aprende a crear un detector de Infotipos personalizados para hacer coincidir los resultados en una lista de palabras y frases.
- Crea un detector de diccionarios personalizados de gran tamaño: aprende a hacer coincidir los resultados en una gran lista de palabras y frases. Los detectores de Infotipos personalizados almacenados pueden coincidir con hasta decenas de millones de palabras.
- Crea un detector regex personalizado: aprende a crear un detector de Infotipo personalizados para hacer coincidir los resultados en una expresión regular.
- Modifica los detectores de Infotipo a fin de definir mejor los resultados del análisis: aprende a crear modificadores para detectores de Infotipos integrados y personalizados que pueden ajustar con precisión los resultados del análisis.
- Personaliza la probabilidad de coincidencia: aprende cómo usar las reglas de detección y palabras clave para personalizar los valores de probabilidad que se asignan a las coincidencias del detector personalizado.
- Ejemplos de detectores de Infotipos personalizados: varios ejemplos de definiciones de detectores de Infotipos personalizados JSON que puedes usar o modificar de acuerdo a tus necesidades.