Detectores de infoType personalizados

Protección de Datos Sensibles contiene muchos detectores de infoType integrados, pero también puedes crear los tuyos. Puedes personalizar el comportamiento de detección definiendo tus propios detectores de infoType personalizados para que Protección de Datos Sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Estos son los tipos de detectores de infoType personalizados:

  • Los detectores de diccionario personalizado normales son listas sencillas de palabras y frases que Sensitive Data Protection busca. Usa detectores de diccionario personalizado normales cuando tengas como máximo varios cientos de miles de palabras.
  • Sensitive Data Protection genera detectores de diccionarios personalizados grandes a partir de listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa detectores de diccionarios personalizados grandes cuando tengas una lista extensa de palabras o frases (hasta decenas de millones).
  • Los detectores de expresiones regulares (regex) permiten a Protección de datos sensibles detectar coincidencias basadas en un patrón de expresión regular.
  • Los detectores de infoType sustituto detectan la salida de la transformación de desidentificación de Protección de Datos Sensibles CryptoReplaceFfxFpeConfig. Este detector de infoType personalizado solo se usa con el método content:reidentify para revertir la desidentificación mediante el encriptado con preservación de formato (FPE) en el modo FFX. Por este motivo, los sustitutos no se describen en detalle en estos temas. Para obtener más información sobre cómo y cuándo usar detectores de infoType personalizados subrogados, consulta Pseudonimización.

Además, Protección de Datos Sensibles incluye el concepto de reglas de inspección, que te permiten ajustar los resultados de los análisis mediante lo siguiente:

  • Las reglas de exclusión le permiten excluir resultados falsos o no deseados añadiendo reglas a un detector de infoType integrado o personalizado.
  • Las reglas de palabras de activación te permiten aumentar la cantidad o la precisión de los resultados que se devuelven añadiendo reglas a un detector de infoTypes integrado o personalizado.

Para obtener más información sobre los detectores personalizados de InfoType, consulta la página de conceptos InfoTypes y detectores de infoType. Para ver varios ejemplos que puedes usar o modificar según te convenga, consulta Ejemplos de detectores de infoType personalizados. En el resto de este tema se describe cómo usar Protección de Datos Sensibles para crear tus propios detectores de InfoType personalizados.

Dónde usar detectores de infoType personalizados

Los detectores de infoType personalizados se definen en el objeto CustomInfoType. Especifica un CustomInfoType en el objeto InspectConfig cuando configuras lo siguiente:

Información general sobre la API

El objeto CustomInfoType te permite crear un detector de infoType personalizado para contenido nuevo o ajustar los resultados devueltos por los detectores de infoType predefinidos.

El objeto CustomInfoType se compone de los siguientes campos, que se definen como se describe:

  • "infotype": nombre del detector de infoType personalizado, contenido en un objeto InfoType.
  • "likelihood": valor predeterminado de Likelihood que se devuelve para este detector de infoType personalizado. Puedes especificar valores Likelihood alternativos en "detectionRules" que sustituirán a este valor base Likelihood si el resultado cumple los criterios especificados en la regla. Si no incluyes el campo "likelihood", el detector de infoType personalizado se asignará de forma predeterminada a VERY_LIKELY. Para obtener más información sobre la probabilidad, consulta la página de conceptos sobre la probabilidad.
  • "detectionRules": conjunto de objetos DetectionRule que se aplicarán adicionalmente a todos los resultados de este detector de infoType personalizado. Aquí es donde se especifican las reglas de palabras de activación como objetos HotwordRule. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetos SurrogateType.
  • "sensitivityScore": el valor de SensitivityScore que se devolverá para este detector de infoType personalizado. Si no incluye el campo "sensitivityScore", el detector de infoType personalizado tendrá el valor predeterminado VERY_LIKELY.

    Las puntuaciones de sensibilidad se usan en los perfiles de datos. Al crear perfiles de tus datos, Protección de Datos Sensibles usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.

  • Uno de los siguientes campos, en función del tipo de detector de InfoType personalizado que estés creando:

    • "dictionary": objeto Dictionary que contiene una lista de palabras o frases que se deben buscar.
    • "regex": objeto Regex que contiene un único patrón que define la expresión regular.
    • "surrogateType": un objeto SurrogateType que, si está presente, indica que el detector de infoType personalizado es un sustituto. Para obtener más información sobre cómo usar detectores de infoTypes personalizados subrogados, consulte Pseudonimización.
    • "storedType": referencia a un objeto StoredInfoType. Este campo es obligatorio al crear un detector de diccionario personalizado grande. Aunque puedes crear detectores de diccionario normales o detectores de expresiones regulares definiendo este campo, es más sencillo crearlos definiendo el campo dictionary o el campo regex, respectivamente.

Pasos siguientes

Consulta más información sobre cómo crear infoTypes personalizados en los siguientes temas: