Detectores de Infotipo personalizados

La protección de datos sensibles contiene muchos detectores de Infotipos integrados, pero también puedes crear los tuyos. Puedes personalizar el comportamiento de detección mediante la definición de tus propios detectores de Infotipo personalizados, de modo que la Protección de datos sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Los siguientes son los tipos de detectores de Infotipo personalizados:

  • Los detectores de diccionarios personalizados normales son listas de palabras y frases sencillas con las que la Protección de datos sensibles genera coincidencias. Usa los detectores de diccionarios personalizados regulares cuando tengas como máximo varios cientos de miles de palabras.
  • La Protección de datos sensibles genera detectores de diccionarios personalizados grandes con listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa los detectores de diccionarios personalizados grandes cuando tengas listas grandes de palabras o frases de hasta decenas de millones.
  • Los detectores de expresiones regulares (regex) permiten que la Protección de datos sensibles detecte coincidencias basadas en un patrón de expresión regular.
  • Los detectores de Infotipo de subrogados detectan la salida de la transformación de desidentificación de la Protección de datos sensibles CryptoReplaceFfxFpeConfig. Este detector de Infotipo personalizados solo se usa con el método content:reidentify para revertir la desidentificación mediante la encriptación de preservación de formato (FPE) en modo FFX. Por este motivo, los sustitutos no se describen en detalle en estos temas. Para obtener más información sobre cómo y cuándo usar los detectores de Infotipo personalizados subrogados, consulta Seudonimización.

Además, la Protección de datos sensibles incluye el concepto de reglas de inspección, que te permiten ajustar con precisión los resultados del análisis con las siguientes reglas:

  • Las reglas de exclusión te permiten excluir los resultados falsos o no deseados si agregas reglas a un detector de Infotipo integrado o personalizado.
  • Las reglas de palabra clave te permiten aumentar la cantidad o precisión de los resultados que se muestran si agregas reglas a un detector de Infotipo integrado o personalizado.

Si quieres obtener más información sobre los detectores de Infotipos personalizados, consulta la página de conceptos de Infotipos y detectores de Infotipos. Para ver varios ejemplos que puedes usar o modificar según tus necesidades, consulta Ejemplos de detectores de Infotipos personalizados. En el resto de este tema, se describe cómo usar la Protección de datos sensibles para crear tus propios detectores de Infotipo personalizados.

Dónde usar los detectores de Infotipo personalizados

Los detectores de Infotipos personalizados se definen en el objeto CustomInfoType. Debes especificar un CustomInfoType en el objeto InspectConfig cuando configuras lo siguiente:

Descripción general de la API

El objeto CustomInfoType te permite crear un detector de Infotipos personalizado para contenido nuevo o ajustar los resultados que muestran los detectores de Infotipos predefinidos.

El objeto CustomInfoType consta de los siguientes campos, que se establecen como se describe:

  • "infotype": Es el nombre del detector de Infotipos personalizado, contenido en un objeto InfoType.
  • "likelihood": Es el valor Likelihood predeterminado que se mostrará para este detector de Infotipos personalizado. Puedes especificar valores Likelihood alternativos en "detectionRules", que reemplazarán esta Likelihood base si el resultado cumple con los criterios especificados por la regla. Si no incluyes el campo "likelihood", el detector de Infotipos personalizado será VERY_LIKELY de forma predeterminada. Para obtener más información sobre la probabilidad, consulta la página del concepto Probabilidad.
  • "detectionRules": Es un conjunto de objetos DetectionRule para aplicar de manera adicional a todos los resultados de este detector de Infotipos personalizado. Aquí es donde se especifican las reglas de palabra clave, como objetos HotwordRule. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetos SurrogateType.
  • "sensitivityScore": Es el valor SensitivityScore que se mostrará para este detector de Infotipo personalizado. Si no incluyes el campo "sensitivityScore", el detector de Infotipo personalizado será VERY_LIKELY de forma predeterminada.

    Las puntuaciones de sensibilidad se usan en los perfiles de datos. Cuando se crea un perfil de tus datos, Sensitive Data Protection usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.

  • Uno de los siguientes campos, según el tipo de detector de Infotipo personalizados que creas:

    • "dictionary": Es un objeto Dictionary que contiene una lista de palabras o frases para buscar.
    • "regex": Es un objeto Regex que contiene un patrón único que define la expresión regular.
    • "surrogateType": Es un objeto SurrogateType; si está presente, indica que el detector de Infotipos personalizado es un subrogado. Para obtener más información sobre cómo usar los detectores de Infotipos personalizados subrogados, consulta Seudonimización.
    • "storedType": Es una referencia a un objeto StoredInfoType existente. Este campo es obligatorio cuando se crea un detector de diccionario personalizado grande. Si bien puedes crear detectores de diccionario normales o detectores de expresión regular si defines este campo, es más sencillo crearlos si defines el campo dictionary o regex, respectivamente.

Próximos pasos

Obtén más información sobre cómo crear un Infotipo personalizado a partir de los siguientes temas: