Detectores de Infotipo personalizados

La protección de datos sensibles contiene muchos detectores de Infotipos integrados, pero también puedes crear el tuyo. Puedes personalizar el comportamiento de detección si defines tus propios detectores de Infotipo personalizados para que la Protección de datos sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Los siguientes son los tipos de detectores de Infotipo personalizados:

  • Los detectores de diccionarios personalizados normales son listas de palabras y frases simples con las que coincide la protección de datos sensibles. Usa los detectores de diccionarios personalizados regulares cuando tengas como máximo varios cientos de miles de palabras.
  • La protección de datos sensibles genera detectores de diccionarios personalizados grandes con listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa detectores de diccionarios personalizados grandes cuando tengas listas extensas de palabras o frases de hasta decenas de millones.
  • Los detectores de expresiones regulares (regex) permiten que la protección de datos sensibles detecte coincidencias basadas en un patrón de expresión regular.
  • Los detectores de Infotipo subrogados detectan el resultado de la transformación de desidentificación de la protección de datos sensibles CryptoReplaceFfxFpeConfig. Este detector de Infotipo personalizado solo se usa con el método content:reidentify para revertir la desidentificación mediante la encriptación de preservación de formato (FPE) en modo FFX. Por este motivo, los subrogados no se describen detalladamente en estos temas. Para obtener más información sobre cómo y cuándo usar los detectores de Infotipo personalizados subrogados, consulta seudonimización.

Además, la protección de datos sensibles incluye el concepto de reglas de inspección, que te permiten ajustar los resultados del análisis mediante las siguientes opciones:

  • Las reglas de exclusión te permiten excluir los resultados falsos o no deseados si agregas reglas a un detector de Infotipo integrado o personalizado.
  • Las reglas de palabra clave te permiten aumentar la cantidad o precisión de los resultados que se muestran si agregas reglas a un detector de Infotipo integrado o personalizado.

Si quieres obtener más información sobre los detectores de Infotipos personalizados, consulta la página de conceptos de Infotipos y detectores de Infotipos. Para ver varios ejemplos que puedes usar o modificar según tus necesidades, consulta Ejemplos de detectores de Infotipos personalizados. En el resto de este tema, se describe cómo usar la protección de datos sensibles para crear tus propios detectores de Infotipo personalizados.

Dónde usar los detectores de Infotipo personalizados

Los detectores de Infotipos personalizados se definen en el objeto CustomInfoType. Debes especificar un CustomInfoType en el objeto InspectConfig cuando configuras lo siguiente:

Descripción general de la API

El objeto CustomInfoType te permite crear un detector de Infotipos personalizado para contenido nuevo o ajustar los resultados que muestran los detectores de Infotipos predefinidos.

El objeto CustomInfoType consta de los siguientes campos, que se establecen como se describe:

  • "infotype": Es el nombre del detector de Infotipos personalizado, contenido en un objeto InfoType.
  • "likelihood": Es el valor Likelihood predeterminado que se mostrará para este detector de Infotipos personalizado. Puedes especificar valores Likelihood alternativos en "detectionRules", que reemplazarán esta Likelihood base si el resultado cumple con los criterios especificados por la regla. Si no incluyes el campo "likelihood", el detector de Infotipos personalizado será VERY_LIKELY de forma predeterminada. Para obtener más información sobre la probabilidad, consulta la página del concepto Probabilidad.
  • "detectionRules": Es un conjunto de objetos DetectionRule para aplicar de manera adicional a todos los resultados de este detector de Infotipos personalizado. Aquí es donde se especifican las reglas de palabra clave, como objetos HotwordRule. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetos SurrogateType.
  • "sensitivityScore": Es el valor SensitivityScore que se mostrará para este detector de Infotipo personalizado. Si no incluyes el campo "sensitivityScore", el detector de Infotipo personalizado será VERY_LIKELY de forma predeterminada.

    Las puntuaciones de sensibilidad se usan en los perfiles de datos. Cuando generas perfiles de tus datos, la protección de datos sensibles usa las puntuaciones de sensibilidad de los Infotipos para calcular el nivel de sensibilidad.

  • Uno de los siguientes campos, según el tipo de detector de Infotipo personalizados que creas:

    • "dictionary": Es un objeto Dictionary que contiene una lista de palabras o frases para buscar.
    • "regex": Es un objeto Regex que contiene un patrón único que define la expresión regular.
    • "surrogateType": Es un objeto SurrogateType; si está presente, indica que el detector de Infotipos personalizado es un subrogado. Para obtener más información sobre cómo usar los detectores de Infotipos personalizados subrogados, consulta Seudonimización.
    • "storedType": Es una referencia a un objeto StoredInfoType existente. Este campo es obligatorio cuando se crea un detector de diccionario personalizado grande. Aunque puedes crear detectores de diccionarios regulares o detectores de expresiones regulares mediante la definición de este campo, es más fácil crearlos mediante la definición del campo dictionary o el campo regex, respectivamente.

Próximos pasos

Obtén más información sobre cómo crear un Infotipo personalizado a partir de los siguientes temas: