Cloud Data Loss Prevention (Cloud DLP) ahora forma parte de Protección de Datos Sensibles. El nombre de la API sigue siendo el mismo: API Cloud Data Loss Prevention (API DLP). Para obtener información sobre los servicios que componen Protección de Datos Sensibles, consulta el artículo Información general sobre Protección de Datos Sensibles.
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
Protección de Datos Sensibles contiene muchos detectores de infoType integrados, pero también puedes crear los tuyos. Puedes personalizar el comportamiento de detección definiendo tus propios detectores de infoType personalizados para que Protección de Datos Sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Estos son los tipos de detectores de infoType personalizados:
Los detectores de diccionario personalizado normales son listas sencillas de palabras y frases que Sensitive Data Protection busca. Usa detectores de diccionario personalizado normales cuando tengas como máximo varios cientos de miles de palabras.
Sensitive Data Protection genera detectores de diccionarios personalizados grandes a partir de listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa detectores de diccionarios personalizados grandes cuando tengas una lista extensa de palabras o frases (hasta decenas de millones).
Los detectores de expresiones regulares (regex) permiten a Protección de datos sensibles detectar coincidencias basadas en un patrón de expresión regular.
Los detectores de infoType sustituto detectan la salida de la transformación de desidentificación de Protección de Datos Sensibles
CryptoReplaceFfxFpeConfig.
Este detector de infoType personalizado solo se usa con el método content:reidentify para revertir la desidentificación mediante el encriptado con preservación de formato (FPE) en el modo FFX. Por este motivo, los sustitutos no se describen en detalle en estos temas. Para obtener más información sobre cómo y cuándo usar detectores de infoType personalizados subrogados, consulta Pseudonimización.
Además, Protección de Datos Sensibles incluye el concepto de reglas de inspección, que te permiten ajustar los resultados de los análisis mediante lo siguiente:
Las reglas de exclusión le permiten excluir resultados falsos o no deseados añadiendo reglas a un detector de infoType integrado o personalizado.
Las reglas de palabras de activación te permiten aumentar la cantidad o la precisión de los resultados que se devuelven añadiendo reglas a un detector de infoTypes integrado o personalizado.
Para obtener más información sobre los detectores personalizados de InfoType, consulta la página de conceptos InfoTypes y detectores de infoType. Para ver varios ejemplos que puedes usar o modificar según te convenga, consulta Ejemplos de detectores de infoType personalizados. En el resto de este tema se describe cómo usar Protección de Datos Sensibles para crear tus propios detectores de InfoType personalizados.
Dónde usar detectores de infoType personalizados
Los detectores de infoType personalizados se definen en el objeto
CustomInfoType. Especifica un CustomInfoType en el objeto InspectConfig cuando configuras lo siguiente:
Volver a identificar contenido que se ha desidentificado con FPE en modo FFX
mediante projects.content.reidentify.
Este caso se aplica específicamente a los detectores de infoType personalizados sustitutos.
Información general sobre la API
El objeto
CustomInfoType
te permite crear un detector de infoType personalizado para contenido nuevo o
ajustar los resultados devueltos por los detectores de infoType predefinidos.
El objeto CustomInfoType se compone de los siguientes campos, que se definen como se describe:
"infotype": nombre del detector de infoType personalizado, contenido en un objeto InfoType.
"likelihood": valor predeterminado de Likelihood que se devuelve para este detector de infoType personalizado. Puedes especificar valores Likelihood alternativos en "detectionRules" que sustituirán a este valor base Likelihood si el resultado cumple los criterios especificados en la regla. Si no incluyes el campo "likelihood", el detector de infoType personalizado se asignará de forma predeterminada a VERY_LIKELY. Para obtener más información sobre la probabilidad, consulta la página de conceptos sobre la probabilidad.
"detectionRules": conjunto de objetos DetectionRule que se aplicarán adicionalmente a todos los resultados de este detector de infoType personalizado. Aquí es donde se especifican las reglas de palabras de activación como objetos HotwordRule. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetos SurrogateType.
"sensitivityScore": el valor de SensitivityScore que se devolverá para este detector de infoType personalizado. Si no incluye el campo "sensitivityScore", el detector de infoType personalizado tendrá el valor predeterminado VERY_LIKELY.
Las puntuaciones de sensibilidad se usan en los perfiles de datos. Al crear perfiles de tus datos, Protección de Datos Sensibles usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.
Uno de los siguientes campos, en función del tipo de detector de InfoType personalizado que estés creando:
"dictionary": objeto Dictionary que contiene una lista de palabras o frases que se deben buscar.
"regex": objeto Regex que contiene un único patrón que define la expresión regular.
"surrogateType": un objeto SurrogateType que, si está presente, indica que el detector de infoType personalizado es un sustituto. Para obtener más información sobre cómo usar detectores de infoTypes personalizados subrogados, consulte Pseudonimización.
"storedType": referencia a un objeto StoredInfoType. Este campo es obligatorio al crear un detector de diccionario personalizado grande. Aunque puedes crear detectores de diccionario normales o detectores de expresiones regulares definiendo este campo, es más sencillo crearlos definiendo el campo dictionary o el campo regex, respectivamente.
Pasos siguientes
Consulta más información sobre cómo crear infoTypes personalizados en los siguientes temas:
Crear un detector de diccionario personalizado grande:
Consulta cómo buscar coincidencias en una lista muy grande de palabras y frases.
Los detectores de infoType personalizados almacenados pueden coincidir con hasta decenas de millones de palabras.
Personalizar la probabilidad de coincidencia:
consulta cómo usar reglas de detección y palabras clave activadoras para personalizar los valores de probabilidad que se asignan a las coincidencias de detectores personalizados.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-11 (UTC)."],[],[],null,["# Custom infoType detectors\n\nSensitive Data Protection contains many built-in [infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes), but you can also create your own. You can\ncustomize detection behavior by defining your own *custom infoType detectors*,\nso that Sensitive Data Protection will inspect or de-identify sensitive data that\nmatches patterns that you specify. The following are the types of custom\ninfoType detectors:\n\n- *Regular custom dictionary detectors* are simple word and phrase lists that Sensitive Data Protection matches on. Use regular custom dictionary detectors when you have at most several hundred thousand words.\n- *Large custom dictionary detectors* are generated by Sensitive Data Protection using large lists of words or phrases stored in either Cloud Storage or BigQuery. Use large custom dictionary detectors when you have a large list of words or phrases---up to tens of millions.\n- *Regular expression (regex) detectors* enable Sensitive Data Protection to detect matches based on a regular expression pattern.\n- *Surrogate infoType detectors* detect output from Sensitive Data Protection de-identification transformation [`CryptoReplaceFfxFpeConfig`](/sensitive-data-protection/docs/reference/rest/v2/organizations.deidentifyTemplates#cryptoreplaceffxfpeconfig). This custom infoType detector is only used with the [`content:reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify) method to reverse de-identification using format-preserving encryption (FPE) in FFX mode. For this reason, surrogates are not extensively described in these topics. For more information about how and when to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n\nIn addition, Sensitive Data Protection includes the concept of *inspection rules*,\nwhich enable you to fine-tune scan results using the following:\n\n- *Exclusion rules* enable you to exclude false or unwanted findings by adding rules to a built-in or custom infoType detector.\n- *Hotword rules* enable you to increase the quantity or accuracy of findings returned by adding rules to a built-in or custom infoType detector.\n\nTo learn more about custom infoType detectors, see the [InfoTypes and infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes#custom) concept page. For several examples that\nyou can use or alter as you see fit, see [Examples of custom infoType\ndetectors](/sensitive-data-protection/docs/examples-custom-infotypes). The rest of this topic describes how to\nuse Sensitive Data Protection to create your own custom infoType detectors.\n\nWhere to use custom infoType detectors\n--------------------------------------\n\nCustom infoType detectors are defined in the\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject. You specify a `CustomInfoType` in the\n[`InspectConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig)\nobject when configuring the following:\n\n- Inspection using [`projects.content.inspect`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/inspect).\n- Inspection jobs inside [`InspectJobConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectJobConfig).\n- Inspection templates inside [`InspectTemplate`](/sensitive-data-protection/docs/reference/rest/v2/organizations.inspectTemplates#InspectTemplate).\n- De-identification using [`projects.content.deidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/deidentify).\n- De-identification templates inside [`DeidentifyTemplate`](/sensitive-data-protection/docs/reference/rest/v2/projects.deidentifyTemplates#resource-deidentifytemplate).\n- Re-identification of content that has been de-identified with FPE in FFX mode using [`projects.content.reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify). This scenario is specific to surrogate custom infoType detectors.\n\nAPI overview\n------------\n\nThe\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject allows you to create a custom infoType detector for new content or to\nfine-tune the results returned by pre-defined infoType detectors.\n\nThe `CustomInfoType` object is comprised of the following fields, which are set\nas described:\n\n- `\"infotype\"`: The name of the custom infoType detector, contained in an [`InfoType`](/sensitive-data-protection/docs/reference/rest/v2/InfoType) object.\n- `\"likelihood\"`: The default [`Likelihood`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#Likelihood) value to return for this custom infoType detector. You can specify alternate `Likelihood` values in `\"detectionRules\"` that will supersede this base `Likelihood` if the finding meets the criteria specified by the rule. If you don't include the `\"likelihood\"` field, the custom infoType detector defaults to `VERY_LIKELY`. For more information about likelihood, see the [Likelihood](/sensitive-data-protection/docs/likelihood) concept page.\n- `\"detectionRules\"`: A set of [`DetectionRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#DetectionRule) objects to additionally apply to all findings of this custom infoType detector. This is where you specify hotword rules, as [`HotwordRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#HotwordRule) objects. Rules are applied in the order in which they are specified. This field does not apply to `SurrogateType` objects.\n- `\"sensitivityScore\"`: The\n [`SensitivityScore`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType.FIELDS.sensitivity_score)\n value to return for this custom infoType detector. If you don't include the\n `\"sensitivityScore\"` field, the custom infoType detector defaults to\n `VERY_LIKELY`.\n\n\n Sensitivity scores are used in [data profiles](/sensitive-data-protection/docs/data-profiles). When\n profiling your data, Sensitive Data Protection uses the sensitivity scores of the infoTypes to\n [calculate the sensitivity level](/sensitive-data-protection/docs/sensitivity-risk-calculation).\n\n\n- One of the following fields, depending on the kind of custom infoType\n detector you're creating:\n\n - `\"dictionary\"`: A [`Dictionary`](/sensitive-data-protection/docs/reference/rest/v2/Dictionary) object, which contains a list of words or phrases to search for.\n - `\"regex\"`: A [`Regex`](/sensitive-data-protection/docs/reference/rest/v2/Regex) object, which contains a single pattern defining the regular expression.\n - `\"surrogateType\"`: A [`SurrogateType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#SurrogateType) object, if present, indicates that the custom infoType detector is a surrogate. For more information about how to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n - `\"storedType\"`: A reference to an existing [`StoredInfoType`](/sensitive-data-protection/docs/reference/rest/v2/projects.locations.storedInfoTypes) object. This field is required when creating a large custom dictionary detector. Although you can create regular dictionary detectors or regular expression detectors by defining this field, it's simpler to create those by defining the `dictionary` field or `regex` field respectively.\n\nNext steps\n----------\n\nLearn more about creating custom infoTypes from the following topics:\n\n- [Creating a regular custom dictionary detector](/sensitive-data-protection/docs/creating-custom-infotypes-dictionary): Learn how to create a custom infoType detector to match findings on a list of words and phrases.\n- [Creating a large custom dictionary detector](/sensitive-data-protection/docs/creating-stored-infotypes): Learn how to match findings on a very large list of words and phrases. Stored custom infoType detectors can match on up to tens of millions of words.\n- [Creating a custom regex detector](/sensitive-data-protection/docs/creating-custom-infotypes-regex): Learn how to create a custom infoType detector to match findings on a regular expression.\n- [Modifying infoType detectors to refine scan results](/sensitive-data-protection/docs/creating-custom-infotypes-rules): Learn how to create modifiers for both built-in and custom infoType detectors that can fine-tune scan results.\n- [Customizing match likelihood](/sensitive-data-protection/docs/creating-custom-infotypes-likelihood): Learn how to use detection rules and hotwords to customize the likelihood values that are assigned to custom detector matches.\n- [Examples of custom infoType detectors](/sensitive-data-protection/docs/examples-custom-infotypes): Several example JSON custom infoType detector definitions that you can use or alter as you see fit."]]