Detección de campos derivados y firmas
La función de campos derivados de la vista previa pública permite a los clientes de Document AI configurar un campo para que se rellene mediante inferencias o generaciones inteligentes basadas en el contexto del documento, en lugar de mediante la extracción directa de texto.
En esta versión también se ha añadido otra función para detectar la presencia de firmas en documentos. Puedes usar el nuevo tipo de entidad signature
para especificar un esquema para esas entidades. Las entidades de firma se derivan mediante señales visuales del documento.
Campos derivados en el extractor personalizado
El extractor personalizado admite campos derivados en los siguientes modelos:
pretrained-foundation-model-v1.4-2025-02-05
como disponibilidad general (GA)pretrained-foundation-model-v1.5-2025-05-05
como vista previapretrained-foundation-model-v1.5-pro-2025-06-20
como vista previa
Puedes habilitar estas funciones en la interfaz de usuario de la consola al crear o editar etiquetas en el esquema de tu documento.
Campos derivados es una función potente que te permite extraer información que no está escrita explícitamente en un documento. Esto le permite configurar un campo para que se rellene mediante inferencias o generaciones inteligentes basadas en el contexto general del documento. Esto va más allá de la extracción de texto rudimentaria y admite casos prácticos avanzados, como los siguientes:
- Deducir el país a partir de una dirección.
- Contar el número total de elementos de una tabla.
- Detectar si un documento de identificación es un "Real ID".
Ejemplo de creación de un esquema
A continuación, se muestra un ejemplo de cómo crear un esquema para campos derivados en estos casos prácticos y el resultado esperado, usando un permiso de conducir de EE. UU..
Seleccione el método
Derived
al crear un elemento de esquema.Añade etiquetas descriptivas para mejorar el rendimiento.
Los campos derivados, como las firmas, no requieren que se definan cuadros delimitadores al etiquetar documentos. En Valor, selecciona Detectado.
En el caso de los campos derivados que no sean firmas, puedes introducir cualquier Valor como parte del etiquetado para definir las posibles salidas.
El resultado esperado será similar a este, con la presencia de una firma devuelta como "Detected" o "", y los campos derivados devueltos como texto, tal como se solicita en las descripciones de las etiquetas.
Diferencias entre los campos extraídos y los derivados
Cuando defines una entidad en el esquema de tu procesador, puedes elegir un método para rellenar su valor.
Extraer: es el método predeterminado. Funciona cuando el valor de la entidad debe extraerse directamente del texto del documento. El sistema identifica el texto y rellena campos como
textAnchor
ypageAnchor
para mostrar su ubicación.Derivado: este método se usa cuando el valor de la entidad se debe inferir del contenido del documento. Como el valor no está presente directamente en el texto, los campos
textAnchor
ypageAnchor
no se rellenan.
Ejemplo de caso práctico: buscar un código de moneda
Supongamos que necesitas identificar el código de moneda (por ejemplo, USD, CAD o EUR) de las transacciones de tus documentos.
Cuándo usar
Extract
: si los documentos contienen de forma sistemática símbolos o códigos de moneda inequívocos, como "USD" o "€", usa el métodoExtract
para buscar y extraer ese texto exacto.Cuándo usar
Derived
: si un documento usa un símbolo ambiguo, como "$" (que podría referirse a USD, CAD, AUD, etc.) o no tiene ningún símbolo, usa el métodoDerived
. El modelo analiza el contexto del documento (por ejemplo, la dirección de facturación o la ubicación de la empresa) para inferir el código de moneda ISO 4217 correcto.
Prácticas recomendadas de configuración
Para obtener los mejores resultados con los campos derivados, te recomendamos que escribas una description
clara e instructiva para la propiedad de tu esquema durante el etiquetado. Esto ayuda a guiar al modelo en su tarea de derivación.
En el ejemplo de código de moneda, puedes crear un campo con el nombre currency_code
y proporcionar la siguiente descripción: "Busca el código ISO 4217 de los valores de importe del documento. Para ello, usa las señales contextuales presentes en el documento, como los símbolos de moneda y las direcciones".
Limitaciones
Los campos derivados se generan por página. Esto significa que los casos prácticos que requieren información de varias páginas no se admiten por completo. Por ejemplo, si configura un campo derivado para resumir un documento, se genera un resumen independiente para cada página en lugar de un resumen coherente de todo el documento. Esta limitación se aplica a cualquier campo en el que el valor se deba obtener mediante información de varias páginas.
Detección de firmas en extractores personalizados
El extractor personalizado de Document AI admite la detección de firmas en modelos de extractores personalizados pretrained-foundation-model-v1.4-2025-02-05
y pretrained-foundation-model-v1.5-2025-05-05
. Puedes habilitar esta función en la interfaz de usuario de la consola al crear o editar etiquetas en el esquema de tu documento.
Detección de firmas es una función que te permite determinar si hay una firma en tus documentos. Esta función verifica que existe una firma analizando las señales visuales en lugar de extraer texto.
Cómo funciona la detección de firmas
Para habilitar esta función, hay disponible un tipo de datos signature
al definir el esquema del procesador. El comportamiento del procesador depende de si se detecta una firma en el documento.
Si se encuentra una firma, el extractor devuelve una entidad de firma en su respuesta.
En el caso de un campo llamado has_signed
, el objeto de respuesta tiene la siguiente estructura:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Si no se encuentra ninguna firma, la entidad no se devuelve en la respuesta del procesador.
Configurar y definir requisitos clave
Para configurar la detección de firmas, sigue estos pasos:
- Define el esquema: en el esquema del procesador, añade una nueva entidad para la firma que quieras detectar.
- Definir el tipo de datos: selecciona Firma como tipo de datos de esta nueva entidad.
- Define el método como derivado: las entidades con el tipo de datos
signature
solo pueden usar el métodoDerived
. Como el modelo infiere la presencia de la firma visualmente, no extrae un valor de texto. Por lo tanto, los campostextAnchor
ypageAnchor
no se rellenan en las entidades de firma.
Caso práctico de ejemplo
Imagina que estás procesando contratos y necesitas verificar que se han firmado.
Puedes crear un campo de esquema llamado is_contract_signed
y definir su tipo de datos como signature
. Cuando procesas un contrato firmado, la respuesta incluye una entidad is_contract_signed
, que confirma que se ha firmado. Si no hay ninguna firma, esta entidad no aparecerá en la respuesta. De esta forma, podrás marcar rápidamente los documentos sin firmar para que se revisen.
Siguientes pasos
Consulta información sobre cómo mejorar un procesador especializado.