Rilevamento di campi derivati e firme
La funzionalità dei campi derivati dell'anteprima pubblica consente ai clienti di Document AI di configurare un campo da compilare tramite inferenza o generazione intelligente in base al contesto del documento, anziché all'estrazione diretta del testo.
Questa release aggiunge anche un'altra funzionalità per rilevare la presenza di firme nei documenti. Puoi utilizzare il nuovo tipo di entità signature
per specificare uno schema per queste entità. Le entità della firma vengono derivate utilizzando gli indizi visivi del documento.
Campi derivati nell'estrattore personalizzato
L'estrattore personalizzato supporta i campi derivati nei seguenti modelli:
pretrained-foundation-model-v1.4-2025-02-05
come disponibilità generale (GA)pretrained-foundation-model-v1.5-2025-05-05
come anteprimapretrained-foundation-model-v1.5-pro-2025-06-20
come anteprima
Puoi attivare queste funzionalità nell'interfaccia utente della console quando crei o modifichi le etichette nello schema del documento.
I campi derivati sono una funzionalità potente che consente di estrarre informazioni che non sono scritte esplicitamente in un documento. In questo modo puoi configurare un campo da compilare tramite inferenza o generazione intelligente in base al contesto generale del documento. Questa funzionalità va oltre l'estrazione di testo rudimentale e supporta casi d'uso avanzati, ad esempio:
- Deducendo il paese da un indirizzo.
- Conteggio del numero totale di elementi in una tabella.
- Rilevare se una carta d'identità è una "Real ID".
Esempio di creazione dello schema
Ecco un esempio di creazione di uno schema per i campi derivati per questi casi d'uso e l'output previsto, utilizzando una patente di guida statunitense.
Seleziona il metodo
Derived
quando crei un elemento dello schema.Aggiungi etichette descrittive per migliorare il rendimento.
I campi derivati, come le firme, non richiedono l'impostazione di rettangoli di selezione durante l'etichettatura dei documenti. In Valore, seleziona Rilevato.
Per i campi derivati diversi dalle firme, puoi inserire qualsiasi Valore come parte dell'etichettatura per definire i possibili output.
L'output previsto sarà simile a questo, con la presenza di una firma restituita come"Rilevata " o "" e i campi derivati restituiti come testo come richiesto dalle descrizioni delle etichette.
Panoramica di estrazione e derivazione
Quando definisci un'entità nello schema del processore, puoi scegliere un metodo per il modo in cui viene compilato il relativo valore.
Estrai:questo è il metodo predefinito. Funziona quando il valore dell'entità deve essere estratto direttamente dal testo del documento. Il sistema identifica il testo e compila campi come
textAnchor
epageAnchor
per mostrare la sua posizione.Derivato:questo metodo viene utilizzato quando il valore dell'entità deve essere dedotto dal contenuto del documento. Poiché il valore non è presente direttamente nel testo, i campi
textAnchor
epageAnchor
non vengono compilati.
Esempio di caso d'uso: trovare un codice valuta
Supponiamo che tu debba identificare il codice valuta (ad esempio USD, CAD, EUR) per le transazioni nei tuoi documenti.
Quando utilizzare
Extract
: se i documenti contengono costantemente simboli o codici di valuta non ambigui, come "USD" o "€", utilizza il metodoExtract
per trovare ed estrarre il testo esatto.Quando utilizzare
Derived
: se un documento utilizza un simbolo ambiguo come "$" (che potrebbe riferirsi a USD, CAD, AUD e così via) o non ha alcun simbolo, utilizza il metodoDerived
. Il modello analizza il contesto del documento, ad esempio un indirizzo di fatturazione o la sede dell'azienda, per dedurre il codice valuta ISO 4217 corretto.
Best practice per la configurazione
Per ottenere i migliori risultati con i campi derivati, ti consigliamo vivamente di
scrivere un description
chiaro e didattico per la proprietà nello schema
durante l'etichettatura. Ciò aiuta a guidare il modello
nel suo compito di derivazione.
Nell'esempio di codice valuta, puoi creare un campo con il nome
currency_code
e fornire la seguente descrizione: "Trova il codice valuta ISO 4217
dei valori degli importi nel documento, utilizzando indicatori contestuali
presenti nel documento, come simboli di valuta e indirizzi".
Limitazioni
I campi derivati vengono generati in base alle pagine. Ciò significa che i casi d'uso che richiedono informazioni provenienti da più pagine non sono completamente supportati. Ad esempio, se configuri un campo derivato per riassumere un documento, viene generato un riepilogo separato per ogni pagina individuale anziché un riepilogo coeso per l'intero documento. Questa limitazione si applica a qualsiasi campo in cui il valore deve essere derivato utilizzando informazioni cross-page.
Rilevamento della firma nell'estrattore personalizzato
L'estrattore personalizzato di Document AI supporta il rilevamento delle firme nei modelli di estrattore personalizzati pretrained-foundation-model-v1.4-2025-02-05
e pretrained-foundation-model-v1.5-2025-05-05
. Puoi attivare questa funzionalità nell'interfaccia utente della console quando crei o modifichi le etichette nello schema del documento.
Il rilevamento della firma è una funzionalità che ti consente di determinare se una firma è presente nei tuoi documenti. Questa funzionalità verifica l'esistenza di una firma analizzando gli indizi visivi anziché estrarre il testo.
Come funziona il rilevamento della firma
Per attivare questa funzionalità, è disponibile un tipo di dati signature
quando
definisci lo schema del processore. Il comportamento del processore dipende dal rilevamento o meno di una firma nel documento.
Se viene trovata una firma, l'estrattore restituisce un'entità di firma nella risposta.
Per un campo denominato has_signed
, l'oggetto risposta ha la seguente struttura:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Se non viene trovata una firma, l'entità non viene restituita nella risposta del processore.
Configurare e impostare i requisiti chiave
Per configurare il rilevamento della firma:
- Definisci lo schema:nello schema del processore, aggiungi una nuova entità per la firma che vuoi rilevare.
- Imposta il tipo di dati:seleziona Firma come tipo di dati per questa nuova entità.
- Imposta il metodo su Derivato:le entità con il tipo di dati
signature
possono utilizzare solo il metodoDerived
. Poiché il modello deduce la presenza della firma visivamente, non estrae un valore di testo. Pertanto, i campi cometextAnchor
epageAnchor
non vengono compilati per le entità di firma.
Caso d'uso di esempio
Immagina di elaborare contratti e di dover verificare che siano stati firmati.
Puoi creare un campo dello schema denominato is_contract_signed
e impostare il relativo tipo di dati su
signature
. Quando elabori un contratto firmato, la risposta include un'entità is_contract_signed
, che conferma la presenza della firma. Se non è presente alcuna firma, questa entità non è presente nella risposta. In questo modo puoi segnalare rapidamente
i documenti non firmati per la revisione.
Passaggi successivi
Scopri di più sull'upgrade di un processore specializzato.