Valutare il rendimento
Document AI genera metriche di valutazione, come precisione e identificazione, per aiutarti a determinare le prestazioni predittive dei tuoi processori.
Queste metriche di valutazione vengono generate confrontando le entità restituite dal processore (le previsioni) con le annotazioni nei documenti di test. Se il tuo processore non ha un set di test, devi prima creare un set di dati ed etichettare i documenti di test.
Eseguire una valutazione
Una valutazione viene eseguita automaticamente ogni volta che addestri o esegui l'upgrade di una versione del processore.
Puoi anche eseguire manualmente una valutazione. Questo passaggio è necessario per generare metriche aggiornate dopo aver modificato il set di test o se stai valutando una versione del processore preaddestrata.
UI web
Nella console Google Cloud, vai alla pagina Processori e scegli il tuo processore.
Nella scheda Valuta e testa, seleziona la versione del processore da valutare e poi fai clic su Esegui nuova valutazione.
Al termine, la pagina contiene le metriche di valutazione per tutte le etichette e per ogni singola etichetta.
Python
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Document AI Python.
Per autenticarti a Document AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Ottenere i risultati di una valutazione
UI web
Nella console Google Cloud, vai alla pagina Processori e scegli il tuo processore.
Nella scheda Valuta e verifica, seleziona la versione del processore per visualizzare la valutazione.
Al termine, la pagina contiene le metriche di valutazione per tutte le etichette e per ogni singola etichetta.
Python
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Document AI Python.
Per autenticarti a Document AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Elenco di tutte le valutazioni per una versione del processore
Python
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Document AI Python.
Per autenticarti a Document AI, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Metriche di valutazione per tutte le etichette
Le metriche per Tutte le etichette vengono calcolate in base al numero di veri positivi, falsi positivi e falsi negativi nel set di dati per tutte le etichette e, pertanto, vengono ponderate in base al numero di volte in cui ogni etichetta viene visualizzata nel set di dati. Per le definizioni di questi termini, consulta Metriche di valutazione per le singole etichette.
Precisione:la proporzione di previsioni che corrispondono alle annotazioni nel set di test. Definito come
True Positives / (True Positives + False Positives)
Richiamo:la proporzione di annotazioni nel set di test che sono previste correttamente. Definito come
True Positives / (True Positives + False Negatives)
Punteggio F1:la media armonica di precisione e richiamo, che combina precisione e richiamo in un'unica metrica, assegnando a entrambe lo stesso peso. Definito come
2 * (Precision * Recall) / (Precision + Recall)
Metriche di valutazione per le singole etichette
Veri positivi:le entità previste che corrispondono a un'annotazione nel documento di test. Per ulteriori informazioni, consulta comportamento di corrispondenza.
Falsi positivi:le entità previste che non corrispondono a nessuna annotazione nel documento di test.
Falsi negativi:le annotazioni nel documento di test che non corrispondono a nessuna delle entità previste.
- Falsi negativi (al di sotto della soglia): le annotazioni nel documento di test che avrebbero corrisposto a un'entità prevista, ma il valore di affidabilità dell'entità prevista è inferiore alla soglia di confidenza specificata.
Soglia di confidenza
La logica di valutazione ignora le previsioni con un livello di confidenza inferiore alla soglia di confidenza specificata, anche se la previsione è corretta. Document AI fornisce un elenco di falsi negativi (sotto soglia), ovvero le annotazioni che avrebbero una corrispondenza se la soglia di affidabilità fosse impostata su un valore inferiore.
Document AI calcola automaticamente la soglia ottimale, che massimizza il punteggio F1 e, per impostazione predefinita, imposta la soglia di confidenza su questo valore ottimale.
Puoi scegliere la soglia di confidenza che preferisci spostando la barra del cursore. In generale, una soglia di confidenza più elevata comporta:
- una maggiore precisione, perché le previsioni hanno maggiori probabilità di essere corrette.
- un richiamo inferiore, perché ci sono meno previsioni.
Entità tabulari
Le metriche per un'etichetta principale non vengono calcolate facendo direttamente la media delle metriche figlio, ma applicando la soglia di confidenza dell'etichetta principale a tutte le sue etichette figlio e aggregando i risultati.
La soglia ottimale per l'elemento principale è il valore della soglia di confidenza che, se applicato a tutti gli elementi secondari, genera il punteggio F1 massimo per l'elemento principale.
Comportamento di corrispondenza
Un'entità prevista corrisponde a un'annotazione se:
- il tipo di entità prevista
(
entity.type
) corrisponde al nome dell'etichetta dell'annotazione - il valore dell'entità prevista
(
entity.mention_text
oentity.normalized_value.text
) corrisponde al valore del testo dell'annotazione, in base alla corrispondenza approssimativa se è attivata.
Tieni presente che per la corrispondenza vengono utilizzati solo il tipo e il valore del testo. Altre informazioni, come ancore di testo e caselle delimitanti (ad eccezione delle entità tabulari descritte di seguito), non vengono utilizzate.
Etichette con una singola occorrenza e con più occorrenze
Le etichette con una sola occorrenza hanno un valore per documento (ad es. ID fattura), anche se questo valore viene annotato più volte nello stesso documento (ad es. l'ID fattura viene visualizzato in ogni pagina dello stesso documento). Anche se le più annotazioni hanno un testo diverso, sono considerate uguali. In altre parole, se un'entità prevista corrisponde a una delle annotazioni, viene conteggiata come corrispondenza. Le annotazioni aggiuntive sono considerate menzioni duplicate e non contribuiscono ai conteggi di veri positivi, falsi positivi o falsi negativi.
Le etichette con più occorrenze possono avere più valori diversi. Pertanto, ogni entità e annotazione prevista viene considerata e associata separatamente. Se un documento contiene N annotazioni per un'etichetta con più occorrenze, possono esserci N corrispondenze con le entità previste. Ogni entità e annotazione prevista viene conteggiata in modo indipendente come vero positivo, falso positivo o falso negativo.
Corrispondenza parziale
Il pulsante di attivazione/disattivazione Corrispondenza approssimativa ti consente di applicare o meno alcune regole di corrispondenza per diminuire o aumentare il numero di corrispondenze.
Ad esempio, senza la corrispondenza approssimativa, la stringa ABC
non corrisponde a abc
a causa della maiuscola. Ma con la corrispondenza approssimativa, corrispondono.
Quando la corrispondenza approssimativa è attiva, le modifiche alle regole sono le seguenti:
Normalizzazione degli spazi vuoti: rimuove gli spazi vuoti iniziali e finali e comprime gli spazi vuoti intermedi consecutivi (incluse le nuove righe) in singoli spazi.
Rimozione di punteggiatura iniziale/finale:vengono rimossi i seguenti caratteri di punteggiatura iniziale/finale
!,.:;-"?|
.Corrispondenza senza distinzione tra maiuscole e minuscole:vengono convertiti tutti i caratteri in minuscolo.
Normalizzazione monetaria:per le etichette con il tipo di dati
money
, rimuovi i simboli di valuta iniziali e finali.
Entità tabulari
Le entità e le annotazioni principali non hanno valori di testo e vengono associate in base ai riquadri delimitatori combinati dei relativi elementi secondari. Se è presente un solo elemento principale previsto e uno annotato, vengono abbinati automaticamente, indipendentemente dalle caselle delimitanti.
Una volta trovati i corrispondenti per i genitori, i figli vengono associati come se fossero entità non tabulari. Se i genitori non corrispondono, Document AI non tenterà di abbinare i figli. Ciò significa che le entità figlie possono essere considerate scorrette, anche con gli stessi contenuti di testo, se le relative entità principali non corrispondono.
Le entità principali / secondarie sono una funzionalità di anteprima e sono supportate solo per le tabelle con un livello di nidificazione.
Esportare le metriche di valutazione
Nella console Google Cloud, vai alla pagina Processori e scegli il tuo processore.
Nella scheda Valuta e testa, fai clic su Scarica metriche per scaricare le metriche di valutazione come file JSON.