Questa pagina è stata tradotta dall'API Cloud Translation.

Elenco dei processori

Questa pagina contiene informazioni dettagliate su tutti i processori offerti da Document AI. Puoi visualizzare un elenco di tutti i processori per tipo di soluzione.

Tutti i processori Document AI rispettano i Termini per il trattamento e la sicurezza dei dati.

Per ulteriori dettagli, consulta la documentazione Gestione delle versioni del processore. Inoltre, si applicano limiti specifici per i processori, oltre alle quote e ai limiti complessivi del prodotto.

Digitalizzare il testo

Enterprise Document OCR (riconoscimento ottico dei caratteri)

Descrizione

Identifica ed estrai il testo in diversi tipi di documenti.

Questo processore ti consente di identificare ed estrarre testo, incluso il testo scritto a mano, dai documenti in più di 200 lingue. Il processore utilizza anche il machine learning per eseguire una valutazione della qualità di un documento in base alla leggibilità dei suoi contenuti.

Category Digitalizza

Funzioni OCR, analisi della qualità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API OCR_PROCESSOR

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Afrikaans	`af`	`Latn`
Albanese	`sq`	`Latn`
Arabo	`ar`	`Arab`
Armeno	`hy`	`Armn`
Bielorusso	`be`	`Cyrl`
Bengalese	`bn`	`Beng`
Bengali	`bn`	`Beng`
Bulgaro	`bg`	`Cyrl`
Catalano	`ca`	`Latn`
Cinese	`zh`	`Hani`
Croato	`hr`	`Latn`
Ceco	`cs`	`Latn`
Danese	`da`	`Latn`
Olandese	`nl`	`Latn`
Inglese	`en`	`Latn`
Estone	`et`	`Latn`
Filippino	`fil`	`Latn`
Finlandese	`fi`	`Latn`
Francese	`fr`	`Latn`
Tedesco	`de`	`Latn`
Greco	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Ebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungherese	`hu`	`Latn`
Islandese	`is`	`Latn`
Indonesiano	`id`	`Latn`
Italiano	`it`	`Latn`
Giapponese	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettone	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedone	`mk`	`Cyrl`
Malese	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalese	`ne`	`Deva`
Norvegese	`no`	`Latn`
Persiano	`fa`	`Arab`
Polacco	`pl`	`Latn`
Portoghese (Portogallo e Brasile)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Serbo	`sr`	`Cyrl`
Slovacco	`sk`	`Latn`
Sloveno	`sl`	`Latn`
Spagnolo	`es`	`Latn`
Svedese	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandese	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraino	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-ocr-v1.2-2022-11-10`	Stabile	Versione del modello bloccata v1.0: file, configurazioni e binari del modello di un'istantanea della versione bloccati in un'immagine container per un massimo di 18 mesi.
`pretrained-ocr-v2.0-2023-06-02`	Stabile	Modello pronto per la produzione specializzato per i casi d'uso dei documenti. Include l'accesso a tutti i componenti aggiuntivi OCR.
`pretrained-ocr-v2.1-2024-08-07`	Stabile	Le principali aree di miglioramento della versione 2.1 sono: migliore riconoscimento del testo stampato, rilevamento più preciso delle caselle di controllo e ordine di lettura più accurato.
`pretrained-ocr-v2.1.1-2025-01-31`	Candidato per la release	La versione 2.1.1 è simile alla versione 2.1 ed è disponibile in tutte le regioni, ad eccezione di: `US`, `EU` e `asia-southeast1`.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	500
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Ulteriori informazioni Enterprise Document OCR

Estrai entità dai documenti

Consulta Set di dati di esempio per set di dati etichettati e non etichettati di esempio da utilizzare per l'addestramento.

Estrattore personalizzato

Descrizione

Estrai i campi dai documenti utilizzando l'AI generativa o modelli personalizzati; perfeziona i modelli per estrarre con precisione i dati dai tuoi documenti.

Category Estrarre

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API CUSTOM_EXTRACTION_PROCESSOR

Note

Se utilizzi l'AI generativa per l'estrazione:
- È supportata ufficialmente solo la lingua inglese.
- La disponibilità per regione è in US, EU, northamerica-northeast1 e asia-southeast1.

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Afrikaans	`af`	`Latn`
Arabo	`ar`	`Arab`
Azero	`az`	`Latn`
Azero (cirillico)	`az-Cyrl`	`Cyrl`
Bielorusso	`be`	`Cyrl`
Bulgaro	`bg`	`Cyrl`
Bosniaco	`bs`	`Latn`
Catalano	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Ceco	`cs`	`Latn`
Gallese	`cy`	`Latn`
Danese	`da`	`Latn`
Tedesco	`de`	`Latn`
Greco	`el`	`Grek`
Inglese	`en`	`Latn`
Esperanto	`eo`	`Latn`
Spagnolo	`es`	`Latn`
Estone	`et`	`Latn`
Basco	`eu`	`Latn`
Persiano	`fa`	`Arab`
Finlandese	`fi`	`Latn`
Filippino	`fil`	`Latn`
Francese	`fr`	`Latn`
Irlandese	`ga`	`Latn`
Galiziano	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croato	`hr`	`Latn`
Creolo haitiano	`ht`	`Latn`
Ungherese	`hu`	`Latn`
Indonesiano	`id`	`Latn`
Islandese	`is`	`Latn`
Italiano	`it`	`Latn`
Ebraico	`iw`	`Hebr`
Giapponese	`ja`	`Jpan`
Giavanese	`jv`	`Latn`
Kazako	`kk`	`Cyrl`
Coreano	`ko`	`Kore`
Kirgizo	`ky`	`Cyrl`
Latino	`la`	`Latn`
Lituano	`lt`	`Latn`
Lettone	`lv`	`Latn`
Macedone	`mk`	`Cyrl`
Mongolo	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malese	`ms`	`Latn`
Maltese	`mt`	`Latn`
Nepalese	`ne`	`Deva`
Olandese	`nl`	`Latn`
Norvegese	`no`	`Latn`
Polacco	`pl`	`Latn`
Pashto	`ps`	`Arab`
Portoghese (Portogallo e Brasile)	`pt`	`Latn`
Rumeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Russo (ortografia petrina)	`ru-PETR1708`	`Cyrl`
Sanscrito	`sa`	`Deva`
Slovacco	`sk`	`Latn`
Sloveno	`sl`	`Latn`
Albanese	`sq`	`Latn`
Serbo	`sr`	`Cyrl`
Svedese	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraino	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Uzbeco	`uz`	`Latn`
Uzbeko (cirillico)	`uz-Cyrl`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`
Cinese semplificato	`zh-Hans`	`Hani`
Cinese tradizionale	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-foundation-model-v1.4-2025-02-05`	Stabile	Modello GA basato sul modello LLM Gemini 2.0 Flash. Include anche funzionalità OCR avanzate, come il rilevamento delle caselle di controllo.
`pretrained-foundation-model-v1.5-2025-05-05`	Stabile	Candidato pronto per la produzione basato sul modello LLM Gemini 2.5 Flash. Consigliato per chi vuole sperimentare modelli più recenti.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Stabile	Modello pronto per la produzione basato sul modello LLM Gemini 2.5 Pro. Supporta una quota massima di 30 pagine al minuto per le richieste di elaborazione online. Questo modello ha una qualità migliore rispetto alla versione 1.5 e potrebbe avere una latenza maggiore.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	200
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Tipi di dati normalizzati

Per saperne di più, consulta le pagine Arricchimento e normalizzazione e Creare un set di dati.

Elenco completo dei tipi di dati normalizzati

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Ulteriori informazioni Estrattore personalizzato

Analizzatore sintattico di moduli

Descrizione

Estrai coppie chiave-valore generali (entità e casella di controllo), tabelle ed entità generiche dai documenti, oltre al testo OCR.

Questo processore applica tecnologie di machine learning avanzate per estrarre coppie chiave-valore, caselle di controllo e tabelle da documenti in più di 200 lingue. Questo processore sfrutta anche modelli di deep learning per estrarre 11 entità generiche comuni in vari tipi di documenti.

Category Estrarre

Funzioni OCR, analisi sintattica dei moduli, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API FORM_PARSER_PROCESSOR

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Afrikaans	`af`	`Latn`
Albanese	`sq`	`Latn`
Arabo	`ar`	`Arab`
Bielorusso	`be`	`Cyrl`
Catalano	`ca`	`Latn`
Cinese	`zh`	`Hani`
Croato	`hr`	`Latn`
Ceco	`cs`	`Latn`
Danese	`da`	`Latn`
Olandese	`nl`	`Latn`
Inglese	`en`	`Latn`
Estone	`et`	`Latn`
Filippino	`fil`	`Latn`
Finlandese	`fi`	`Latn`
Francese	`fr`	`Latn`
Tedesco	`de`	`Latn`
Ebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungherese	`hu`	`Latn`
Islandese	`is`	`Latn`
Indonesiano	`id`	`Latn`
Italiano	`it`	`Latn`
Giapponese	`ja`	`Jpan`
Coreano	`ko`	`Kore`
Lettone	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedone	`mk`	`Cyrl`
Malese	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalese	`ne`	`Deva`
Norvegese	`no`	`Latn`
Persiano	`fa`	`Arab`
Polacco	`pl`	`Latn`
Portoghese (Portogallo e Brasile)	`pt`	`Latn`
Rumeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Serbo	`sr`	`Cyrl`
Slovacco	`sk`	`Latn`
Sloveno	`sl`	`Latn`
Spagnolo	`es`	`Latn`
Svedese	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraino	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versioni del processore

ID versione	Canale di rilascio	Campi aggiuntivi rilevati	Descrizione
`pretrained-form-parser-v1.0-2020-09-23`	Stabile	Nessuno	Versione precedente. Per una qualità ottimale e un set completo di funzionalità, utilizza il parser di moduli v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Stabile	Mostra campi `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versione consigliata. Supporta le entità generiche e include modelli di tabelle, coppie chiave-valore e caselle di controllo aggiornati, nonché più di 200 lingue.
`pretrained-form-parser-v2.1-2023-06-26`	Candidato per la release	Nessuno	Versione di anteprima pubblica. Stesso modello della v2.0 con l'estrazione nativa del testo dai file PDF digitali abilitata.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	100
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Ulteriori informazioni Analizzatore sintattico di moduli

Parser del layout

Descrizione

Estrae elementi dei contenuti dei documenti (testo, tabelle ed elenchi) e crea blocchi sensibili al contesto.

Il parser del layout estrae elementi dei contenuti dei documenti come testo, tabelle ed elenchi e crea blocchi sensibili al contesto che facilitano il recupero di informazioni nell'AI generativa e nelle applicazioni di rilevamento.

Category Estrarre

Funzioni Analisi del layout, chunking dei documenti

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API LAYOUT_PARSER_PROCESSOR

Note

Questo parser supporta i file PDF, HTML, DOCX, PPTX e XLSX/XLSM.

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Afrikaans	`af`	`Latn`
Albanese	`sq`	`Latn`
Arabo	`ar`	`Arab`
Armeno	`hy`	`Armn`
Bielorusso	`be`	`Cyrl`
Bengalese	`bn`	`Beng`
Bengali	`bn`	`Beng`
Bulgaro	`bg`	`Cyrl`
Catalano	`ca`	`Latn`
Cinese	`zh`	`Hani`
Croato	`hr`	`Latn`
Ceco	`cs`	`Latn`
Danese	`da`	`Latn`
Olandese	`nl`	`Latn`
Inglese	`en`	`Latn`
Estone	`et`	`Latn`
Filippino	`fil`	`Latn`
Finlandese	`fi`	`Latn`
Francese	`fr`	`Latn`
Tedesco	`de`	`Latn`
Greco	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Ebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungherese	`hu`	`Latn`
Islandese	`is`	`Latn`
Indonesiano	`id`	`Latn`
Italiano	`it`	`Latn`
Giapponese	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettone	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedone	`mk`	`Cyrl`
Malese	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalese	`ne`	`Deva`
Norvegese	`no`	`Latn`
Persiano	`fa`	`Arab`
Polacco	`pl`	`Latn`
Portoghese (Portogallo e Brasile)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Serbo	`sr`	`Cyrl`
Slovacco	`sk`	`Latn`
Sloveno	`sl`	`Latn`
Spagnolo	`es`	`Latn`
Svedese	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandese	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraino	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-layout-parser-v1.0-2024-06-03`	Stabile	Versione consigliata.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	500
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Ulteriori informazioni Parser del layout

Esplora i processori preaddestrati

Analizzatore estratto conto bancario

Descrizione

Estrai dati dagli estratti conto bancari, tra cui nome, conto, transazioni e così via.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API BANK_STATEMENT_PROCESSOR

Note

Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, il processore esegue l'estrazione delle entità sul primo documento supportato. Se il processore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-bankstatement-v1.0-2021-08-08`	Stabile
`pretrained-bankstatement-v1.1-2021-08-13`	Stabile
`pretrained-bankstatement-v2.0-2021-12-10`	Stabile
`pretrained-bankstatement-v3.0-2022-05-16`	Stabile	Questa versione presuppone che il file di input contenga un unico estratto conto bancario. A differenza della versione predefinita, questa versione non controlla la presenza di estratti conto bancari nel file di input e non restituisce un errore se non vengono trovati estratti conto bancari.
`pretrained-bankstatement-v4.0-2023-07-31`	Candidato per la release
`pretrained-bankstatement-v5.0-2023-12-06`	Candidato per la release

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	30
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti

bank_address
bank_name

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Istruzioni per l'etichettatura Apri in una nuova finestra.

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore W2

Descrizione

Estrai dati dal modulo W2, tra cui dipendente, datore di lavoro, salari e così via.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API FORM_W2_PROCESSOR

Note

Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, il processore esegue l'estrazione delle entità sul primo documento supportato. Se il processore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Moduli/versioni supportati

2020 (versioni standard e personalizzate)
2019 (versioni standard e personalizzate)
2018 (versioni standard e personalizzate)

Versioni del processore

ID versione	Canale di rilascio	Campi aggiuntivi rilevati	Descrizione
`pretrained-w2-v1.0-2020-10-01`	Stabile	Nessuno
`pretrained-w2-v1.1-2022-01-27`	Stabile	Nessuno
`pretrained-w2-v1.2-2022-01-28`	Stabile	Mostra campi `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Miglioramenti della qualità e supporto di nuovi campi; non include lo splitter.
`pretrained-w2-v2.0-2022-03-30`	Candidato per la release	Mostra campi `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Miglioramenti della qualità e supporto per i campi della casella 12 e previsioni granulari di `EmployeeName`, `EmployeeAddress` e `EmployerNameAndAddress`, che non fanno più parte dell'output e sono sostituiti da campi aggiuntivi.
`pretrained-w2-v2.1-2022-06-08`	Stabile	Mostra campi `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Simile alla versione `pretrained-w2-v2.0-2022-03-30`, con ulteriori miglioramenti della qualità e l'introduzione di un'altra entità `EmployeeName_Suffix`.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	15
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	15

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti

EmployerNameAndAddress
EIN

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore sintattico di passaporti statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API US_PASSPORT_PROCESSOR

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-us-passport-v1.0-2021-06-14`	Stabile

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	2
Numero massimo di pagine (richieste batch/offline/asincrone):	2
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	2

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

Date Of Birth
Expiration Date
Issue Date

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore sintattico delle utenze

Descrizione

Estrai testo e valori dalle bollette, tra cui nome del fornitore e importo dell'ultimo pagamento.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Limitato ^[*]

Digita API UTILITY_PROCESSOR

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-utility-v1.1-2021-04-09`	Stabile
`pretrained-utility-v1.2-2022-12-15`	Candidato per la release

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	10
Numero massimo di pagine (richieste batch/offline/asincrone):	200
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Istruzioni per l'etichettatura Apri in una nuova finestra.

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Parser di verifica dei documenti di identità

Descrizione

Prevedi la validità dei documenti di identità utilizzando più indicatori.

Il processore di verifica dei documenti di identità è progettato per aiutare a prevedere la validità dei documenti di identità con quattro indicatori diversi.

Attualmente, il processore restituisce informazioni dai seguenti indicatori:

Rilevamento fraud_signals_is_identity_document: prevede se un'immagine contiene un documento di identità riconosciuto.
Rilevamento di fraud_signals_suspicious_words: prevede se sono presenti parole non tipiche nei documenti di identità.
Rilevamento fraud_signals_image_manipulation: prevede se l'immagine è stata alterata o manomessa con uno strumento di modifica delle immagini.
Rilevamento fraud_signals_online_duplicate: prevede se l'immagine può essere trovata online (solo negli Stati Uniti).

Category Preaddestrati

Funzioni OCR, analisi della qualità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API ID_PROOFING_PROCESSOR

Note

La funzionalità di rilevamento dei duplicati online viene attualmente elaborata nei data center degli Stati Uniti. Il supporto regionale e multiregionale non è disponibile per questa funzionalità al di fuori degli Stati Uniti.
Questo processore è supportato da algoritmi che vengono aggiornati più frequentemente rispetto al rilascio di nuove versioni del processore. Per questo motivo, il processore potrebbe restituire output diversi nel tempo anche se viene utilizzata la stessa versione. Ad esempio, il sistema di rilevamento dei duplicati online monitora le immagini presenti sul web. Il comportamento del sistema può quindi cambiare più rapidamente di quanto possa essere monitorato nelle versioni del processore.
Consulta le note sull'IA responsabile^[†] e sulla revisione umana.^[‡]

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Moduli/versioni supportati

Supporto per passaporti, passaporto formato tessera e patenti di guida statunitensi.

Versioni del processore

ID versione	Canale di rilascio	Campi aggiuntivi rilevati	Descrizione
`pretrained-id-proofing-v1.0-2022-10-03`	Stabile	Nessuno
`pretrained-id-proofing-v1.1-2023-05-18`	Candidato per la release	Mostra campi `fraud_signals_photocopy_detection`	Segnale di rilevamento di fotocopie aggiuntivo
`pretrained-id-proofing-v1.2-2023-10-04`	Candidato per la release	Mostra campi `fraud_signals_photocopy_detection`

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	2
Numero massimo di pagine (richieste batch/offline/asincrone):	2
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	2

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore busta paga

Descrizione

Estrai dati dalle buste paga, tra cui nome, attività, importi ecc.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API PAYSTUB_PROCESSOR

Note

Se il documento di input di più pagine contiene più di una busta paga valida, il processore estrae le entità solo dalla prima busta paga valida. Se nel file di input non vengono trovate buste paga, il processore restituisce un messaggio di errore.

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Campi aggiuntivi rilevati	Descrizione
`pretrained-paystub-v1.0-2021-03-19`	Stabile	Nessuno
`pretrained-paystub-v1.1-2021-08-13`	Stabile	Mostra campi `net_pay` `net_pay_ytd` `employee_account_number`	Miglioramento della qualità e supporto di nuovi campi.
`pretrained-paystub-v1.2-2021-12-10`	Stabile	Nessuno
`pretrained-paystub-v2.0-2022-05-17`	Candidato per la release	Mostra campi `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Questa versione presuppone che il file di input contenga una sola busta paga. A differenza della versione predefinita, questa versione non controlla la presenza di buste paga nel file di input e non restituisce un errore se non vengono trovate buste paga. Miglioramento della qualità, supporto di nuovi campi e nuovo schema. Bonus, Commissioni, Festività, Straordinario, Retribuzione normale e Ferie ora fanno parte di earning_item/earning_this_period e le relative versioni dall'inizio dell'anno a oggi si trovano in earning_item/earning_ytd. Il deposito diretto e il numero di conto del dipendente ora sono nidificati in direct_deposit_item. Il limite di pagine asincrono è 10.
`pretrained-paystub-v2.0-2022-07-22`	Stabile	Nessuno	Miglioramento della qualità e potenziamento dell'addestramento.
`pretrained-paystub-v3.0-2023-12-06`	Candidato per la release	Nessuno

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	50
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti

employer_address
employer_name

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Istruzioni per l'etichettatura Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore sintattico di patenti di guida statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API US_DRIVER_LICENSE_PROCESSOR

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Moduli/versioni supportati

Supporta tutti i 50 stati e Washington DC.

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-us-driver-license-v1.0-2021-06-14`	Stabile

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	2
Numero massimo di pagine (richieste batch/offline/asincrone):	2
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	2

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

Date Of Birth
Expiration Date
Issue Date

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

eu
us

Analizzatore sintattico delle spese

Descrizione

Estrai testo e valori dai documenti delle spese, tra cui data della spesa, nome del fornitore, importo totale e valuta.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API EXPENSE_PROCESSOR

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Tedesco	`de`	`Latn`
Inglese	`en`	`Latn`
Spagnolo	`es`	`Latn`
Francese	`fr`	`Latn`
Giapponese	`ja`	`Jpan`
Olandese	`nl`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Campi aggiuntivi rilevati	Altre lingue supportate	Descrizione
`pretrained-expense-v1.1-2021-04-09`	Stabile	Nessuno	Nessuno	Lanciato ad aprile 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Candidato per la release	Mostra campi `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: giapponese	Un upgrade alla versione 1.3 con un modello di visione sottostante migliorato.
`pretrained-expense-v1.4-2022-11-18`	Candidato per la release	Mostra campi `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: giapponese `it`: italiano `pt`: Portoghese (Portogallo e Brasile)	Miglioramenti delle prestazioni e supporto per l'uptraining. Il limite massimo di pagine (richieste online/sincrone) è stato aumentato a 15. Nota:verrà ritirato negli Stati Uniti e nell'Unione Europea a partire dal 30 aprile 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Candidato per la release	Mostra campi `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: giapponese `it`: italiano `pt`: Portoghese (Portogallo e Brasile)	Un upgrade alla versione 1.4 con un modello di visione artificiale sottostante migliorato.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	10
Numero massimo di pagine (richieste batch/offline/asincrone):	10
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	10

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti

supplier_address
supplier_name
supplier_phone

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Istruzioni per l'etichettatura Apri in una nuova finestra.

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Analizzatore sintattico delle fatture

Descrizione

Estrai testo e valori dalle fatture, tra cui numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura e data di scadenza.

Il parser delle fatture estrae i campi dell'intestazione e delle voci, ad esempio numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura, data di scadenza e importi delle voci.

Category Preaddestrati

Funzioni OCR, estrazione di entità

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API INVOICE_PROCESSOR

Lingue supportate

Elenco completo delle lingue

Nome della lingua	Tag BCP 47	Script
Tedesco	`de`	`Latn`
Inglese	`en`	`Latn`
Spagnolo	`es`	`Latn`
Estone	`et`	`Latn`
Francese	`fr`	`Latn`
Italiano	`it`	`Latn`
Lettone	`lv`	`Latn`
Lituano	`lt`	`Latn`
Olandese	`nl`	`Latn`
Portoghese (Portogallo e Brasile)	`pt`	`Latn`
Rumeno	`ro`	`Latn`
Svedese	`sv`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Altre lingue supportate	Descrizione
`pretrained-invoice-v1.1-2021-04-09`	Stabile	Nessuno
`pretrained-invoice-v1.2-2022-02-18`	Stabile	Nessuno	La deprecazione è prevista a breve.
`pretrained-invoice-v1.3-2022-07-15`	Stabile	`it`: italiano `pt`: Portoghese (Portogallo e Brasile) `ro`: rumeno `sv`: svedese `et`: estone `lv`: lettone `lt`: lituano	Versione del processore riqualificabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
`pretrained-invoice-v1.4-2022-10-21`	Candidato per la release	Nessuno	Versione del processore riqualificabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
`pretrained-invoice-v1.5-2023-09-15`	Candidato per la release	Nessuno
`pretrained-invoice-v2.0-2023-12-06`	Candidato per la release	Nessuno

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	200
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Campi rilevati nella versione meno recente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campi con informazioni aggiuntive

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi arricchiti

supplier_address
supplier_name
supplier_phone

Campi normalizzati

Per ulteriori informazioni, consulta la pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Istruzioni per l'etichettatura Apri in una nuova finestra.

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Classifica i documenti

Classificatore personalizzato

Descrizione

Addestra un modello per classificare un tipo di documento da un insieme di classi.

Category Classificazione

Funzioni OCR, classificazione

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API CUSTOM_CLASSIFICATION_PROCESSOR

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-foundation-model-v1.4-2025-05-16`	Candidato per la release	Candidato per la release basato sul modello LLM Gemini 2.0 Flash. Include anche funzionalità OCR avanzate.
`pretrained-classifier-v1.5-2025-08-05`	Candidato per la release	Candidato per la release basato sul modello LLM Gemini 2.5 Flash. Include anche funzionalità OCR avanzate.

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	200
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Ulteriori informazioni Creare un processore di classificazione personalizzato

Separatore personalizzato

Descrizione

Addestra un modello per suddividere un file contenente più documenti in documenti singoli classificati.

Category Classificazione

Funzioni OCR, classificazione, suddivisione

Fase di rilascio Disponibilità generale

Stato dell'accesso Pubblico

Digita API CUSTOM_SPLITTING_PROCESSOR

Note

L'internazionalizzazione può essere supportata solo tramite opzioni di addestramento personalizzato.

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	1000
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Ulteriori informazioni Creare un processore di divisione personalizzato

Riassumi i documenti

Riassuntore

Descrizione

Ottieni riepiloghi astratti ed elenchi puntati per documenti brevi e lunghi.

Category preaddestrato

Funzioni Riassumi

Fase di rilascio Anteprima

Stato dell'accesso Pubblico

Digita API SUMMARY_PROCESSOR

Lingue supportate

Nome della lingua	Tag BCP 47	Script	Scrittura a mano libera supportata
Inglese	`en`	`Latn`

Versioni del processore

ID versione	Canale di rilascio	Descrizione
`pretrained-foundation-model-v1.0-2023-08-22`	Stabile	Modello di base di Google

Per saperne di più, consulta Gestione delle versioni del processore.

Quote e limiti

Numero massimo di pagine (richieste online/sincrone):	15
Numero massimo di pagine (richieste batch/offline/asincrone):	250
Numero massimo di pagine (modalità senza immagini richieste online/sincrone):	30

Nota:per estendere il limite massimo di pagine per le richieste online e sincrone fino a 30, assicurati di attivare imageless_mode in ProcessRequest.

Uptraining

File di input di esempio Apri in una nuova finestra.

Output di esempio Apri in una nuova finestra.

Regioni supportate

us

Ulteriori informazioni Riepilogo personalizzato

Note a piè di pagina

^[*] Questo processore è disponibile solo per i clienti con accesso limitato.

Per richiedere l'accesso API, compila e invia il modulo di richiesta di accesso ai processori Document AI. Nel modulo devi inserire informazioni su di te, sulla tua azienda e sul tuo caso d'uso. Tieni presente che per effettuare l'accesso è necessario un ID progetto Google Cloud. Per creare un nuovo progetto Google Cloud o identificare l'ID del progetto esistente, consulta le seguenti istruzioni.

Una volta inviato il modulo, il team di Document AI esaminerà la tua richiesta per verificare che soddisfi i criteri per l'accesso. In caso di approvazione, riceverai un'email con le istruzioni su come accedere e utilizzare questa funzionalità.

^[†] La verifica dei documenti di identità consente di estrarre e valutare le informazioni dai documenti di identità che contribuiscono a determinare se l'immagine di input rappresenta un documento di identità autentico.

In Google Cloud, diamo la priorità ad aiutare i clienti a sviluppare e implementare in modo sicuro soluzioni di AI e la verifica dell'identità è stata sviluppata in conformità ai principi di AI di Google.

In base ai principi di AI di Google e alla progettazione attuale dei prodotti, consigliamo vivamente di usare cautela e di valutare attentamente i potenziali vantaggi e rischi dell'utilizzo della verifica dei documenti di identità per quanto segue:

Processo decisionale senza human-in-the-loop per le previsioni che possono influire sui diritti umani.
In domini sensibili, inclusi, a titolo esemplificativo, occupazione, accesso a servizi pubblici, sanità e contesti critici per la sicurezza.

^[‡] Utilizza sempre la verifica dell'identità nell'ambito del processo e del flusso di lavoro più ampio di rilevamento dell'identità. È importante che nel tuo flusso di lavoro sia presente un revisore umano per verificare se gli indicatori previsti sono accurati. Il processore di verifica dell'identità non ha lo scopo di sostituire la revisione umana dei documenti di identità in un flusso di lavoro, ma piuttosto di assistere i revisori umani nella convalida dei documenti di identità. Il processore di verifica dell'identità non deve essere utilizzato come strumento decisionale automatizzato per determinare se un documento di identità è valido. Con la revisione umana, i clienti possono ottenere una maggiore precisione nell'elaborazione dei documenti e aiutare le aziende a valutare le previsioni utilizzando strumenti appositamente progettati per consentire tali revisioni.

Assicurati di esaminare i regolamenti della regione in cui implementi questa tecnologia e di consultare le linee guida esistenti del settore per conoscere le norme e i problemi comuni relativi all'equità. Scopri di più sull'equità nel machine learning, inclusi i modi per mitigare i bias nei set di dati di addestramento, valutare i modelli personalizzati per le disparità di prestazioni e altre considerazioni da tenere a mente quando utilizzi il tuo modello personalizzato.

Invitiamo i clienti a tenere presente l'equità, l'interpretabilità e le best practice in materia di privacy e sicurezza durante l'implementazione della verifica dell'identità. Per scoprire di più su come implementare l'AI responsabile, leggi i consigli di Google sulle pratiche di AI responsabile.

Per ulteriori informazioni sui casi d'uso e su un repository di codice dell'applicazione di esempio, consulta il post del blog Automatizzare l'elaborazione dei documenti di identità con Document AI.

Avanti

File supportati

Elenco dei processori Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Digitalizzare il testo

Enterprise Document OCR (riconoscimento ottico dei caratteri)

Elenco completo delle lingue

Estrai entità dai documenti

Estrattore personalizzato

Elenco completo delle lingue

Elenco completo dei tipi di dati normalizzati

Analizzatore sintattico di moduli

Elenco completo delle lingue

Mostra campi

Parser del layout

Elenco completo delle lingue

Esplora i processori preaddestrati

Analizzatore estratto conto bancario

Elenco completo dei campi

Elenco completo dei campi arricchiti

Elenco completo dei campi normalizzati

Analizzatore W2

Mostra campi

Mostra campi

Mostra campi

Elenco completo dei campi

Elenco completo dei campi arricchiti

Analizzatore sintattico di passaporti statunitensi

Elenco completo dei campi

Elenco completo dei campi normalizzati

Analizzatore sintattico delle utenze

Elenco completo dei campi

Elenco completo dei campi normalizzati

Parser di verifica dei documenti di identità

Mostra campi

Mostra campi

Elenco completo dei campi

Elenco completo dei campi normalizzati

Analizzatore busta paga

Mostra campi

Mostra campi

Elenco completo dei campi

Elenco completo dei campi arricchiti

Elenco completo dei campi normalizzati

Analizzatore sintattico di patenti di guida statunitensi

Elenco completo dei campi

Elenco completo dei campi normalizzati

Analizzatore sintattico delle spese

Elenco completo delle lingue

Mostra campi

Mostra campi

Mostra campi

Elenco completo dei campi

Elenco completo dei campi arricchiti

Elenco completo dei campi normalizzati

Analizzatore sintattico delle fatture

Elenco completo delle lingue

Elenco completo dei campi

Elenco completo dei campi arricchiti

Elenco completo dei campi normalizzati

Classifica i documenti

Classificatore personalizzato

Separatore personalizzato

Riassumi i documenti

Riassuntore

Note a piè di pagina

Elenco dei processori