Elenco dei processori

Questa pagina contiene informazioni dettagliate su tutti i processori offerti da Document AI. Puoi visualizzare un elenco di tutti i processori per tipo di soluzione.

Tutti i responsabili del trattamento di Document AI rispettano i Termini per il trattamento e la sicurezza dei dati.

Per ulteriori dettagli, consulta la documentazione relativa alla gestione delle versioni del processore. Inoltre, oltre alle quote e ai limiti generali del prodotto, si applicano limiti specifici per i processori.

Digitalizzare il testo

OCR (riconoscimento ottico dei caratteri) dei documenti aziendali

Descrizione

Identifica ed estrai il testo in diversi tipi di documenti.

Questo processore ti consente di identificare ed estrarre testo, incluso quello scritto a mano, dai documenti in più di 200 lingue. Il responsabile del trattamento utilizza anche il machine learning per eseguire una valutazione della qualità di un documento in base alla leggibilità dei suoi contenuti.

Category Digitalizzare
Funzioni OCR, analisi della qualità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API OCR_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Armeno hy Armn
Bielorusso be Cyrl
Bengalese bn Beng
Bengali bn Beng
Bulgaro bg Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Greco el Grek
Gujarati gu Gujr
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Kannada kn Knda
Khmer km Khmr
Coreano ko Kore
Lao lo Laoo
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Punjabi pa Guru
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Tailandese th Thai
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-ocr-v1.0-2020-09-23 Stabile

Nessuno

Nessuno

Non è consigliato per l'uso e non sarà più disponibile negli Stati Uniti (US) e nell'Unione Europea (UE) a partire dal 30 aprile 2025.
pretrained-ocr-v1.1-2022-09-12 Stabile

Nessuno

Nessuno

Non è consigliato per l'uso e non sarà più disponibile negli Stati Uniti (US) e nell'Unione Europea (UE) a partire dal 30 aprile 2025.
pretrained-ocr-v1.2-2022-11-10 Stabile

Nessuno

Nessuno

Versione del modello bloccata della versione 1.0: file del modello, configurazioni e file binari di un'istantanea della versione bloccati in un'immagine container per un massimo di 18 mesi.
pretrained-ocr-v2.0-2023-06-02 Stabile

Nessuno

Nessuno

Modello pronto per la produzione specializzato per i casi d'uso dei documenti. Include l'accesso a tutti i componenti aggiuntivi OCR.
pretrained-ocr-v2.1-2024-08-07 Candidato per la release

Nessuno

Nessuno

Le principali aree di miglioramento della versione 2.1 sono: un migliore riconoscimento del testo stampato, un rilevamento più preciso delle caselle di controllo e un ordine di lettura più accurato.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 500
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Enterprise Document OCR

Estrai entità dai documenti

Consulta la sezione Set di dati di esempio per trovare set di dati etichettati e non etichettati di esempio da utilizzare per l'addestramento.

Estrattore personalizzato

Descrizione

Estrai i campi dai documenti utilizzando l'AI generativa o i modelli personalizzati; ottimizza i modelli per estrarre con precisione i dati dai documenti.

Category Estrazione
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API CUSTOM_EXTRACTION_PROCESSOR
Note
  • Se utilizzi l'AI generativa per l'estrazione:

    • È supportata ufficialmente solo la lingua inglese.
    • La disponibilità per regione è nelle regioni US, EU, northamerica-northeast1 e asia-southeast1.

Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Arabo ar Arab
Azero az Latn
Azero (cirillico) az-Cyrl Cyrl
Bielorusso be Cyrl
Bulgaro bg Cyrl
Bosniaco bs Latn
Catalano ca Latn
Cebuano ceb Latn
Ceco cs Latn
Gallese cy Latn
Danese da Latn
Tedesco de Latn
Greco el Grek
Inglese en Latn
Esperanto eo Latn
Spagnolo es Latn
Estone et Latn
Basco eu Latn
Persiano fa Arab
Finlandese fi Latn
Filippino fil Latn
Francese fr Latn
Irlandese ga Latn
Galiziano gl Latn
Hindi hi Deva
Croato hr Latn
Creolo haitiano ht Latn
Ungherese hu Latn
Indonesiano id Latn
Islandese is Latn
Italiano it Latn
Ebraico iw Hebr
Giapponese ja Jpan
Giavanese jv Latn
Kazako kk Cyrl
Coreano ko Kore
Kirgizo ky Cyrl
Latino la Latn
Lituano lt Latn
Lettone lv Latn
Macedone mk Cyrl
Mongolo mn Cyrl
Marathi mr Deva
Malese ms Latn
Maltese mt Latn
Nepalese ne Deva
Olandese nl Latn
Norvegese no Latn
Polacco pl Latn
Pashto ps Arab
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Russo ru Cyrl
Russo (ortografia petrina) ru-PETR1708 Cyrl
Sanscrito sa Deva
Slovacco sk Latn
Sloveno sl Latn
Albanese sq Latn
Serbo sr Cyrl
Svedese sv Latn
Swahili sw Latn
Tagalog tl Latn
Turco tr Latn
Ucraino uk Cyrl
Urdu ur Arab
Uzbeco uz Latn
Uzbeko (cirillico) uz-Cyrl Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Cinese semplificato zh-Hans Hani
Cinese tradizionale zh-Hant Hani
Zulu zu Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-foundation-model-v1.0-2023-08-22 Stabile

Nessuno

Nessuno

Candidato pronto per la produzione specializzato per casi d'uso relativi ai documenti basati su modelli di visione e modelli di base specializzati.
pretrained-foundation-model-v1.1-2024-03-12 Candidato per la release

Nessuno

Nessuno

Release candidate basata su LLM Gemini 1.0 Pro e tecnologie di nuova concezione, inclusi modelli linguistici e di visione specializzati. Sono incluse anche funzionalità OCR avanzate come il rilevamento delle caselle di controllo.
pretrained-foundation-model-v1.2-2024-05-10 Stabile

Nessuno

Nessuno

Candidato pronto per la produzione basato su Gemini 1.5 Pro LLM e tecnologie di nuova concezione, inclusi modelli di lingua e visione specializzati. Sono incluse anche funzionalità OCR avanzate come il rilevamento delle caselle di controllo. Consigliato per gli utenti che vogliono utilizzare i limiti di token più elevati supportati o fare esperimenti con modelli più recenti.
pretrained-foundation-model-v1.3-2024-08-31 Stabile

Nessuno

Nessuno

Candidato pronto per la produzione basato sull'LLM Gemini 1.5 Flash. Sono incluse anche funzionalità OCR avanzate come il rilevamento delle caselle di controllo. Consigliato per chi vuole la latenza più bassa.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 200
Tipi di dati normalizzati

Puoi trovare ulteriori informazioni nelle pagine Arricchimento e normalizzazione e Creare set di dati.

Elenco completo dei tipi di dati normalizzati
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Estrattore personalizzato

Analizzatore sintattico di moduli

Descrizione

Estrai coppie chiave/valore generali (entità e casella di controllo), tabelle ed entità generiche dai documenti, oltre al testo OCR.

Questo processore applica tecnologie di machine learning avanzate per estrarre coppie chiave-valore, caselle di controllo e tabelle da documenti in più di 200 lingue. Questo processore sfrutta anche i modelli di deep learning per estrarre 11 entità generiche comuni in vari tipi di documenti.

Category Estrazione
Funzioni OCR, analisi del modulo, estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API FORM_PARSER_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Bielorusso be Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Coreano ko Kore
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-form-parser-v1.0-2020-09-23 Stabile

Nessuno

Nessuno

Versione precedente. Per la massima qualità e un set completo di funzionalità, utilizza la versione 2.0 di Form Parser.
pretrained-form-parser-v2.0-2022-11-10 Stabile
Mostra campi
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

Nessuno

Versione consigliata. Supporta entità generiche e include il modello di tabella, KVP e casella di controllo di cui è stato eseguito l'upgrade, nonché più di 200 lingue.
pretrained-form-parser-v2.1-2023-06-26 Candidato per la release

Nessuno

Nessuno

Versione Anteprima pubblica. Stesso modello della versione 2.0 con estrazione di testo nativa dai file PDF digitali abilitata.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 100
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Analizzatore sintattico di moduli

Parser del layout

Descrizione

Estrae elementi dei contenuti dei documenti (testo, tabelle ed elenchi) e crea blocchi sensibili al contesto.

Lo strumento di analisi del layout estrae elementi dei contenuti dei documenti come testo, tabelle ed elenchi e crea blocchi sensibili al contesto che facilitano il recupero di informazioni nell'AI generativa e nelle applicazioni di rilevamento.

Category Estrazione
Funzioni Analisi del layout, Chunking dei documenti
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API LAYOUT_PARSER_PROCESSOR
Note
  • Questo parser supporta i file PDF, HTML e DOCX.
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Afrikaans af Latn
Albanese sq Latn
Arabo ar Arab
Armeno hy Armn
Bielorusso be Cyrl
Bengalese bn Beng
Bengali bn Beng
Bulgaro bg Cyrl
Catalano ca Latn
Cinese zh Hani
Croato hr Latn
Ceco cs Latn
Danese da Latn
Olandese nl Latn
Inglese en Latn
Estone et Latn
Filippino fil Latn
Finlandese fi Latn
Francese fr Latn
Tedesco de Latn
Greco el Grek
Gujarati gu Gujr
Ebraico iw Hebr
Hindi hi Deva
Ungherese hu Latn
Islandese is Latn
Indonesiano id Latn
Italiano it Latn
Giapponese ja Jpan
Kannada kn Knda
Khmer km Khmr
Coreano ko Kore
Lao lo Laoo
Lettone lv Latn
Lituano lt Latn
Macedone mk Cyrl
Malese ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalese ne Deva
Norvegese no Latn
Persiano fa Arab
Polacco pl Latn
Portoghese (Portogallo e Brasile) pt Latn
Punjabi pa Guru
Rumeno ro Latn
Russo ru Cyrl
Serbo sr Cyrl
Slovacco sk Latn
Sloveno sl Latn
Spagnolo es Latn
Svedese sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Tailandese th Thai
Turco tr Latn
Ucraino uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-layout-parser-v1.0-2024-06-03 Stabile

Nessuno

Nessuno

Versione consigliata.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 500
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us
Ulteriori informazioni Parser del layout

Esplorare i processori preaddestrati

Analizzatore estratto conto bancario

Descrizione

Estrai dati dagli estratti conto bancari, tra cui nome, conto, transazioni e così via.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API BANK_STATEMENT_PROCESSOR
Note
  • Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, l'elaboratore esegue l'estrazione delle entità sul primo documento supportato. Se il gestore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-bankstatement-v1.0-2021-08-08 Stabile

Nessuno

Nessuno

pretrained-bankstatement-v1.1-2021-08-13 Stabile

Nessuno

Nessuno

pretrained-bankstatement-v2.0-2021-12-10 Stabile

Nessuno

Nessuno

pretrained-bankstatement-v3.0-2022-05-16 Stabile

Nessuno

Nessuno

Questa versione presuppone che il file di input contenga un singolo estratto conto bancario. A differenza della versione predefinita, questa versione non controlla la presenza di estratti conto bancari nel file di input e non restituisce un errore se non vengono trovati estratti conto bancari.
pretrained-bankstatement-v4.0-2023-07-31 Candidato per la release

Nessuno

Nessuno

pretrained-bankstatement-v5.0-2023-12-06 Candidato per la release

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 30
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campi con informazioni aggiuntive

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi con informazioni aggiuntive
  • bank_address
  • bank_name
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Human-in-the-Loop
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore W2

Descrizione

Estrai dati dal modulo W2, tra cui dipendente, datore di lavoro, salari e così via.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API FORM_W2_PROCESSOR
Note
  • Se una pagina di un file di input di più pagine è del tipo di documento corretto e di una delle versioni supportate, l'elaboratore esegue l'estrazione delle entità sul primo documento supportato. Se il gestore non trova documenti applicabili nel file di input, restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Forme/versioni supportate
  • 2020 (versioni standard e personalizzate)
  • 2019 (versioni standard e personalizzate)
  • 2018 (versioni standard e personalizzate)
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-w2-v1.0-2020-10-01 Stabile

Nessuno

Nessuno

pretrained-w2-v1.1-2022-01-27 Stabile

Nessuno

Nessuno

pretrained-w2-v1.2-2022-01-28 Stabile
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Nessuno

Miglioramenti alla qualità e supporto di nuovi campi; non include lo splitter.

pretrained-w2-v2.0-2022-03-30 Candidato per la release
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Nessuno

Miglioramenti alla qualità e supporto per i campi della casella 12 e le previsioni granulari di EmployeeName, EmployeeAddress e EmployerNameAndAddress, che non fanno più parte dell'output e vengono sostituite da campi aggiuntivi.

pretrained-w2-v2.1-2022-06-08 Stabile
Mostra campi
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Nessuno

Simile alla versione pretrained-w2-v2.0-2022-03-30 con ulteriori miglioramenti della qualità e l'introduzione di un'altra entità EmployeeName_Suffix.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 15
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campi con informazioni aggiuntive

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi con informazioni aggiuntive
  • EmployerNameAndAddress
  • EIN
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico di passaporti statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API US_PASSPORT_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-us-passport-v1.0-2021-06-14 Stabile

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 2
Pagine massime (richieste batch/offline/asincrone): 2
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico delle utenze

Descrizione

Estrai testo e valori dalle bollette, tra cui nome del fornitore e importo dell'ultimo pagamento.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Con restrizioni [*]
Digita l'API UTILITY_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-utility-v1.1-2021-04-09 Stabile

Nessuno

Nessuno

pretrained-utility-v1.2-2022-12-15 Candidato per la release

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 10
Pagine massime (richieste batch/offline/asincrone): 200
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Human-in-the-Loop
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Parser di verifica dei documenti di identità

Descrizione

Prevede la validità dei documenti di identità utilizzando più indicatori.

Il processore di verifica dei documenti di identità è progettato per aiutare a prevedere la validità dei documenti di identità con quattro diversi indicatori.

Attualmente, il responsabile del trattamento restituisce informazioni dai seguenti indicatori:

  • Rilevamento di fraud_signals_is_identity_document: prevede se un'immagine contiene un documento di identità riconosciuto.
  • Rilevamento di fraud_signals_suspicious_words: prevede se sono presenti parole non tipiche negli ID.
  • Rilevamento di fraud_signals_image_manipulation: prevede se l'immagine è stata alterata o manomessa con uno strumento di modifica delle immagini.
  • fraud_signals_online_duplicate detection: prevede se l'immagine può essere trovata online (solo Stati Uniti).

Category Preaddestrati
Funzioni OCR, analisi della qualità
Fase di rilascio Anteprima
Stato di accesso Pubblico
Digita l'API ID_PROOFING_PROCESSOR
Note
  • La funzionalità di rilevamento dei duplicati online è attualmente elaborata nei data center degli Stati Uniti. Il supporto per una o più regioni non è disponibile per questa funzionalità al di fuori degli Stati Uniti.
  • Questo elaboratore è supportato da algoritmi che vengono aggiornati più di frequente rispetto al rilascio di nuove versioni dell'elaboratore. Per questo motivo, il processore potrebbe restituire output diversi nel tempo anche se utilizzi la stessa versione del processore. Ad esempio, il sistema di rilevamento dei duplicati online monitora le immagini presenti sul web. Il comportamento del sistema può quindi cambiare più rapidamente di quanto sia possibile monitorare nelle versioni del processore.
  • Consulta le note sull'IA responsabile[†] e sulla revisione da parte di persone fisiche.[‡]
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Forme/versioni supportate
  • Supporto per passaporti, tessere e patenti di guida statunitensi.
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-id-proofing-v1.0-2022-10-03 Stabile

Nessuno

Nessuno

pretrained-id-proofing-v1.1-2023-05-18 Candidato per la release
Mostra campi
  • fraud_signals_photocopy_detection

Nessuno

Segnale di rilevamento di fotocopie aggiuntive

pretrained-id-proofing-v1.2-2023-10-04 Candidato per la release
Mostra campi
  • fraud_signals_photocopy_detection

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 2
Pagine massime (richieste batch/offline/asincrone): 2
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore busta paga

Descrizione

Estrai dati dalle buste paga, tra cui nome, attività, importi ecc.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API PAYSTUB_PROCESSOR
Note
  • Se il documento di input multipagina contiene più di una distinta di pagamento valida, l'elaboratore estrae le entità solo dalla prima distinta di pagamento valida. Se nel file di input non vengono trovati assegni, l'elaboratore restituisce un messaggio di errore.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-paystub-v1.0-2021-03-19 Stabile

Nessuno

Nessuno

pretrained-paystub-v1.1-2021-08-13 Stabile
Mostra campi
  • net_pay
  • net_pay_ytd
  • employee_account_number

Nessuno

Miglioramento della qualità e supporto di nuovi campi.
pretrained-paystub-v1.2-2021-12-10 Stabile

Nessuno

Nessuno

pretrained-paystub-v2.0-2022-05-17 Candidato per la release
Mostra campi
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Nessuno

Questa versione presuppone che il file di input contenga una singola distinta. A differenza della versione predefinita, questa versione non controlla la presenza di buste paga nel file di input e non restituisce un errore se non vengono trovate buste paga.

Miglioramento della qualità, supporto di nuovi campi e nuovo schema. Bonus, Commissioni, Festività, Ore straordinarie, Stipendio regolare e Vacanza ora fanno parte di earning_item/earning_this_period e le relative versioni da inizio anno a oggi si trovano in earning_item/earning_ytd. L'accreditamento diretto e il numero di conto dell'impiegato ora sono nidificati in direct_deposit_item.

Il limite di pagine asincrone è 10.

pretrained-paystub-v2.0-2022-07-22 Stabile

Nessuno

Nessuno

Miglioramento della qualità e potenziamento della formazione.

pretrained-paystub-v3.0-2023-12-06 Candidato per la release

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 50
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campi con informazioni aggiuntive

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi con informazioni aggiuntive
  • employer_address
  • employer_name
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Human-in-the-Loop
Istruzioni per l'etichettatura Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico di patenti di guida statunitensi

Descrizione

Estrai campi come nomi, ID documento, data di nascita e così via.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API US_DRIVER_LICENSE_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Forme/versioni supportate
  • Supporta tutti i 50 stati e Washington DC.
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-us-driver-license-v1.0-2021-06-14 Stabile

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 2
Pagine massime (richieste batch/offline/asincrone): 2
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • eu
  • us

Analizzatore sintattico delle spese

Descrizione

Estrai testo e valori dai documenti relativi alle spese, ad esempio data della spesa, nome del fornitore, importo totale e valuta.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API EXPENSE_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Tedesco de Latn
Inglese en Latn
Spagnolo es Latn
Francese fr Latn
Giapponese ja Jpan
Olandese nl Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-expense-v1.1-2021-04-09 Stabile

Nessuno

Nessuno

Lanciato ad aprile 2021. La disattivazione è prevista a breve.
pretrained-expense-v1.2-2022-02-18 Stabile

Nessuno

Nessuno

pretrained-expense-v1.3-2022-07-15 Stabile
Mostra campi
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: giapponese
Supporto per i folio di hotel e auto a noleggio.
pretrained-expense-v1.3.2-2024-09-11 Candidato per la release
Mostra campi
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: giapponese
Un upgrade alla versione 1.3 con un modello di visione di base migliorato.
pretrained-expense-v1.4-2022-11-18 Candidato per la release
Mostra campi
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: giapponese
  • it: italiano
  • pt: portoghese (Portogallo e Brasile)
Miglioramenti delle prestazioni e supporto per l'upskilling. Il limite massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-expense-v1.4.2-2024-09-12 Candidato per la release
Mostra campi
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: giapponese
  • it: italiano
  • pt: portoghese (Portogallo e Brasile)
Un upgrade alla versione 1.4 con un modello di visione di base migliorato.

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 10
Pagine massime (richieste batch/offline/asincrone): 10
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campi con informazioni aggiuntive

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi con informazioni aggiuntive
  • supplier_address
  • supplier_name
  • supplier_phone
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Human-in-the-Loop
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Analizzatore sintattico delle fatture

Descrizione

Estrai testo e valori dalle fatture, tra cui numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura e data di scadenza.

Il parser delle fatture estrae sia i campi di intestazione che quelli delle voci, ad esempio numero di fattura, nome del fornitore, importo della fattura, importo dell'IVA, data della fattura, data di scadenza e importi delle voci.

Category Preaddestrati
Funzioni OCR, Estrazione di entità
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API INVOICE_PROCESSOR
Lingue supportate
Elenco completo delle lingue
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Tedesco de Latn
Inglese en Latn
Spagnolo es Latn
Estone et Latn
Francese fr Latn
Italiano it Latn
Lettone lv Latn
Lituano lt Latn
Olandese nl Latn
Portoghese (Portogallo e Brasile) pt Latn
Rumeno ro Latn
Svedese sv Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-invoice-v1.1-2021-04-09 Stabile

Nessuno

Nessuno

pretrained-invoice-v1.2-2022-02-18 Stabile

Nessuno

Nessuno

La disattivazione è prevista a breve.
pretrained-invoice-v1.3-2022-07-15 Stabile

Nessuno

  • it: italiano
  • pt: portoghese (Portogallo e Brasile)
  • ro: rumeno
  • sv: svedese
  • et: estone
  • lv: lettone
  • lt: lituano
Versione del processore aggiornabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-invoice-v1.4-2022-10-21 Candidato per la release

Nessuno

Nessuno

Versione del processore aggiornabile. Il numero massimo di pagine (richieste online/sincrone) è stato aumentato a 15.
pretrained-invoice-v1.5-2023-09-15 Candidato per la release

Nessuno

Nessuno

pretrained-invoice-v2.0-2023-12-06 Candidato per la release

Nessuno

Nessuno

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 200
Campi rilevati nella versione precedente

Puoi trovare queste informazioni anche nella pagina Campo rilevato.

Elenco completo dei campi
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campi con informazioni aggiuntive

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi con informazioni aggiuntive
  • supplier_address
  • supplier_name
  • supplier_phone
Campi normalizzati

Puoi trovare ulteriori informazioni nella pagina Arricchimento e normalizzazione.

Elenco completo dei campi normalizzati
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Human-in-the-Loop
Istruzioni per l'etichettatura Apri in una nuova finestra.
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Classifica i documenti

Classificatore personalizzato

Descrizione

Addestra un modello per classificare un tipo di documento da un insieme di classi.

Category Classificazione
Funzioni OCR, classificazione
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API CUSTOM_CLASSIFICATION_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 200
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Creare un elaboratore di classificazione personalizzato

Separatore personalizzato

Descrizione

Addestra un modello per suddividere un file contenente più documenti in singoli documenti classificati.

Category Classificazione
Funzioni OCR, classificazione, suddivisione
Fase di rilascio Disponibilità generale
Stato di accesso Pubblico
Digita l'API CUSTOM_SPLITTING_PROCESSOR
Note
  • L'i18n può essere supportato solo tramite le opzioni di addestramento personalizzato.
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 1000
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Ulteriori informazioni Creare un processore di separazione personalizzato

Riassumi i documenti

Riepilogatore

Descrizione

Visualizza riepiloghi con abstract ed elenchi puntati per documenti brevi e lunghi.

Category preaddestrati
Funzioni Riassumi
Fase di rilascio Anteprima
Stato di accesso Pubblico
Digita l'API SUMMARY_PROCESSOR
Lingue supportate
Nome della lingua Tag BCP 47 Script Scrittura a mano libera supportata
Inglese en Latn
Versioni del processore
ID versione Canale di rilascio Campi aggiuntivi rilevati Altre lingue supportate Descrizione
pretrained-foundation-model-v1.0-2023-08-22 Stabile

Nessuno

Nessuno

Modello di base di Google

Per saperne di più, consulta Gestire le versioni del processore.

Quote e limiti
Pagine massime (richieste online/sincrone): 15
Pagine massime (richieste batch/offline/asincrone): 250
Uptraining
Human-in-the-Loop
File di input di esempio Apri in una nuova finestra.
Output di esempio Apri in una nuova finestra.
Regioni supportate
  • us
Ulteriori informazioni Riepilogatore personalizzato

Note a piè di pagina

[*] Questo processore è disponibile solo per i clienti con accesso limitato.

Per richiedere l'accesso API, compila e invia il modulo di richiesta di accesso ai processori Document AI. Nel modulo devi inserire informazioni su di te, sulla tua azienda e sul tuo caso d'uso. Tieni presente che per l'accesso è necessario un ID progetto Google Cloud. Per creare un nuovo progetto Google Cloud o identificare l'ID del progetto esistente, consulta le seguenti istruzioni.

Una volta inviato il modulo, il team di Document AI esaminerà la tua richiesta per verificare che soddisfi i criteri per l'accesso. In caso di approvazione, riceverai un'email con le istruzioni su come accedere e utilizzare questa funzionalità.

[†] La verifica dei documenti di identità consente di estrarre e valutare le informazioni dai documenti di identità che contribuiscono a identificare se l'immagine di input rappresenta un documento di identità autentico.

In Google Cloud, diamo la priorità ad aiutare i clienti a sviluppare e implementare in modo sicuro soluzioni di IA e la verifica dell'identità è stata sviluppata in conformità ai principi di IA di Google.

In base ai principi dell'IA di Google e al design attuale del prodotto, ti consigliamo vivamente di procedere con cautela e di valutare attentamente i potenziali vantaggi e rischi dell'utilizzo della verifica dell'identità per quanto segue:

  • Decisioni prese senza l'human-in-the-loop per le previsioni che possono influire sui diritti umani.
  • In domini sensibili, inclusi, a titolo esemplificativo, occupazione, accesso ai servizi pubblici, assistenza sanitaria e contesti critici per la sicurezza.

[‡] Utilizza sempre la verifica dell'identità nell'ambito della procedura e del flusso di lavoro di rilevamento dell'identità più ampio. È importante che il flusso di lavoro preveda un revisore umano per verificare l'accuratezza degli indicatori previsti. Il processore di verifica dell'identità non è progettato per sostituire la revisione da parte di persone fisiche degli ID in un flusso di lavoro, ma piuttosto per aiutare i revisori umani a convalidare i documenti di identità. Il gestore dell'accertamento dell'identità non deve essere utilizzato come strumento di decisione automatizzato per stabilire se un documento di identità è valido. Con la revisione umana, i clienti possono ottenere una maggiore precisione nell'elaborazione dei documenti e aiutare le aziende a valutare le previsioni utilizzando strumenti appositamente progettati per consentire queste revisioni.

Assicurati di esaminare le normative della regione in cui implementi questa tecnologia e di consultare le linee guida del settore esistenti per conoscere le linee guida delle norme e i problemi di equità più comuni. Scopri di più sull'equità nel machine learning, inclusi i modi per mitigare i bias nei set di dati di addestramento, valutare i modelli personalizzati per le disparità di prestazioni e altri aspetti da considerare quando utilizzi un modello personalizzato.

Consigliamo ai clienti di tenere presente equità, interpretabilità e best practice in materia di privacy e sicurezza durante l'implementazione della verifica dell'identità. Per scoprire di più su come implementare l'IA responsabile, leggi i consigli di Google per le pratiche di IA responsabile.

Per ulteriori informazioni sui casi d'uso e su un repository di codice dell'applicazione di esempio, consulta il post del blog Automate identity document processing with Document AI].