Cette page a été traduite par l'API Cloud Translation.

Liste des outils de traitement

Cette page contient des informations détaillées sur tous les processeurs proposés par Document AI. Vous pouvez afficher la liste de tous les processeurs par type de solution.

Tous les processeurs Document AI respectent les Conditions relatives à la sécurité et au traitement des données.

Pour en savoir plus, consultez la documentation sur la gestion des versions de l'outil de traitement. De plus, des limites de processeur spécifiques s'appliquent en plus des quotas et limites généraux du produit.

Numériser du texte

Enterprise Document OCR (reconnaissance optique des caractères)

Description

Identifiez et extrayez du texte dans différents types de documents.

Ce processeur vous permet d'identifier et d'extraire le texte, y compris le texte manuscrit, des documents dans plus de 200 langues. Le processeur utilise également le machine learning pour évaluer la qualité d'un document en fonction de la lisibilité de son contenu.

Catégorie Numériser

Fonctions OCR, analyse de la qualité

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API OCR_PROCESSOR

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Afrikaans	`af`	`Latn`
Albanais	`sq`	`Latn`
Arabe	`ar`	`Arab`
Arménien	`hy`	`Armn`
Biélorusse	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengalî	`bn`	`Beng`
Bulgare	`bg`	`Cyrl`
Catalan	`ca`	`Latn`
Chinois	`zh`	`Hani`
Croate	`hr`	`Latn`
Tchèque	`cs`	`Latn`
Danois	`da`	`Latn`
Néerlandais	`nl`	`Latn`
Anglais	`en`	`Latn`
Estonien	`et`	`Latn`
Philippin	`fil`	`Latn`
Finnois	`fi`	`Latn`
Français	`fr`	`Latn`
Allemand	`de`	`Latn`
Grec	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hébreu	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hongrois	`hu`	`Latn`
Islandais	`is`	`Latn`
Indonésien	`id`	`Latn`
Italien	`it`	`Latn`
Japonais	`ja`	`Jpan`
Kannara	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coréen	`ko`	`Kore`
Laotien	`lo`	`Laoo`
Letton	`lv`	`Latn`
Lituanien	`lt`	`Latn`
Macédonien	`mk`	`Cyrl`
Malaisien	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Népalais	`ne`	`Deva`
Norvégien	`no`	`Latn`
Persan	`fa`	`Arab`
Polonais	`pl`	`Latn`
Portugais (Brésil et Portugal)	`pt`	`Latn`
Panjabi	`pa`	`Guru`
Roumain	`ro`	`Latn`
Russe	`ru`	`Cyrl`
Serbe	`sr`	`Cyrl`
Slovaque	`sk`	`Latn`
Slovène	`sl`	`Latn`
Espagnol	`es`	`Latn`
Suédois	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamoul	`ta`	`Taml`
Télougou	`te`	`Telu`
Thaï	`th`	`Thai`
Turc	`tr`	`Latn`
Ukrainien	`uk`	`Cyrl`
Vietnamien	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-ocr-v1.2-2022-11-10`	Stable	Version figée du modèle v1.0 : fichiers, configurations et binaires du modèle d'un instantané de version figé dans une image de conteneur pendant 18 mois maximum.
`pretrained-ocr-v2.0-2023-06-02`	Stable	Modèle prêt pour la production, spécialisé dans les cas d'utilisation de documents. Inclut l'accès à tous les modules complémentaires OCR.
`pretrained-ocr-v2.1-2024-08-07`	Stable	Les principaux axes d'amélioration de la version 2.1 sont les suivants : meilleure reconnaissance du texte imprimé, détection plus précise des cases à cocher et ordre de lecture plus précis.
`pretrained-ocr-v2.1.1-2025-01-31`	Version candidate	La version 2.1.1 est semblable à la version 2.1 et est disponible dans toutes les régions, à l'exception de `US`, `EU` et `asia-southeast1`.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	500
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

En savoir plus Enterprise Document OCR

Extraire des entités à partir de documents

Consultez Exemples d'ensembles de données pour obtenir des exemples d'ensembles de données étiquetés et non étiquetés à utiliser pour l'entraînement.

Extracteur personnalisé

Description

Extrayez des champs de documents à l'aide de l'IA générative ou de modèles personnalisés. Affinez les modèles pour extraire précisément les données de vos documents.

Catégorie Extraction

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API CUSTOM_EXTRACTION_PROCESSOR

Remarques

Si vous utilisez l'IA générative pour l'extraction :
- Seule la langue anglaise est officiellement prise en charge.
- La disponibilité par région est indiquée dans les US, EU, northamerica-northeast1 et asia-southeast1.

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Afrikaans	`af`	`Latn`
Arabe	`ar`	`Arab`
Azéri	`az`	`Latn`
Azéri (cyrillique)	`az-Cyrl`	`Cyrl`
Biélorusse	`be`	`Cyrl`
Bulgare	`bg`	`Cyrl`
Bosniaque	`bs`	`Latn`
Catalan	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Tchèque	`cs`	`Latn`
Gallois	`cy`	`Latn`
Danois	`da`	`Latn`
Allemand	`de`	`Latn`
Grec	`el`	`Grek`
Anglais	`en`	`Latn`
Espéranto	`eo`	`Latn`
Espagnol	`es`	`Latn`
Estonien	`et`	`Latn`
Basque	`eu`	`Latn`
Persan	`fa`	`Arab`
Finnois	`fi`	`Latn`
Philippin	`fil`	`Latn`
Français	`fr`	`Latn`
Irlandais	`ga`	`Latn`
Galicien	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croate	`hr`	`Latn`
Créole haïtien	`ht`	`Latn`
Hongrois	`hu`	`Latn`
Indonésien	`id`	`Latn`
Islandais	`is`	`Latn`
Italien	`it`	`Latn`
Hébreu	`iw`	`Hebr`
Japonais	`ja`	`Jpan`
Javanais	`jv`	`Latn`
Kazakh	`kk`	`Cyrl`
Coréen	`ko`	`Kore`
Kirghyz	`ky`	`Cyrl`
Latin	`la`	`Latn`
Lituanien	`lt`	`Latn`
Letton	`lv`	`Latn`
Macédonien	`mk`	`Cyrl`
Mongol	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malaisien	`ms`	`Latn`
Maltais	`mt`	`Latn`
Népalais	`ne`	`Deva`
Néerlandais	`nl`	`Latn`
Norvégien	`no`	`Latn`
Polonais	`pl`	`Latn`
Pachtô	`ps`	`Arab`
Portugais (Brésil et Portugal)	`pt`	`Latn`
Roumain	`ro`	`Latn`
Russe	`ru`	`Cyrl`
Russe (orthographe de Pierre le Grand)	`ru-PETR1708`	`Cyrl`
Sanskrit	`sa`	`Deva`
Slovaque	`sk`	`Latn`
Slovène	`sl`	`Latn`
Albanais	`sq`	`Latn`
Serbe	`sr`	`Cyrl`
Suédois	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Turc	`tr`	`Latn`
Ukrainien	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Ouzbek	`uz`	`Latn`
Ouzbek (cyrillique)	`uz-Cyrl`	`Cyrl`
Vietnamien	`vi`	`Latn`
Yiddish	`yi`	`Hebr`
Chinois simplifié	`zh-Hans`	`Hani`
Chinois traditionnel	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-foundation-model-v1.4-2025-02-05`	Stable	Modèle disponible dans le commerce, optimisé par le LLM Gemini 2.0 Flash. Inclut également des fonctionnalités avancées de reconnaissance optique des caractères, comme la détection des cases à cocher.
`pretrained-foundation-model-v1.5-2025-05-05`	Stable	Candidat prêt pour la production, optimisé par le LLM Gemini 2.5 Flash. Recommandé pour ceux qui souhaitent tester les nouveaux modèles.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Stable	Modèle prêt pour la production, optimisé par le LLM Gemini 2.5 Pro. Il accepte un quota de 30 pages par minute pour les requêtes de traitement en ligne. Ce modèle offre une qualité améliorée par rapport à la version 1.5 et peut présenter une latence plus élevée.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Types de données normalisés

Pour en savoir plus, consultez les pages Enrichissement et normalisation et Créer un ensemble de données.

Liste complète des types de données normalisés

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

En savoir plus Extracteur personnalisé

Analyseur de formulaires

Description

Extrayez des paires clé-valeur générales (entité et case à cocher), des tableaux et des entités génériques à partir de documents, en plus du texte OCR.

Ce processeur applique des technologies de machine learning avancées pour extraire des paires clé/valeur, des cases à cocher et des tableaux de documents dans plus de 200 langues. Ce processeur exploite également des modèles de deep learning pour extraire 11 entités génériques courantes dans différents types de documents.

Catégorie Extraction

Fonctions OCR, analyse de formulaires, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API FORM_PARSER_PROCESSOR

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Afrikaans	`af`	`Latn`
Albanais	`sq`	`Latn`
Arabe	`ar`	`Arab`
Biélorusse	`be`	`Cyrl`
Catalan	`ca`	`Latn`
Chinois	`zh`	`Hani`
Croate	`hr`	`Latn`
Tchèque	`cs`	`Latn`
Danois	`da`	`Latn`
Néerlandais	`nl`	`Latn`
Anglais	`en`	`Latn`
Estonien	`et`	`Latn`
Philippin	`fil`	`Latn`
Finnois	`fi`	`Latn`
Français	`fr`	`Latn`
Allemand	`de`	`Latn`
Hébreu	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hongrois	`hu`	`Latn`
Islandais	`is`	`Latn`
Indonésien	`id`	`Latn`
Italien	`it`	`Latn`
Japonais	`ja`	`Jpan`
Coréen	`ko`	`Kore`
Letton	`lv`	`Latn`
Lituanien	`lt`	`Latn`
Macédonien	`mk`	`Cyrl`
Malaisien	`ms`	`Latn`
Marathi	`mr`	`Deva`
Népalais	`ne`	`Deva`
Norvégien	`no`	`Latn`
Persan	`fa`	`Arab`
Polonais	`pl`	`Latn`
Portugais (Brésil et Portugal)	`pt`	`Latn`
Roumain	`ro`	`Latn`
Russe	`ru`	`Cyrl`
Serbe	`sr`	`Cyrl`
Slovaque	`sk`	`Latn`
Slovène	`sl`	`Latn`
Espagnol	`es`	`Latn`
Suédois	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Turc	`tr`	`Latn`
Ukrainien	`uk`	`Cyrl`
Vietnamien	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versions du processeur

ID de version	Version disponible	Champs supplémentaires détectés	Description
`pretrained-form-parser-v1.0-2020-09-23`	Stable	Aucun	Ancienne version. Pour une qualité optimale et un ensemble complet de fonctionnalités, utilisez le Form Parser v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Stable	Afficher les champs `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Version recommandée. Compatible avec les entités génériques et inclut des modèles améliorés pour les tableaux, les paires clé/valeur et les cases à cocher, ainsi que plus de 200 langues.
`pretrained-form-parser-v2.1-2023-06-26`	Version candidate	Aucun	Version Preview publique. Même modèle que la version 2.0, avec l'extraction native de texte à partir de fichiers PDF numériques activée.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	100
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

En savoir plus Analyseur de formulaires

Analyseur de mise en page

Description

Extrait les éléments de contenu d'un document (texte, tableaux et listes) et crée des segments contextuels.

L'analyseur de mise en page extrait des éléments de contenu de documents tels que du texte, des tableaux et des listes, et crée des segments contextuels qui facilitent la récupération d'informations dans les applications d'IA générative et de découverte.

Catégorie Extraction

Fonctions Analyse de la mise en page, fragmentation des documents

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API LAYOUT_PARSER_PROCESSOR

Remarques

Ce parseur est compatible avec les fichiers PDF, HTML, DOCX, PPTX, XLSX et XLSM.

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Afrikaans	`af`	`Latn`
Albanais	`sq`	`Latn`
Arabe	`ar`	`Arab`
Arménien	`hy`	`Armn`
Biélorusse	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengalî	`bn`	`Beng`
Bulgare	`bg`	`Cyrl`
Catalan	`ca`	`Latn`
Chinois	`zh`	`Hani`
Croate	`hr`	`Latn`
Tchèque	`cs`	`Latn`
Danois	`da`	`Latn`
Néerlandais	`nl`	`Latn`
Anglais	`en`	`Latn`
Estonien	`et`	`Latn`
Philippin	`fil`	`Latn`
Finnois	`fi`	`Latn`
Français	`fr`	`Latn`
Allemand	`de`	`Latn`
Grec	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hébreu	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hongrois	`hu`	`Latn`
Islandais	`is`	`Latn`
Indonésien	`id`	`Latn`
Italien	`it`	`Latn`
Japonais	`ja`	`Jpan`
Kannara	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coréen	`ko`	`Kore`
Laotien	`lo`	`Laoo`
Letton	`lv`	`Latn`
Lituanien	`lt`	`Latn`
Macédonien	`mk`	`Cyrl`
Malaisien	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Népalais	`ne`	`Deva`
Norvégien	`no`	`Latn`
Persan	`fa`	`Arab`
Polonais	`pl`	`Latn`
Portugais (Brésil et Portugal)	`pt`	`Latn`
Panjabi	`pa`	`Guru`
Roumain	`ro`	`Latn`
Russe	`ru`	`Cyrl`
Serbe	`sr`	`Cyrl`
Slovaque	`sk`	`Latn`
Slovène	`sl`	`Latn`
Espagnol	`es`	`Latn`
Suédois	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamoul	`ta`	`Taml`
Télougou	`te`	`Telu`
Thaï	`th`	`Thai`
Turc	`tr`	`Latn`
Ukrainien	`uk`	`Cyrl`
Vietnamien	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-layout-parser-v1.0-2024-06-03`	Stable	Version recommandée.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	500
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

En savoir plus Analyseur de mise en page

Explorer les processeurs pré-entraînés

Analyseur de relevés bancaires

Description

Extrayez les données de relevés bancaires, y compris le nom, le compte, les transactions, etc.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API BANK_STATEMENT_PROCESSOR

Remarques

Si une page d'un fichier d'entrée multipage correspond au bon type de document et à l'une des versions acceptées, le processeur effectue l'extraction d'entités sur le premier document accepté. Si le processeur ne trouve aucun document applicable dans le fichier d'entrée, il renvoie un message d'erreur.

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-bankstatement-v1.0-2021-08-08`	Stable
`pretrained-bankstatement-v1.1-2021-08-13`	Stable
`pretrained-bankstatement-v2.0-2021-12-10`	Stable
`pretrained-bankstatement-v3.0-2022-05-16`	Stable	Cette version suppose que le fichier d'entrée contient un seul relevé bancaire. Contrairement à la version par défaut, cette version ne vérifie pas si le fichier d'entrée contient des relevés bancaires et ne renvoie pas d'erreur si aucun relevé bancaire n'est trouvé.
`pretrained-bankstatement-v4.0-2023-07-31`	Version candidate
`pretrained-bankstatement-v5.0-2023-12-06`	Version candidate

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	30
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Champs enrichis

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs enrichis

bank_address
bank_name

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Instructions concernant l'ajout d'étiquettes Ouvrez-le dans une nouvelle fenêtre.

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de formulaires W2

Description

Extrayez les données du formulaire W2, y compris les infos d'employé, d'employeur, de salaire, etc.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API FORM_W2_PROCESSOR

Remarques

Si une page d'un fichier d'entrée multipage correspond au bon type de document et à l'une des versions acceptées, le processeur effectue l'extraction d'entités sur le premier document accepté. Si le processeur ne trouve aucun document applicable dans le fichier d'entrée, il renvoie un message d'erreur.

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Formulaires/versions acceptés

2020 (versions standard et personnalisée)
2019 (versions standard et personnalisée)
2018 (versions standards et personnalisées)

Versions du processeur

ID de version	Version disponible	Champs supplémentaires détectés	Description
`pretrained-w2-v1.0-2020-10-01`	Stable	Aucun
`pretrained-w2-v1.1-2022-01-27`	Stable	Aucun
`pretrained-w2-v1.2-2022-01-28`	Stable	Afficher les champs `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Améliorations de la qualité et prise en charge de nouveaux champs ; n'inclut pas le séparateur.
`pretrained-w2-v2.0-2022-03-30`	Version candidate	Afficher les champs `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Améliorations de la qualité et prise en charge des champs de la case 12, ainsi que des prédictions précises de `EmployeeName`, `EmployeeAddress` et `EmployerNameAndAddress`, qui ne font plus partie du résultat et sont remplacées par des champs supplémentaires.
`pretrained-w2-v2.1-2022-06-08`	Stable	Afficher les champs `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Semblable à la version `pretrained-w2-v2.0-2022-03-30`, avec des améliorations de qualité supplémentaires et l'ajout d'une entité `EmployeeName_Suffix`.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	15
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	15

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Champs enrichis

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs enrichis

EmployerNameAndAddress
EIN

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de passeports américains

Description

Extraire des champs tels que des noms, des ID de document, des dates de naissance, etc.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API US_PASSPORT_PROCESSOR

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-us-passport-v1.0-2021-06-14`	Stable

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	2

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

Date Of Birth
Expiration Date
Issue Date

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de fournisseurs d'énergie

Description

Extrayez le texte et les valeurs de factures d'énergie, comme le nom du fournisseur et le montant déjà payé.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Limité ^[*]

Saisir l'API UTILITY_PROCESSOR

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-utility-v1.1-2021-04-09`	Stable
`pretrained-utility-v1.2-2022-12-15`	Version candidate

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Instructions concernant l'ajout d'étiquettes Ouvrez-le dans une nouvelle fenêtre.

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de vérification de documents d'identité

Description

Prédisez la validité des pièces d'identité en fonction de plusieurs signaux.

Le processeur de validation des pièces d'identité est conçu pour prédire la validité des pièces d'identité à l'aide de quatre signaux différents.

Le processeur renvoie actuellement des informations à partir des signaux suivants :

Détection fraud_signals_is_identity_document : prédit si une image contient une pièce d'identité reconnue.
Détection de fraud_signals_suspicious_words : prédit si des mots non typiques des ID sont présents.
Détection de fraud_signals_image_manipulation : prédit si l'image a été modifiée ou falsifiée à l'aide d'un outil de retouche photo.
Détection fraud_signals_online_duplicate : indique si l'image est disponible en ligne (États-Unis uniquement).

Catégorie Pré-entraînés

Fonctions OCR, analyse de la qualité

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API ID_PROOFING_PROCESSOR

Remarques

La fonctionnalité de détection des doublons en ligne est actuellement traitée dans des centres de données aux États-Unis. La compatibilité régionale et multirégionale n'est pas disponible pour cette fonctionnalité en dehors des États-Unis.
Ce processeur est compatible avec des algorithmes qui sont mis à jour plus fréquemment que les nouvelles versions de processeur. C'est pourquoi le processeur peut renvoyer des résultats différents au fil du temps, même en utilisant la même version. Par exemple, le système de détection des doublons en ligne surveille les images présentes sur le Web. Le comportement du système peut alors changer plus rapidement que ce qui peut être suivi dans les versions du processeur.
Consultez les notes sur l'IA responsable^[†] et l'examen humain.^[‡]

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Formulaires/versions acceptés

Prise en charge des passeports, des cartes de passeport et des permis de conduire américains.

Versions du processeur

ID de version	Version disponible	Champs supplémentaires détectés	Description
`pretrained-id-proofing-v1.0-2022-10-03`	Stable	Aucun
`pretrained-id-proofing-v1.1-2023-05-18`	Version candidate	Afficher les champs `fraud_signals_photocopy_detection`	Signal de détection de photocopie supplémentaire
`pretrained-id-proofing-v1.2-2023-10-04`	Version candidate	Afficher les champs `fraud_signals_photocopy_detection`

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	2

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de bulletins de salaire

Description

Extrayez les données de bulletins de salaire, y compris le nom, l'entreprise, les montants, etc.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API PAYSTUB_PROCESSOR

Remarques

Si le document d'entrée multipage contient plusieurs bulletins de salaire valides, le processeur n'extrait les entités que du premier bulletin de salaire valide. Si aucun bulletin de salaire n'est trouvé dans le fichier d'entrée, le processeur renvoie un message d'erreur.

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Champs supplémentaires détectés	Description
`pretrained-paystub-v1.0-2021-03-19`	Stable	Aucun
`pretrained-paystub-v1.1-2021-08-13`	Stable	Afficher les champs `net_pay` `net_pay_ytd` `employee_account_number`	Amélioration de la qualité et compatibilité avec de nouveaux champs ;
`pretrained-paystub-v1.2-2021-12-10`	Stable	Aucun
`pretrained-paystub-v2.0-2022-05-17`	Version candidate	Afficher les champs `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Cette version suppose que le fichier d'entrée contient un seul bulletin de salaire. Contrairement à la version par défaut, cette version ne vérifie pas si le fichier d'entrée contient des bulletins de salaire et ne renvoie pas d'erreur si aucun bulletin de salaire n'est trouvé. Amélioration de la qualité, compatibilité avec de nouveaux champs et nouveau schéma. Les éléments "Bonus", "Commissions", "Congés", "Heures supplémentaires", "Salaire de base" et "Vacances" font désormais partie de earning_item/earning_this_period, et leurs versions depuis le début de l'année se trouvent dans earning_item/earning_ytd. Les éléments "Dépôt direct" et "Numéro de compte de l'employé" sont désormais imbriqués sous direct_deposit_item. La limite de pages asynchrones est de 10.
`pretrained-paystub-v2.0-2022-07-22`	Stable	Aucun	Amélioration de la qualité et des performances de l'entraînement.
`pretrained-paystub-v3.0-2023-12-06`	Version candidate	Aucun

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	50
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Champs enrichis

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs enrichis

employer_address
employer_name

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Instructions concernant l'ajout d'étiquettes Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de permis de conduire américains

Description

Extraire des champs tels que des noms, des ID de document, des dates de naissance, etc.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API US_DRIVER_LICENSE_PROCESSOR

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Formulaires/versions acceptés

Compatible avec les 50 États et D.C.

Versions du processeur

ID de version	Version disponible	Description
`pretrained-us-driver-license-v1.0-2021-06-14`	Stable

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	2
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	2
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	2

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

Date Of Birth
Expiration Date
Issue Date

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

eu
us

Analyseur de dépenses

Description

Extrayez le texte et les valeurs des notes de frais, comme la date de la dépense, le nom du fournisseur, le montant total et la devise.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API EXPENSE_PROCESSOR

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Allemand	`de`	`Latn`
Anglais	`en`	`Latn`
Espagnol	`es`	`Latn`
Français	`fr`	`Latn`
Japonais	`ja`	`Jpan`
Néerlandais	`nl`	`Latn`

Versions du processeur

ID de version	Version disponible	Champs supplémentaires détectés	Langues supplémentaires disponibles	Description
`pretrained-expense-v1.1-2021-04-09`	Stable	Aucun	Aucun	Lancé en avril 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Version candidate	Afficher les champs `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja` : japonais	Mise à niveau vers la version 1.3 avec un modèle de vision sous-jacent amélioré.
`pretrained-expense-v1.4-2022-11-18`	Version candidate	Afficher les champs `traveler_name` `reservation_id` `line_item/transaction_date`	`ja` : japonais `it` : Italien `pt` : portugais (Portugal et Brésil)	Amélioration des performances et prise en charge de l'entraînement supplémentaire. La limite maximale de pages (requêtes en ligne/synchrones) a été portée à 15. Remarque : Cette fonctionnalité sera abandonnée aux États-Unis et dans l'Union européenne à partir du 30 avril 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Version candidate	Afficher les champs `traveler_name` `reservation_id` `line_item/transaction_date`	`ja` : japonais `it` : Italien `pt` : portugais (Portugal et Brésil)	Mise à niveau vers la version 1.4 avec un modèle de vision sous-jacent amélioré.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	10
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	10
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	10

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Champs enrichis

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs enrichis

supplier_address
supplier_name
supplier_phone

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Instructions concernant l'ajout d'étiquettes Ouvrez-le dans une nouvelle fenêtre.

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Analyseur de factures

Description

Extrayez le texte et les valeurs des factures, comme le numéro de facture, le nom du fournisseur, le montant facturé, le montant des taxes, la date de facturation et la date d'échéance.

L'analyseur de factures extrait les champs d'en-tête et de ligne, tels que le numéro de facture, le nom du fournisseur, le montant facturé, le montant des taxes, la date de facturation, la date d'échéance et les montants des lignes.

Catégorie Pré-entraînés

Fonctions OCR, extraction d'entités

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API INVOICE_PROCESSOR

Langues disponibles

Liste complète des langues

Langue	Balise BCP 47	Script
Allemand	`de`	`Latn`
Anglais	`en`	`Latn`
Espagnol	`es`	`Latn`
Estonien	`et`	`Latn`
Français	`fr`	`Latn`
Italien	`it`	`Latn`
Letton	`lv`	`Latn`
Lituanien	`lt`	`Latn`
Néerlandais	`nl`	`Latn`
Portugais (Brésil et Portugal)	`pt`	`Latn`
Roumain	`ro`	`Latn`
Suédois	`sv`	`Latn`

Versions du processeur

ID de version	Version disponible	Langues supplémentaires disponibles	Description
`pretrained-invoice-v1.1-2021-04-09`	Stable	Aucun
`pretrained-invoice-v1.2-2022-02-18`	Stable	Aucun	La suppression est prévue prochainement.
`pretrained-invoice-v1.3-2022-07-15`	Stable	`it` : Italien `pt` : portugais (Portugal et Brésil) `ro` : roumain `sv` : suédois `et` : estonien `lv` : Letton `lt` : Lituanien	Version de processeur pouvant être entraînée. Le nombre maximal de pages (requêtes en ligne/synchrones) a été augmenté à 15.
`pretrained-invoice-v1.4-2022-10-21`	Version candidate	Aucun	Version de processeur pouvant être entraînée. Le nombre maximal de pages (requêtes en ligne/synchrones) a été augmenté à 15.
`pretrained-invoice-v1.5-2023-09-15`	Version candidate	Aucun
`pretrained-invoice-v2.0-2023-12-06`	Version candidate	Aucun

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Champs détectés dans la version la plus ancienne

Vous trouverez également ces informations sur la page Champ détecté.

Liste complète des champs

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Champs enrichis

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs enrichis

supplier_address
supplier_name
supplier_phone

Champs normalisés

Pour en savoir plus, consultez la page Enrichissement et normalisation.

Liste complète des champs normalisés

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Instructions concernant l'ajout d'étiquettes Ouvrez-le dans une nouvelle fenêtre.

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Classer des documents

Classificateur personnalisé

Description

Entraînez un modèle à classer un type de document à partir d'un ensemble de classes.

Catégorie Classification

Fonctions OCR, classification

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API CUSTOM_CLASSIFICATION_PROCESSOR

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-foundation-model-v1.4-2025-05-16`	Version candidate	Version candidate optimisée par le LLM Gemini 2.0 Flash. Inclut également des fonctionnalités OCR avancées.
`pretrained-classifier-v1.5-2025-08-05`	Version candidate	Version candidate optimisée par le LLM Gemini 2.5 Flash. Inclut également des fonctionnalités OCR avancées.

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	200
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

En savoir plus Créer un processeur de classification personnalisé

Séparateur personnalisé

Description

Entraînez un modèle à diviser un fichier contenant plusieurs documents en documents individuels classés.

Catégorie Classification

Fonctions OCR, classification, fractionnement

Phase de version Disponibilité générale

État de l'accès Publique

Saisir l'API CUSTOM_SPLITTING_PROCESSOR

Remarques

L'i18n n'est compatible qu'avec les options d'entraînement personnalisé.

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	1000
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

En savoir plus Créer un processeur de fractionnement personnalisé

Résumer des documents

Summarizer

Description

Obtenez des résumés abstraits et sous forme de puces pour les documents courts et longs.

Catégorie préentraîné

Fonctions Résumer

Phase de version Aperçu

État de l'accès Publique

Saisir l'API SUMMARY_PROCESSOR

Langues disponibles

Langue	Balise BCP 47	Script	Écriture manuscrite acceptée
Anglais	`en`	`Latn`

Versions du processeur

ID de version	Version disponible	Description
`pretrained-foundation-model-v1.0-2023-08-22`	Stable	Modèle de fondation Google

Pour en savoir plus, consultez Gérer les versions de l'outil de traitement.

Quotas et limites

Nombre maximal de pages (requêtes en ligne/synchrones) :	15
Nombre maximal de pages (requêtes par lot/hors connexion/asynchrones) :	250
Nombre maximal de pages (mode sans image, requêtes en ligne/synchrones) :	30

Remarque : Pour étendre la limite maximale de pages pour les requêtes en ligne et synchrones jusqu'à 30, veillez à activer imageless_mode dans ProcessRequest.

Uptraining

Exemple de fichier d'entrée Ouvrez-le dans une nouvelle fenêtre.

Exemple de résultat Ouvrez-le dans une nouvelle fenêtre.

Régions acceptées

us

En savoir plus Summarizer personnalisé

Notes de bas de page

^[*] Ce processeur est réservé aux clients disposant d'un accès limité.

Pour demander l'accès à l'API, remplissez et envoyez le formulaire de demande client pour l'accès limité à Document AI. Ce formulaire demande des informations sur vous, votre entreprise et votre cas d'utilisation. Notez qu'un ID de projet Google Cloud est nécessaire pour obtenir l'accès. Pour créer un projet Google Cloud ou identifier l'identifiant de votre projet existant, consultez les instructions suivantes.

Une fois le formulaire envoyé, l'équipe Document AI examinera votre demande pour s'assurer que vous répondez aux critères d'accès. Si la demande est approuvée, vous recevrez un e-mail expliquant comment accéder à cette fonctionnalité et l'utiliser.

^[†] La validation des pièces d'identité permet d'extraire et d'évaluer les informations des pièces d'identité qui contribuent à déterminer si l'image d'entrée représente une pièce d'identité authentique.

Chez Google Cloud, nous aidons les clients à développer et à mettre en œuvre des solutions d'IA en toute sécurité. La validation de l'identité a été développée conformément aux principes d'IA de Google.

Conformément aux principes de Google concernant l'IA et à la conception actuelle des produits, nous vous recommandons vivement d'être prudent et d'évaluer attentivement les avantages et les risques potentiels de l'utilisation de la validation des documents d'identité pour les éléments suivants :

Prise de décision sans intervention humaine pour les prédictions pouvant avoir un impact sur les droits de l'homme.
Dans les domaines sensibles, y compris, mais sans s'y limiter, l'emploi, l'accès aux services publics, la santé et les contextes critiques pour la sécurité.

^[‡] Utilisez toujours la validation de l'identité dans le cadre de votre processus et workflow de détection de l'identité plus larges. Il est important d'inclure un évaluateur humain dans votre workflow pour vérifier si les signaux prédits sont exacts. Le processeur de validation de l'identité n'est pas destiné à remplacer l'examen manuel des pièces d'identité dans un workflow, mais plutôt à aider les examinateurs manuels à valider les pièces d'identité. Le processeur de validation de l'identité ne doit pas être utilisé comme outil de décision automatisé pour déterminer si une pièce d'identité est valide. Grâce à la vérification manuelle, les clients peuvent améliorer la précision du traitement des documents et aider les entreprises à évaluer les prédictions à l'aide d'outils conçus spécifiquement pour ces examens.

Assurez-vous de consulter la réglementation de la région dans laquelle vous implémentez cette technologie et de vous renseigner sur les consignes existantes du secteur pour connaître les règles et les problèmes d'équité courants. Découvrez l'équité dans le machine learning, y compris les moyens de limiter les biais dans les ensembles de données d'entraînement, d'évaluer vos modèles personnalisés afin d'identifier les disparités dans les performances, ainsi que d'autres points importants à garder en tête lorsque vous utilisez votre modèle personnalisé.

Nous encourageons les clients à garder à l'esprit les bonnes pratiques d'équité, d'interprétabilité, de confidentialité et de sécurité lorsqu'ils implémentent la validation de l'identité. Pour savoir comment implémenter l'IA responsable, consultez les recommandations de Google pour les pratiques d'IA responsable.

Pour en savoir plus sur les cas d'utilisation et obtenir un exemple de dépôt de code d'application, consultez l'article de blog Automatiser le traitement des documents d'identité avec Document AI.

Fichiers compatibles

Liste des outils de traitement Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Numériser du texte

Enterprise Document OCR (reconnaissance optique des caractères)

Liste complète des langues

Extraire des entités à partir de documents

Extracteur personnalisé

Liste complète des langues

Liste complète des types de données normalisés

Analyseur de formulaires

Liste complète des langues

Afficher les champs

Analyseur de mise en page

Liste complète des langues

Explorer les processeurs pré-entraînés

Analyseur de relevés bancaires

Liste complète des champs

Liste complète des champs enrichis

Liste complète des champs normalisés

Analyseur de formulaires W2

Afficher les champs

Afficher les champs

Afficher les champs

Liste complète des champs

Liste complète des champs enrichis

Analyseur de passeports américains

Liste complète des champs

Liste complète des champs normalisés

Analyseur de fournisseurs d'énergie

Liste complète des champs

Liste complète des champs normalisés

Analyseur de vérification de documents d'identité

Afficher les champs

Afficher les champs

Liste complète des champs

Liste complète des champs normalisés

Analyseur de bulletins de salaire

Afficher les champs

Afficher les champs

Liste complète des champs

Liste complète des champs enrichis

Liste complète des champs normalisés

Analyseur de permis de conduire américains

Liste complète des champs

Liste complète des champs normalisés

Analyseur de dépenses

Liste complète des langues

Afficher les champs

Afficher les champs

Afficher les champs

Liste complète des champs

Liste complète des champs enrichis

Liste complète des champs normalisés

Analyseur de factures

Liste complète des langues

Liste complète des champs

Liste complète des champs enrichis

Liste complète des champs normalisés

Classer des documents

Classificateur personnalisé

Séparateur personnalisé

Résumer des documents

Summarizer

Notes de bas de page

Liste des outils de traitement