Diese Seite wurde von der Cloud Translation API übersetzt.

Prozessorliste

Auf dieser Seite finden Sie ausführliche Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Auftragsverarbeiter halten sich an die Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation Prozessorversionen verwalten. Zusätzlich zu den Kontingenten und Limits für das gesamte Produkt gelten auch bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Erkennt und extrahiert Text in verschiedenen Arten von Dokumenten.

Mit diesem Prozessor können Sie Text, einschließlich handgeschriebenen Texts, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet außerdem maschinelles Lernen, um eine Qualitätsprüfung eines Dokuments anhand der Lesbarkeit des Inhalts durchzuführen.

Kategorie Digitalisieren

Funktionen OCR, Qualitätsanalyse

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben OCR_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-ocr-v1.0-2020-09-23`	Stabil	Keine	Keine	Die Verwendung wird nicht empfohlen und die Funktion wird ab dem 30. April 2025 in den USA und der EU eingestellt.
`pretrained-ocr-v1.1-2022-09-12`	Stabil	Keine	Keine	Die Verwendung wird nicht empfohlen und die Funktion wird ab dem 30. April 2025 in den USA und der EU eingestellt.
`pretrained-ocr-v1.2-2022-11-10`	Stabil	Keine	Keine	Eingefrorene Modellversion von Version 1.0: Modelldateien, Konfigurationen und Binärdateien eines Versions-Snapshots, die bis zu 18 Monate lang in einem Container-Image eingefroren sind.
`pretrained-ocr-v2.0-2023-06-02`	Stabil	Keine	Keine	Produktionsreifes Modell, das speziell für Anwendungsfälle mit Dokumenten entwickelt wurde. Beinhaltet Zugriff auf alle OCR-Add-ons.
`pretrained-ocr-v2.1-2024-08-07`	Stabil	Keine	Keine	Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, präzisere Kästchenerkennung und genauere Lesereihenfolge.
`pretrained-ocr-v2.1.1-2025-01-31`	Release-Kandidat	Keine	Keine	Version 2.1.1 ähnelt Version 2.1 und ist in allen Regionen verfügbar, mit Ausnahme von `US`, `EU` und `asia-southeast1`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	500

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Unter Beispiel-Datasets finden Sie Beispiele für Datasets mit und ohne Labels, die Sie für das Training verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Mit generativer KI oder benutzerdefinierten Modellen Felder aus Dokumenten extrahieren und Modelle optimieren, um Daten aus Dokumenten genau zu extrahieren.

Kategorie Extrahieren

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_EXTRACTION_PROCESSOR

Hinweise

Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:
- Es wird nur die englische Sprache offiziell unterstützt.
- Die regionale Verfügbarkeit ist in den US-, EU-, northamerica-northeast1- und asia-southeast1-Regionen.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Afrikaans	`af`	`Latn`
Arabisch	`ar`	`Arab`
Aserbaidschanisch	`az`	`Latn`
Aserbaidschanisch (kyrillisch)	`az-Cyrl`	`Cyrl`
Belarussisch	`be`	`Cyrl`
Bulgarisch	`bg`	`Cyrl`
Bosnisch	`bs`	`Latn`
Katalanisch	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Tschechisch	`cs`	`Latn`
Walisisch	`cy`	`Latn`
Dänisch	`da`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Englisch	`en`	`Latn`
Esperanto	`eo`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Baskisch	`eu`	`Latn`
Persisch	`fa`	`Arab`
Finnisch	`fi`	`Latn`
Filipino	`fil`	`Latn`
Französisch	`fr`	`Latn`
Irisch	`ga`	`Latn`
Galizisch	`gl`	`Latn`
Hindi	`hi`	`Deva`
Kroatisch	`hr`	`Latn`
Haitianisch	`ht`	`Latn`
Ungarisch	`hu`	`Latn`
Indonesisch	`id`	`Latn`
Isländisch	`is`	`Latn`
Italienisch	`it`	`Latn`
Hebräisch	`iw`	`Hebr`
Japanisch	`ja`	`Jpan`
Javanisch	`jv`	`Latn`
Kasachisch	`kk`	`Cyrl`
Koreanisch	`ko`	`Kore`
Kirgisisch	`ky`	`Cyrl`
Latein	`la`	`Latn`
Litauisch	`lt`	`Latn`
Lettisch	`lv`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Mongolisch	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malaiisch	`ms`	`Latn`
Maltesisch	`mt`	`Latn`
Nepalesisch	`ne`	`Deva`
Niederländisch	`nl`	`Latn`
Norwegisch	`no`	`Latn`
Polnisch	`pl`	`Latn`
Paschtu	`ps`	`Arab`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Russisch (Petrinische Rechtschreibung)	`ru-PETR1708`	`Cyrl`
Sanskrit	`sa`	`Deva`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Albanisch	`sq`	`Latn`
Serbisch	`sr`	`Cyrl`
Schwedisch	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Usbekisch	`uz`	`Latn`
Usbekisch (Kyrillisch)	`uz-Cyrl`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`
Chinesisch (vereinfacht)	`zh-Hans`	`Hani`
Chinesisch (traditionell)	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-foundation-model-v1.0-2023-08-22`	Stabil	Keine	Keine	Produktionsreife Lösung, die auf Dokumenten-Anwendungsfälle spezialisiert ist und auf speziellen Vision- und Foundation-Modellen basiert. Hinweis:Ab dem 9. April 2025 ist diese Version nicht mehr verfügbar.
`pretrained-foundation-model-v1.1-2024-03-12`	Release-Kandidat	Keine	Keine	Release-Kandidat mit Gemini 1.0 Pro LLM und neu entwickelten Technologien, einschließlich spezieller Sprach- und Visionsmodelle. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Hinweis:Ab dem 9. April 2025 ist diese Version nicht mehr verfügbar.
`pretrained-foundation-model-v1.2-2024-05-10`	Stabil	Keine	Keine	Produktionsreife Version, die auf dem LLM Gemini 1.5 Pro und neu entwickelten Technologien basiert, einschließlich spezieller Sprach- und Visionsmodelle. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Empfohlen für Nutzer, die die größten unterstützten Tokenlimits verwenden oder mit neueren Modellen experimentieren möchten.
`pretrained-foundation-model-v1.3-2024-08-31`	Stabil	Keine	Keine	Produktionsreife Version, die auf dem Gemini 1.5 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Empfohlen für Nutzer, die die niedrigste Latenz wünschen.
`pretrained-foundation-model-v1.4-2025-02-05`	Release-Kandidat	Keine	Keine	Produktionsreife Version mit Gemini 2.0 Flash LLM Produktionsreife Version, die auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Empfohlen für Nutzer, die mit neueren Modellen experimentieren möchten.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	200

Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierter Extrahierer

Formularparser

Beschreibung

Zusätzlich zum OCR-Text werden allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahiert.

Dieser Prozessor verwendet fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in über 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren

Funktionen OCR, Formular-Parsing, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_PARSER_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Belarussisch	`be`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Koreanisch	`ko`	`Kore`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-form-parser-v1.0-2020-09-23`	Stabil	Keine	Keine	Alte Version. Die beste Qualität und die vollständige Funktionspalette erhalten Sie mit dem Formular-Parser 2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Stabil	Felder anzeigen `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Keine	Empfohlene Version. Unterstützt generische Entitäten und umfasst ein aktualisiertes Tabellen-, KVP- und Kästchenmodell sowie mehr als 200 Sprachen.
`pretrained-form-parser-v2.1-2023-06-26`	Release-Kandidat	Keine	Keine	Version der öffentlichen Vorschau. Dasselbe Modell wie Version 2.0, bei der die native Textextraktion aus digitalen PDF-Dateien aktiviert ist.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	100

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Formularparser

Layout-Parser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layout-Parser extrahiert Inhaltselemente aus Dokumenten wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren

Funktionen Layout-Parsing, Dokumentaufteilung

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben LAYOUT_PARSER_PROCESSOR

Hinweise

Dieser Parser unterstützt PDF-, HTML- und DOCX-Dateien.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-layout-parser-v1.0-2024-06-03`	Stabil	Keine	Keine	Empfohlene Version.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	500

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Weitere Informationen Layout-Parser

Vortrainierte Modelle ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben BANK_STATEMENT_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Entitätsextraktion für das erste unterstützte Dokument durch. Wenn der Prozessor keine entsprechenden Dokumente in der Eingabedatei findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-bankstatement-v1.0-2021-08-08`	Stabil	Keine	Keine
`pretrained-bankstatement-v1.1-2021-08-13`	Stabil	Keine	Keine
`pretrained-bankstatement-v2.0-2021-12-10`	Stabil	Keine	Keine
`pretrained-bankstatement-v3.0-2022-05-16`	Stabil	Keine	Keine	Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird bei dieser Version die Eingabedatei nicht auf Kontoauszüge geprüft und es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
`pretrained-bankstatement-v4.0-2023-07-31`	Release-Kandidat	Keine	Keine
`pretrained-bankstatement-v5.0-2023-12-06`	Release-Kandidat	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	30

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

bank_address
bank_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Human-in-the-Loop

Anleitung zum Beschriften In neuem Fenster öffnen

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_W2_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Entitätsextraktion für das erste unterstützte Dokument durch. Wenn der Prozessor keine entsprechenden Dokumente in der Eingabedatei findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

2020 (Standard- und benutzerdefinierte Versionen)
2019 (Standard- und benutzerdefinierte Versionen)
2018 (Standard- und benutzerdefinierte Versionen)

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-w2-v1.0-2020-10-01`	Stabil	Keine	Keine
`pretrained-w2-v1.1-2022-01-27`	Stabil	Keine	Keine
`pretrained-w2-v1.2-2022-01-28`	Stabil	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Keine	Qualitätsverbesserungen und Unterstützung neuer Felder; enthält keinen Splitter.
`pretrained-w2-v2.0-2022-03-30`	Release-Kandidat	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Keine	Qualitätsverbesserungen und Unterstützung für Felder in Feld 12 sowie detaillierte Vorhersagen für `EmployeeName`, `EmployeeAddress` und `EmployerNameAndAddress`. Diese Felder sind nicht mehr Teil der Ausgabe und werden durch zusätzliche Felder ersetzt.
`pretrained-w2-v2.1-2022-06-08`	Stabil	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Keine	Ähnlich wie Version `pretrained-w2-v2.0-2022-03-30`, jedoch mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität `EmployeeName_Suffix`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	15

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

EmployerNameAndAddress
EIN

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für US-amerikanische Reisepässe

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben US_PASSPORT_PROCESSOR

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-us-passport-v1.0-2021-06-14`	Stabil	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	2

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

Date Of Birth
Expiration Date
Issue Date

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Dienstprogrammparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen von Energieversorgern, z. B. den Lieferantennamen und den zuvor bezahlten Betrag.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Eingeschränkt ^[*]

API eingeben UTILITY_PROCESSOR

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-utility-v1.1-2021-04-09`	Stabil	Keine	Keine
`pretrained-utility-v1.2-2022-12-15`	Release-Kandidat	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	200

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Human-in-the-Loop

Anleitung zum Beschriften In neuem Fenster öffnen

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für den Identitätsnachweis

Beschreibung

Gültigkeit von Ausweisdokumenten anhand mehrerer Signale vorhersagen

Der Prozessor für die Überprüfung von Ausweisdokumenten soll mithilfe von vier verschiedenen Signalen die Gültigkeit von Ausweisdokumenten vorhersagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

fraud_signals_is_identity_document-Erkennung: Vorhersage, ob ein Bild ein erkanntes Ausweisdokument enthält.
fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs nicht typisch sind.
fraud_signals_image_manipulation-Erkennung: Vorhersage, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
fraud_signals_online_duplicate detection: Vorhersage, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert

Funktionen OCR, Qualitätsanalyse

Release-Phase Vorschau

Zugriffsstatus Öffentlich

API eingeben ID_PROOFING_PROCESSOR

Hinweise

Die Funktion zur Online-Duplikaterkennung wird derzeit in US-Rechenzentren verarbeitet. Regionale und multiregionale Unterstützung für diese Funktion ist außerhalb der USA nicht verfügbar.
Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ergebnisse zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Duplikaterkennung überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es bei Prozessorversionen möglich ist.
Weitere Informationen finden Sie in den Hinweisen zu verantwortungsbewusster KI^[†] und zur manuellen Überprüfung.^[‡]

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützung für US-amerikanische Reisepässe, Passkarten und Führerscheine

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-id-proofing-v1.0-2022-10-03`	Stabil	Keine	Keine
`pretrained-id-proofing-v1.1-2023-05-18`	Release-Kandidat	Felder anzeigen `fraud_signals_photocopy_detection`	Keine	Zusätzliches Signal zur Erkennung von Fotokopien
`pretrained-id-proofing-v1.2-2023-10-04`	Release-Kandidat	Felder anzeigen `fraud_signals_photocopy_detection`	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	2

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben PAYSTUB_PROCESSOR

Hinweise

Wenn das mehrseitige Eingabedokument mehr als einen gültigen Lohnzettel enthält, extrahiert der Prozessor nur Entitäten aus dem ersten gültigen Lohnzettel. Wenn in der Eingabedatei keine Lohnabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-paystub-v1.0-2021-03-19`	Stabil	Keine	Keine
`pretrained-paystub-v1.1-2021-08-13`	Stabil	Felder anzeigen `net_pay` `net_pay_ytd` `employee_account_number`	Keine	Qualitätsverbesserung und Unterstützung neuer Felder
`pretrained-paystub-v1.2-2021-12-10`	Stabil	Keine	Keine
`pretrained-paystub-v2.0-2022-05-17`	Release-Kandidat	Felder anzeigen `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Keine	Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Lohnzettel enthält. Im Gegensatz zur Standardversion wird bei dieser Version die Eingabedatei nicht auf Lohnabrechnungen geprüft und es wird kein Fehler zurückgegeben, wenn keine Lohnabrechnungen gefunden werden. Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. „Bonus“, „Provisionen“, „Urlaub“, „Überstunden“, „Reguläres Gehalt“ und „Urlaub“ sind jetzt Teil von „earning_item/earning_this_period“ und die entsprechenden Werte für das laufende Jahr sind unter „earning_item/earning_ytd“ zu finden. „Direktüberweisung“ und „Mitarbeiterkontonummer“ sind jetzt unter „direct_deposit_item“ verschachtelt. Die maximale Anzahl von Seiten für asynchrone Abläufe beträgt 10.
`pretrained-paystub-v2.0-2022-07-22`	Stabil	Keine	Keine	Verbesserung der Qualität und der Weiterbildung.
`pretrained-paystub-v3.0-2023-12-06`	Release-Kandidat	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	50

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

employer_address
employer_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Human-in-the-Loop

Anleitung zum Beschriften In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben US_DRIVER_LICENSE_PROCESSOR

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützt alle 50 Bundesstaaten und das Bundesdistrikt Washington.

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-us-driver-license-v1.0-2021-06-14`	Stabil	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	2

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

Date Of Birth
Expiration Date
Issue Date

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Spesendokumenten, z. B. Spesendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben EXPENSE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Französisch	`fr`	`Latn`
Japanisch	`ja`	`Jpan`
Niederländisch	`nl`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-expense-v1.1-2021-04-09`	Stabil	Keine	Keine	Im April 2021 eingeführt. Die Einstellung ist bald geplant.
`pretrained-expense-v1.2-2022-02-18`	Stabil	Keine	Keine	Hinweis:Wird ab dem 30. April 2025 in den USA und der EU eingestellt.
`pretrained-expense-v1.3-2022-07-15`	Stabil	Felder anzeigen `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japanisch	Unterstützung für Hotel- und Mietwagen-Folien Hinweis:Wird ab dem 30. April 2025 in den USA und der Europäischen Union eingestellt.
`pretrained-expense-v1.3.2-2024-09-11`	Release-Kandidat	Felder anzeigen `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japanisch	Upgrade auf Version 1.3 mit einem verbesserten zugrunde liegenden Bilderkennungsmodell.
`pretrained-expense-v1.4-2022-11-18`	Release-Kandidat	Felder anzeigen `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Leistungsverbesserungen und Unterstützung für Weiterbildungen Die maximale Anzahl von Seiten (online/synchrone Anfragen) wurde auf 15 erhöht. Hinweis:Wird ab dem 30. April 2025 in den USA und der Europäischen Union eingestellt.
`pretrained-expense-v1.4.2-2024-09-12`	Release-Kandidat	Felder anzeigen `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Bilderkennungsmodell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	10

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Human-in-the-Loop

Anleitung zum Beschriften In neuem Fenster öffnen

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungsparser extrahiert sowohl Kopf- als auch Positionenfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionenbeträge.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben INVOICE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP-47-Tag	Script
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Französisch	`fr`	`Latn`
Italienisch	`it`	`Latn`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Niederländisch	`nl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Schwedisch	`sv`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-invoice-v1.1-2021-04-09`	Stabil	Keine	Keine
`pretrained-invoice-v1.2-2022-02-18`	Stabil	Keine	Keine	Die Einstellung ist bald geplant.
`pretrained-invoice-v1.3-2022-07-15`	Stabil	Keine	`it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien) `ro`: Rumänisch `sv`: Schwedisch `et`: Estnisch `lv`: Lettisch `lt`: Litauisch	Prozessorversion, die optimiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.4-2022-10-21`	Release-Kandidat	Keine	Keine	Prozessorversion, die optimiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.5-2023-09-15`	Release-Kandidat	Keine	Keine
`pretrained-invoice-v2.0-2023-12-06`	Release-Kandidat	Keine	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	200

In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Human-in-the-Loop

Anleitung zum Beschriften In neuem Fenster öffnen

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_CLASSIFICATION_PROCESSOR

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	200

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung, Aufteilung

Release-Phase General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_SPLITTING_PROCESSOR

Hinweise

Die i18n-Unterstützung kann nur über benutzerdefinierte Trainingsoptionen erfolgen.

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	1000

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Dokumente zusammenfassen

Summarizer

Beschreibung

Sie können Zusammenfassungen in Form von Abstracts und Aufzählungspunkten für kurze und lange Dokumente abrufen.

Kategorie vorab trainiert

Funktionen Zusammenfassen

Release-Phase Vorschau

Zugriffsstatus Öffentlich

API eingeben SUMMARY_PROCESSOR

Unterstützte Sprachen

Sprache	BCP-47-Tag	Script	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Zusätzliche Felder erkannt	Zusätzlich unterstützte Sprachen	Beschreibung
`pretrained-foundation-model-v1.0-2023-08-22`	Stabil	Keine	Keine	Google-Grundlagenmodell

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Seiten (online/synchrone Anfragen):	15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen):	250

Uptraining

Human-in-the-Loop

Beispiel für eine Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

us

Weitere Informationen Benutzerdefinierter Zusammenfassungstool

Fußnoten

^[*] Dieser Prozessor ist nur für Kunden mit eingeschränktem Zugriff verfügbar.

Wenn Sie den Zugriff auf diese API anfordern möchten, füllen Sie das Anfrageformular für den eingeschränkten Zugriff auf Document AI aus und reichen Sie es ein. Im Formular müssen Sie Informationen über sich, Ihr Unternehmen und Ihren Anwendungsfall angeben. Für den Zugriff ist eine Google Cloud-Projekt-ID erforderlich. Halten Sie sich an diese Anleitung, um ein neues Google Cloud-Projekt zu erstellen oder die Projekt-ID eines vorhandenen Projekts zu ermitteln.

Nachdem Sie das Formular gesendet haben, prüft das Document AI-Team Ihre Anfrage, um sicherzustellen, dass Sie die Kriterien für den Zugriff erfüllen. Bei Genehmigung erhalten Sie eine E-Mail mit einer Anleitung dazu, wie Sie auf diese Funktion zugreifen und sie verwenden können.

^[†] Bei der Überprüfung von Ausweisen werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudhelfen wir Kunden bei der sicheren Entwicklung und Implementierung von KI-Lösungen. Die Identitätsbestätigung wurde gemäß den KI-Grundsätzen von Google entwickelt.

Auf der Grundlage der KI-Grundsätze von Google und des aktuellen Produktdesigns empfehlen wir dringend, die potenziellen Vorteile und Risiken der Bestätigung per Ausweis für die folgenden Zwecke sorgfältig zu prüfen:

Entscheidungen ohne menschliches Zutun bei Vorhersagen, die sich auf Menschenrechte auswirken können.
In sensiblen Bereichen, einschließlich, aber nicht beschränkt auf Beschäftigung, Zugang zu öffentlichen Dienstleistungen, Gesundheitswesen und sicherheitskritische Kontexte.

^[‡] Verwenden Sie die Identitätsbestätigung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie in Ihrem Workflow einen menschlichen Prüfer haben, der prüft, ob die vorhergesagten Signale korrekt sind. Der Prozessor für die Identitätsbestätigung soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern die Prüfer bei der Validierung von Ausweisen unterstützen. Der Identitätsbestätigungs-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um zu bestimmen, ob ein Ausweis gültig ist. Mit manuellen Überprüfungen können Kunden die Genauigkeit der Dokumentenverarbeitung verbessern und Unternehmen dabei helfen, Vorhersagen mithilfe speziell entwickelter Tools zu bewerten.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie implementieren, und informieren Sie sich über bestehende Branchenrichtlinien, um mehr über Richtlinien und häufig auftretende Fairnessprobleme zu erfahren. Hier finden Sie Informationen zu Fairness im Bereich maschinelles Lernen, einschließlich Möglichkeiten zur Minimierung von Verzerrungen in Trainingsdatensätzen, zur Bewertung Ihrer benutzerdefinierten Modelle auf Leistungsunterschiede und zu anderen Aspekten bei der Verwendung Ihres benutzerdefinierten Modells.

Wir empfehlen Kunden, bei der Implementierung der Identitätsbestätigung die Fairness, Interpretierbarkeit sowie Best Practices für Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel-Repository für Anwendungscode finden Sie im Blogpost Automate identity document processing with Document AI].

Weiter

Unterstützte Dateien

Prozessorliste

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Vollständige Liste der Sprachen

Entitäten aus Dokumenten extrahieren

Benutzerdefinierter Extrahierer

Vollständige Liste der Sprachen

Vollständige Liste der normalisierten Datentypen

Formularparser

Vollständige Liste der Sprachen

Felder anzeigen

Layout-Parser

Vollständige Liste der Sprachen

Vortrainierte Modelle ansehen

Kontoauszugsparser

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

W2-Parser

Felder anzeigen

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Parser für US-amerikanische Reisepässe

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Dienstprogrammparser

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Parser für den Identitätsnachweis

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Lohnabrechnungsparser

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Parser für US-Führerschein

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Kostenparser

Vollständige Liste der Sprachen

Felder anzeigen

Felder anzeigen

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Rechnungsparser

Vollständige Liste der Sprachen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Benutzerdefinierter Splitter

Dokumente zusammenfassen

Summarizer

Fußnoten