Prozessorliste

Auf dieser Seite finden Sie ausführliche Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Auftragsverarbeiter halten sich an die Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation Prozessorversionen verwalten. Zusätzlich zu den Kontingenten und Limits für das gesamte Produkt gelten auch bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Erkennt und extrahiert Text in verschiedenen Arten von Dokumenten.

Mit diesem Prozessor können Sie Text, einschließlich handgeschriebenen Text, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet außerdem maschinelles Lernen, um eine Qualitätsprüfung eines Dokuments anhand der Lesbarkeit des Inhalts durchzuführen.

Kategorie Digitalisieren
Funktionen OCR, Qualitätsanalyse
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben OCR_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepali ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Panjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-ocr-v1.0-2020-09-23 Stabile Version

Keine

Keine

Die Verwendung wird nicht empfohlen und die Funktion wird ab dem 30. April 2025 in den USA und der EU eingestellt.
pretrained-ocr-v1.1-2022-09-12 Stabile Version

Keine

Keine

Die Verwendung wird nicht empfohlen und die Funktion wird ab dem 30. April 2025 in den USA und der EU eingestellt.
pretrained-ocr-v1.2-2022-11-10 Stabile Version

Keine

Keine

Eingefrorene Modellversion von Version 1.0: Modelldateien, Konfigurationen und Binärdateien eines Versions-Snapshots, die bis zu 18 Monate lang in einem Container-Image eingefroren sind.
pretrained-ocr-v2.0-2023-06-02 Stabile Version

Keine

Keine

Produktionsreifes Modell, das speziell für Anwendungsfälle mit Dokumenten entwickelt wurde. Beinhaltet Zugriff auf alle OCR-Add-ons.
pretrained-ocr-v2.1-2024-08-07 Release-Kandidat

Keine

Keine

Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, präzisere Kästchenerkennung und genauere Lesereihenfolge.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Unter Beispiel-Datasets finden Sie Beispiele für Datasets mit und ohne Labels, die Sie für das Training verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Mit generativer KI oder benutzerdefinierten Modellen Felder aus Dokumenten extrahieren und Modelle optimieren, um Daten aus Ihren Dokumenten genau zu extrahieren.

Kategorie Extrahieren
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_EXTRACTION_PROCESSOR
Hinweise
  • Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:

    • Es wird nur die englische Sprache offiziell unterstützt.
    • Die regionale Verfügbarkeit ist in den US-, EU-, northamerica-northeast1- und asia-southeast1-Regionen.

Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Afrikaans af Latn
Arabisch ar Arab
Aserbaidschanisch az Latn
Aserbaidschanisch (kyrillisch) az-Cyrl Cyrl
Belarussisch be Cyrl
Bulgarisch bg Cyrl
Bosnisch bs Latn
Katalanisch ca Latn
Cebuano ceb Latn
Tschechisch cs Latn
Walisisch cy Latn
Dänisch da Latn
Deutsch de Latn
Griechisch el Grek
Englisch en Latn
Esperanto eo Latn
Spanisch es Latn
Estnisch et Latn
Baskisch eu Latn
Persisch fa Arab
Finnisch fi Latn
Filipino fil Latn
Französisch fr Latn
Irisch ga Latn
Galizisch gl Latn
Hindi hi Deva
Kroatisch hr Latn
Haitianisch ht Latn
Ungarisch hu Latn
Indonesisch id Latn
Isländisch is Latn
Italienisch it Latn
Hebräisch iw Hebr
Japanisch ja Jpan
Javanisch jv Latn
Kasachisch kk Cyrl
Koreanisch ko Kore
Kirgisisch ky Cyrl
Latein la Latn
Litauisch lt Latn
Lettisch lv Latn
Mazedonisch mk Cyrl
Mongolisch mn Cyrl
Marathi mr Deva
Malaiisch ms Latn
Maltesisch mt Latn
Nepali ne Deva
Niederländisch nl Latn
Norwegisch no Latn
Polnisch pl Latn
Paschtu ps Arab
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Russisch (Petrinische Rechtschreibung) ru-PETR1708 Cyrl
Sanskrit sa Deva
Slowakisch sk Latn
Slowenisch sl Latn
Albanisch sq Latn
Serbisch sr Cyrl
Schwedisch sv Latn
Swahili sw Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Urdu ur Arab
Usbekisch uz Latn
Usbekisch (Kyrillisch) uz-Cyrl Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Chinesisch (vereinfacht) zh-Hans Hani
Chinesisch (traditionell) zh-Hant Hani
Zulu zu Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-foundation-model-v1.0-2023-08-22 Stabile Version

Keine

Keine

Produktionsreife Lösung, die auf Dokumenten-Anwendungsfälle spezialisiert ist und auf speziellen Vision- und Foundation-Modellen basiert.
pretrained-foundation-model-v1.1-2024-03-12 Release-Kandidat

Keine

Keine

Release-Kandidat mit dem LLM Gemini 1.0 Pro und neu entwickelten Technologien, einschließlich spezieller Sprach- und Visionsmodelle. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung.
pretrained-foundation-model-v1.2-2024-05-10 Stabile Version

Keine

Keine

Produktionsreife Version, die auf dem LLM Gemini 1.5 Pro und neu entwickelten Technologien basiert, einschließlich spezieller Sprach- und Visionsmodelle. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Empfohlen für Nutzer, die die größten unterstützten Tokenlimits verwenden oder mit neueren Modellen experimentieren möchten.
pretrained-foundation-model-v1.3-2024-08-31 Stabile Version

Keine

Keine

Produktionsreife Version mit dem Gemini 1.5 Flash-LLM. Enthält auch erweiterte OCR-Funktionen wie die Kästchenerkennung. Empfohlen für Nutzer, die die niedrigste Latenz wünschen.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierter Extrahierer

Formularparser

Beschreibung

Zusätzlich zum OCR-Text werden allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahiert.

Dieser Prozessor verwendet fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in über 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren
Funktionen OCR, Formular-Parsing, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_PARSER_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Belarussisch be Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Koreanisch ko Kore
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Marathi mr Deva
Nepali ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-form-parser-v1.0-2020-09-23 Stabile Version

Keine

Keine

Alte Version. Die beste Qualität und die vollständige Funktionspalette erhalten Sie mit dem Formular-Parser 2.0.
pretrained-form-parser-v2.0-2022-11-10 Stabile Version
Felder anzeigen
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

Keine

Empfohlene Version. Unterstützt generische Entitäten und umfasst ein aktualisiertes Tabellen-, KVP- und Kästchenmodell sowie mehr als 200 Sprachen.
pretrained-form-parser-v2.1-2023-06-26 Release-Kandidat

Keine

Keine

Öffentliche Vorabversion. Dasselbe Modell wie Version 2.0, bei der die native Textextraktion aus digitalen PDF-Dateien aktiviert ist.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 100
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Formularparser

Layout-Parser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layout-Parser extrahiert Dokumentinhaltselemente wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren
Funktionen Layout-Parsing, Dokumentaufteilung
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben LAYOUT_PARSER_PROCESSOR
Hinweise
  • Dieser Parser unterstützt PDF-, HTML- und DOCX-Dateien.
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepali ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Panjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-layout-parser-v1.0-2024-06-03 Stabile Version

Keine

Keine

Empfohlene Version.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 500
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us
Weitere Informationen Layout-Parser

Vortrainierte Modelle ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben BANK_STATEMENT_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Entitätsextraktion für das erste unterstützte Dokument durch. Wenn der Prozessor keine entsprechenden Dokumente in der Eingabedatei findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-bankstatement-v1.0-2021-08-08 Stabile Version

Keine

Keine

pretrained-bankstatement-v1.1-2021-08-13 Stabile Version

Keine

Keine

pretrained-bankstatement-v2.0-2021-12-10 Stabile Version

Keine

Keine

pretrained-bankstatement-v3.0-2022-05-16 Stabile Version

Keine

Keine

Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird bei dieser Version die Eingabedatei nicht auf Kontoauszüge geprüft und es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
pretrained-bankstatement-v4.0-2023-07-31 Release-Kandidat

Keine

Keine

pretrained-bankstatement-v5.0-2023-12-06 Release-Kandidat

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 30
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • bank_address
  • bank_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Human-in-the-Loop
Anleitung zum Beschriften In neuem Fenster öffnen
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_W2_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Entitätsextraktion für das erste unterstützte Dokument durch. Wenn der Prozessor keine entsprechenden Dokumente in der Eingabedatei findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • 2020 (Standard- und benutzerdefinierte Versionen)
  • 2019 (Standard- und benutzerdefinierte Versionen)
  • 2018 (Standard- und benutzerdefinierte Versionen)
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-w2-v1.0-2020-10-01 Stabile Version

Keine

Keine

pretrained-w2-v1.1-2022-01-27 Stabile Version

Keine

Keine

pretrained-w2-v1.2-2022-01-28 Stabile Version
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Keine

Qualitätsverbesserungen und Unterstützung neuer Felder; enthält keinen Splitter.

pretrained-w2-v2.0-2022-03-30 Release-Kandidat
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Keine

Qualitätsverbesserungen und Unterstützung für Felder in Feld 12 sowie detaillierte Vorhersagen für EmployeeName, EmployeeAddress und EmployerNameAndAddress. Diese Felder sind nicht mehr Teil der Ausgabe und werden durch zusätzliche Felder ersetzt.

pretrained-w2-v2.1-2022-06-08 Stabile Version
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Keine

Ähnlich wie Version pretrained-w2-v2.0-2022-03-30, jedoch mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität EmployeeName_Suffix.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 15
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • EmployerNameAndAddress
  • EIN
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-amerikanische Reisepässe

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben US_PASSPORT_PROCESSOR
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-us-passport-v1.0-2021-06-14 Stabile Version

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Dienstprogrammparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen von Energieversorgern, z. B. den Lieferantennamen und den zuvor bezahlten Betrag.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Eingeschränkt [*]
API eingeben UTILITY_PROCESSOR
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-utility-v1.1-2021-04-09 Stabile Version

Keine

Keine

pretrained-utility-v1.2-2022-12-15 Release-Kandidat

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Human-in-the-Loop
Anleitung zum Beschriften In neuem Fenster öffnen
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für den Identitätsnachweis

Beschreibung

Gültigkeit von Ausweisdokumenten anhand mehrerer Signale vorhersagen

Der Prozessor für die Überprüfung von Ausweisdokumenten soll mit vier verschiedenen Signalen die Gültigkeit von Ausweisdokumenten vorhersagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

  • fraud_signals_is_identity_document-Erkennung: Es wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
  • fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs nicht typisch sind.
  • fraud_signals_image_manipulation-Erkennung: Vorhersage, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
  • fraud_signals_online_duplicate detection: Vorhersage, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert
Funktionen OCR, Qualitätsanalyse
Release-Phase Vorschau
Zugriffsstatus Öffentlich
API eingeben ID_PROOFING_PROCESSOR
Hinweise
  • Die Funktion zur Online-Duplikaterkennung wird derzeit in US-Rechenzentren verarbeitet. Regionale und multiregionale Unterstützung für diese Funktion ist außerhalb der USA nicht verfügbar.
  • Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ergebnisse zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Duplikaterkennung überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es bei Prozessorversionen möglich ist.
  • Weitere Informationen finden Sie in den Hinweisen zu verantwortungsbewusster KI[†] und zur manuellen Überprüfung.[‡]
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützung für US-amerikanische Reisepässe, Passkarten und Führerscheine
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-id-proofing-v1.0-2022-10-03 Stabile Version

Keine

Keine

pretrained-id-proofing-v1.1-2023-05-18 Release-Kandidat
Felder anzeigen
  • fraud_signals_photocopy_detection

Keine

Zusätzliches Signal zur Erkennung von Fotokopien

pretrained-id-proofing-v1.2-2023-10-04 Release-Kandidat
Felder anzeigen
  • fraud_signals_photocopy_detection

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben PAYSTUB_PROCESSOR
Hinweise
  • Wenn das mehrseitige Eingabedokument mehr als einen gültigen Lohnzettel enthält, extrahiert der Prozessor nur Entitäten aus dem ersten gültigen Lohnzettel. Wenn in der Eingabedatei keine Lohnabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-paystub-v1.0-2021-03-19 Stabile Version

Keine

Keine

pretrained-paystub-v1.1-2021-08-13 Stabile Version
Felder anzeigen
  • net_pay
  • net_pay_ytd
  • employee_account_number

Keine

Qualitätsverbesserung und Unterstützung neuer Felder
pretrained-paystub-v1.2-2021-12-10 Stabile Version

Keine

Keine

pretrained-paystub-v2.0-2022-05-17 Release-Kandidat
Felder anzeigen
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Keine

Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Lohnzettel enthält. Im Gegensatz zur Standardversion wird bei dieser Version die Eingabedatei nicht auf Lohnabrechnungen geprüft und es wird kein Fehler zurückgegeben, wenn keine Lohnabrechnungen gefunden werden.

Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. „Bonus“, „Provisionen“, „Urlaub“, „Überstunden“, „Reguläres Gehalt“ und „Urlaub“ sind jetzt Teil von „earning_item/earning_this_period“ und die entsprechenden Werte für das laufende Jahr sind unter „earning_item/earning_ytd“ zu finden. „Direktüberweisung“ und „Mitarbeiterkontonummer“ sind jetzt unter „direct_deposit_item“ verschachtelt.

Die maximale Anzahl von Seiten für asynchrone Abläufe beträgt 10.

pretrained-paystub-v2.0-2022-07-22 Stabile Version

Keine

Keine

Verbesserung der Qualität und der Weiterbildung

pretrained-paystub-v3.0-2023-12-06 Release-Kandidat

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 50
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • employer_address
  • employer_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Human-in-the-Loop
Anleitung zum Beschriften In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben US_DRIVER_LICENSE_PROCESSOR
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützt alle 50 Bundesstaaten und das Bundesdistrikt Washington.
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-us-driver-license-v1.0-2021-06-14 Stabile Version

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 2
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 2
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Spesendokumenten, z. B. Spesendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben EXPENSE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Französisch fr Latn
Japanisch ja Jpan
Niederländisch nl Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-expense-v1.1-2021-04-09 Stabile Version

Keine

Keine

Im April 2021 eingeführt. Die Einstellung ist bald geplant.
pretrained-expense-v1.2-2022-02-18 Stabile Version

Keine

Keine

pretrained-expense-v1.3-2022-07-15 Stabile Version
Felder anzeigen
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japanisch
Unterstützung für Hotel- und Mietwagen-Folios.
pretrained-expense-v1.3.2-2024-09-11 Release-Kandidat
Felder anzeigen
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japanisch
Upgrade auf Version 1.3 mit einem verbesserten zugrunde liegenden Bilderkennungsmodell.
pretrained-expense-v1.4-2022-11-18 Release-Kandidat
Felder anzeigen
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Leistungsverbesserungen und Unterstützung für Weiterbildungen Die maximale Anzahl von Seiten (online/synchrone Anfragen) wurde auf 15 erhöht.
pretrained-expense-v1.4.2-2024-09-12 Release-Kandidat
Felder anzeigen
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Bilderkennungsmodell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 10
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 10
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Human-in-the-Loop
Anleitung zum Beschriften In neuem Fenster öffnen
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungsparser extrahiert sowohl Kopf- als auch Positionenfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionenbeträge.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben INVOICE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Estnisch et Latn
Französisch fr Latn
Italienisch it Latn
Lettisch lv Latn
Litauisch lt Latn
Niederländisch nl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Schwedisch sv Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-invoice-v1.1-2021-04-09 Stabile Version

Keine

Keine

pretrained-invoice-v1.2-2022-02-18 Stabile Version

Keine

Keine

Die Einstellung ist bald geplant.
pretrained-invoice-v1.3-2022-07-15 Stabile Version

Keine

  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
  • ro: Rumänisch
  • sv: Schwedisch
  • et: Estnisch
  • lv: Lettisch
  • lt: Litauisch
Prozessorversion, die optimiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.4-2022-10-21 Release-Kandidat

Keine

Keine

Prozessorversion, die optimiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.5-2023-09-15 Release-Kandidat

Keine

Keine

pretrained-invoice-v2.0-2023-12-06 Release-Kandidat

Keine

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
In der ältesten Version erkannte Felder

Diese Informationen finden Sie auch auf der Seite Feld erkannt.

Vollständige Liste der Felder
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Eingebettete Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Human-in-the-Loop
Anleitung zum Beschriften In neuem Fenster öffnen
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_CLASSIFICATION_PROCESSOR
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 200
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung, Aufteilung
Release-Phase General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_SPLITTING_PROCESSOR
Hinweise
  • Die i18n-Unterstützung kann nur über benutzerdefinierte Trainingsoptionen erfolgen.
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 1000
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Dokumente zusammenfassen

Summarizer

Beschreibung

Sie können Zusammenfassungen in Form von Abstracts und Aufzählungspunkten für kurze und lange Dokumente abrufen.

Kategorie vorab trainiert
Funktionen Zusammenfassen
Release-Phase Vorschau
Zugriffsstatus Öffentlich
API eingeben SUMMARY_PROCESSOR
Unterstützte Sprachen
Sprache BCP-47-Tag Script Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Zusätzliche Felder erkannt Zusätzlich unterstützte Sprachen Beschreibung
pretrained-foundation-model-v1.0-2023-08-22 Stabile Version

Keine

Keine

Google-Grundlagenmodell

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Seiten (online/synchrone Anfragen): 15
Maximale Seitenzahl (Batch-/Offline-/asynchrone Anfragen): 250
Uptraining
Human-in-the-Loop
Beispiel für eine Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • us
Weitere Informationen Benutzerdefinierter Zusammenfassungsalgorithmus

Fußnoten

[*] Dieser Prozessor ist nur für Kunden mit eingeschränktem Zugriff verfügbar.

Wenn Sie den Zugriff auf diese API anfordern möchten, füllen Sie das Anfrageformular für den eingeschränkten Zugriff auf Document AI aus und reichen Sie es ein. Im Formular müssen Sie Informationen über sich, Ihr Unternehmen und Ihren Anwendungsfall angeben. Für den Zugriff ist eine Google Cloud-Projekt-ID erforderlich. Halten Sie sich an diese Anleitung, um ein neues Google Cloud-Projekt zu erstellen oder die Projekt-ID eines vorhandenen Projekts zu ermitteln.

Nachdem Sie das Formular gesendet haben, prüft das Document AI-Team Ihre Anfrage, um sicherzustellen, dass Sie die Kriterien für den Zugriff erfüllen. Bei Genehmigung erhalten Sie eine E-Mail mit einer Anleitung dazu, wie Sie auf diese Funktion zugreifen und sie verwenden können.

[†] Bei der Überprüfung von Ausweisen werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudhelfen wir Kunden bei der sicheren Entwicklung und Implementierung von KI-Lösungen. Die Identitätsbestätigung wurde gemäß den KI-Prinzipien von Google entwickelt.

Auf der Grundlage der KI-Grundsätze von Google und des aktuellen Produktdesigns empfehlen wir dringend, die potenziellen Vorteile und Risiken der Bestätigung per Ausweis für die folgenden Zwecke sorgfältig zu prüfen:

  • Entscheidungen ohne menschliches Zutun bei Vorhersagen, die sich auf Menschenrechte auswirken können.
  • In sensiblen Bereichen, einschließlich, aber nicht beschränkt auf Beschäftigung, Zugang zu öffentlichen Dienstleistungen, Gesundheitswesen und sicherheitskritische Kontexte.

[‡] Verwenden Sie die Identitätsbestätigung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie in Ihrem Workflow einen menschlichen Prüfer haben, der prüft, ob die vorhergesagten Signale korrekt sind. Der Prozessor für die Identitätsbestätigung soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern die Prüfer bei der Validierung von Ausweisen unterstützen. Der Identitätsbestätigungs-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um zu bestimmen, ob ein Ausweis gültig ist. Mit manuellen Überprüfungen können Kunden die Genauigkeit der Dokumentenverarbeitung verbessern und Unternehmen dabei helfen, Vorhersagen mithilfe speziell entwickelter Tools zu bewerten.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie implementieren, und informieren Sie sich über bestehende Branchenleitfäden, um mehr über Richtlinien und häufig auftretende Probleme im Hinblick auf Fairness zu erfahren. Hier finden Sie Informationen zu Fairness im Bereich maschinelles Lernen, einschließlich Möglichkeiten zur Minimierung von Verzerrungen in Trainingsdatensätzen, zur Bewertung Ihrer benutzerdefinierten Modelle auf Leistungsunterschiede und zu anderen Aspekten bei der Verwendung Ihres benutzerdefinierten Modells.

Wir empfehlen Kunden, bei der Implementierung der Identitätsbestätigung die Fairness, Interpretierbarkeit sowie Best Practices für Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel-Repository für Anwendungscode finden Sie im Blogpost Automate identity document processing with Document AI].