Vortrainierte Modelle – Übersicht

Document AI bietet mehrere Produkte zum Verarbeiten von Dokumenten für Informationen für verschiedene Anwendungsfälle.

Vortrainierte Parser

Weitere Informationen finden Sie unter Vortrainierte Prozessoren.

Kontoauszugsparser

Der Kontoauszugsparser extrahiert Schlüssel/Wert-Paare. Es können bis zu 17 allgemeine Entitäten extrahiert werden. Beispiele: Kontonummer, Kundenname, Bankname und Tabellenelemente wie Einzahlungen und Abhebungen. Sie geben die Felder (das Schema) an, die Sie extrahieren möchten. Der Kontoauszugsparser unterstützt Anreicherung und Normalisierung.

W2-Parser

Der W2-Parser extrahiert Daten aus dem IRS-Formular W2 als KVP. Es können bis zu 12 generische Einheiten extrahiert werden, darunter Name des Mitarbeiters, Sozialversicherungsnummer, Arbeitgeber und Lohn. Sie geben die Felder (das Schema) nicht an, die Sie extrahieren möchten. Der W2-Parser unterstützt Enrichment.

Parser für US-amerikanische Reisepässe

Der Parser für US-amerikanische Reisepässe extrahiert KVP. Es können bis zu sieben generische Einheiten extrahiert werden. Dazu gehören Vor- und Nachnamen, Ausweis-ID und Geburtsdatum. Sie geben die Felder (das Schema) nicht an, die Sie extrahieren möchten. Der Parser für US-amerikanische Reisepässe unterstützt die Normalisierung.

Dienstprogrammparser

Der Dienstprogrammparser extrahiert Schlüssel/Wert-Paare. Es können bis zu 75 allgemeine Einheiten aus Rechnungen für Versorgungsleistungen extrahiert werden. Dazu gehören der Name des Lieferanten, der zuvor bezahlte Betrag und Positionen wie Betrag, Beschreibung, Produktcode und Menge. Sie geben die Felder (das Schema), die Sie mit dem Utility-Parser extrahieren möchten, nicht an.

Parser für die Überprüfung von Ausweisdokumenten

Der Parser für die Überprüfung von Identitätsdokumenten sagt die Gültigkeit von Identitätsdokumenten anhand mehrerer Signale voraus.

  • fraud_signals_is_identity_document-Erkennung: Hier wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
  • fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs untypisch sind.
  • fraud_signals_image_manipulation-Erkennung: Hier wird vorhergesagt, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
  • fraud_signals_online_duplicate-Erkennung: Es wird vorhergesagt, ob das Bild online gefunden werden kann (nur USA).

Lohnabrechnungsparser

Der Lohnabrechnungsparser extrahiert Schlüssel/Wert-Paare. Es kann bis zu 26 allgemeine Einheiten aus Gehaltsabrechnungen extrahieren. Dazu gehören der Name des Mitarbeiters, Boni, Provisionen, Überstunden und das Zahlungsdatum. Sie geben die Felder (das Schema) an, die Sie extrahieren möchten. Der Gehaltsabrechnungs-Parser unterstützt Anreicherung und Normalisierung.

Parser für US-Führerscheine

Der Parser für US-Führerscheine extrahiert KVP. Es können bis zu acht generische Einheiten aus einem Führerschein extrahiert werden. Beispiele: Vorname, Nachname, Ausweis-ID und Ablaufdatum. Sie geben die Felder (das Schema) nicht an, die Sie extrahieren möchten. Der Parser für US-Führerscheine unterstützt die Normalisierung.

Kostenparser

Der Kostenparser extrahiert Schlüssel/Wert-Paare. Es kann bis zu 17 allgemeine Entitäten aus Spesenabrechnungen extrahieren. Beispiele: Kostendatum, Lieferantenname, Gesamtbetrag und Währung. Sie geben die Felder (das Schema) an, die Sie extrahieren möchten. Der Ausgaben-Parser unterstützt Anreicherung und Normalisierung.

Rechnungsparser

Der Rechnungsparser extrahiert KVP. Es können bis zu 46 allgemeine Entitäten aus Rechnungen extrahiert werden. Dazu gehören Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum und Fälligkeitsdatum. Sie geben die Felder (das Schema) an, die Sie extrahieren möchten. Der Rechnungsparser unterstützt Anreicherung und Normalisierung.

Summarizer

Mit Summarizer können Sie Zusammenfassungen in Form von Abstracts und Stichpunkten für kurze und lange Dokumente erstellen. Mit Summarizer können Sie auch die Länge der Zusammenfassung festlegen: umfassend, mittel oder kurz.