Textklassifizierung
Ausgangspunkt ist die folgende Texteingabe:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Die Ausgabe ist eine Liste von Ergebnissen, die in die folgenden Kategorien gegliedert sind:
InfoType
Likelihood
Offset
(wo im String der potenzielleInfoType
gefunden wurde)
Die Beispielausgabe ist in der folgenden Tabelle dargestellt.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Automatisches Entfernen von Text
Beim automatischen Entfernen erhalten Sie anstelle einer Ergebnisliste direkt eine Ausgabe, bei der die sensiblen Daten bereits entfernt sind.
Beispieleingabe für automatisches Entfernen:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Beispielausgabe mit einem Platzhalter vom Typ "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Ressourcen
- Weitere Informationen dazu, wie Sie den Schutz sensibler Daten zum Entfernen von Text verwenden, finden Sie unter Sensible Daten aus Textinhalten entfernen.
- Weitere Informationen zur Verwendung des Schutzes sensibler Daten zum De-Identifizieren sensibler Daten in Textinhalten, einschließlich des Maskierens sensibler Daten, des Ersetzens sensibler Daten durch einen „Token“-String und des Verschlüsselns und Ersetzens sensibler Daten mit einem zufällig generierten oder vordefinierten Schlüssel, finden Sie unter Sensible Daten in Textinhalten de-identifizieren.