Token

Stellt den kleinsten syntaktischen Baustein des Textes dar.

JSON-Darstellung
{
  "text": {
    object (TextSpan)
  },
  "partOfSpeech": {
    object (PartOfSpeech)
  },
  "dependencyEdge": {
    object (DependencyEdge)
  },
  "lemma": string
}
Felder
text

object (TextSpan)

Der Tokentext.

partOfSpeech

object (PartOfSpeech)

Das Wortart-Tag für dieses Token.

dependencyEdge

object (DependencyEdge)

Das Parsing der Abhängigkeitsstruktur für dieses Token.

lemma

string

Das Lemma des Tokens.

PartOfSpeech

Stellt Wortartinformationen für ein Token dar. Wortarten werden in http://www.lrec-conf.org/proceedings/lrec2012/pdf/274_Paper.pdf definiert.

JSON-Darstellung
{
  "tag": enum (Tag),
  "aspect": enum (Aspect),
  "case": enum (Case),
  "form": enum (Form),
  "gender": enum (Gender),
  "mood": enum (Mood),
  "number": enum (Number),
  "person": enum (Person),
  "proper": enum (Proper),
  "reciprocity": enum (Reciprocity),
  "tense": enum (Tense),
  "voice": enum (Voice)
}
Felder
tag

enum (Tag)

Das Wortart-Tag.

aspect

enum (Aspect)

Der grammatische Aspekt.

case

enum (Case)

Der grammatische Fall.

form

enum (Form)

Die grammatische Form.

gender

enum (Gender)

Das grammatische Geschlecht.

mood

enum (Mood)

Der grammatische Modus.

number

enum (Number)

Der grammatische Numerus.

person

enum (Person)

Die grammatische Person.

proper

enum (Proper)

Die grammatische Korrektheit.

reciprocity

enum (Reciprocity)

Die grammatische Reziprozität.

tense

enum (Tense)

Die grammatische Zeitform.

voice

enum (Voice)

Die grammatische Diathese.

Tag

Die Enum der Wortart-Tags.

Enums
UNKNOWN Unbekannt
ADJ Adjektiv
ADP Adposition (Präposition und Postposition)
ADV Adverb
CONJ Konjunktion
DET Determinativ
NOUN Substantiv (Gattungs- und Eigennamen)
NUM Kardinalzahl
PRON Pronomen
PRT Partikel oder anderes Funktionswort
PUNCT Satzzeichen
VERB Verb (alle Zeiten und Modi)
X Sonstiges: Fremdwörter, Tippfehler, Abkürzungen
AFFIX Affix

Aspect

Die Eigenschaft eines Verbs, die den Zeitverlauf während eines Ereignisses ausdrückt.

Enums
ASPECT_UNKNOWN "Aspect" ist nicht auf die analysierte Sprache anwendbar oder wird nicht vorhergesagt.
PERFECTIVE Perfektiv
IMPERFECTIVE Imperfektiv
PROGRESSIVE Progressiv

Case

Die grammatische Funktion, die ein Substantiv oder Pronomen in einer Wortgruppe, einem Satzteil oder einem Satz erfüllt. Bei einigen Sprachen kongruieren andere Wortarten (z. B. Adjektiv und Determinativ) im Kasus mit dem Substantiv.

Enums
CASE_UNKNOWN "Case" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ACCUSATIVE Akkusativ
ADVERBIAL Adverbial
COMPLEMENTIVE Komplementär
DATIVE Dativ
GENITIVE Genitiv
INSTRUMENTAL Instrumental
LOCATIVE Lokativ
NOMINATIVE Nominativ
OBLIQUE Abhängig
PARTITIVE Partitiv
PREPOSITIONAL Präpositional
REFLEXIVE_CASE Reflexiv
RELATIVE_CASE Ergativ
VOCATIVE Vokativ

Form

Je nach Sprache kann die Form in verschiedene Formen von Verben, Adjektiven, Adverbien usw. unterteilt werden. Beispielsweise werden flektierte Endungen von Verben und Adjektiven kategorisiert oder es wird zwischen Kurz- und Langformen von Adjektiven und Partizipien unterschieden.

Enums
FORM_UNKNOWN "Form" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ADNOMIAL Adnominal
AUXILIARY Hilfsverb
COMPLEMENTIZER Komplementierer
FINAL_ENDING Endsuffix
GERUND Gerundium
REALIS Realis
IRREALIS Irrealis
SHORT Kurzform
LONG Langform
ORDER Befehlsform
SPECIFIC Sonderform

Gender

Genusklassen von Substantiven spiegeln sich im Verhalten assoziierter Wörter wider.

Enums
GENDER_UNKNOWN "Gender" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
FEMININE Feminin
MASCULINE Maskulin
NEUTER Neutrum

Mood

Das grammatische Merkmal von Verben, das die Modalität und damit die subjektive Stellungnahme des Sprechers zur Satzaussage zum Ausdruck bringt.

Enums
MOOD_UNKNOWN "Mode" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
CONDITIONAL_MOOD Konditional
IMPERATIVE Imperativ
INDICATIVE Indikativ
INTERROGATIVE Interrogativ
JUSSIVE Jussiv
SUBJUNCTIVE Konjunktiv

Number

Die numerischen Unterscheidungen.

Enums
NUMBER_UNKNOWN "Number" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
SINGULAR Singular
PLURAL Plural
DUAL Dual

Person

Die Unterscheidung zwischen dem Sprecher, der zweiten Person, der dritten Person usw.

Enums
PERSON_UNKNOWN "Person" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
FIRST Erste Person
SECOND Zweite Person
THIRD Dritte Person
REFLEXIVE_PERSON Reflexive Person

Proper

Diese Kategorie zeigt, ob das Token Teil eines Eigennamens ist.

Enums
PROPER_UNKNOWN "Proper" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
PROPER Eigenname
NOT_PROPER Kein Eigenname

Reciprocity

Bezeichnet die reziproken Eigenschaften eines Pronomens.

Enums
RECIPROCITY_UNKNOWN "Reciprocity" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
RECIPROCAL Reziprok
NON_RECIPROCAL Nicht reziprok

Tense

Die Zeitreferenz.

Enums
TENSE_UNKNOWN "Tense" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
CONDITIONAL_TENSE Konditional
FUTURE Futur
PAST Präteritum
PRESENT Präsens
IMPERFECT Imperfekt
PLUPERFECT Plusquamperfekt

Voice

Die Beziehung zwischen der Handlung, die ein Verb ausdrückt, und den Partizipanten, die durch die zugehörigen Argumente bestimmt werden (Aktiv bzw. Passiv).

Enums
VOICE_UNKNOWN "Voice" ist auf die analysierte Sprache nicht anwendbar oder wird nicht vorhergesagt.
ACTIVE Aktiv
CAUSATIVE Kausativ
PASSIVE Passiv

DependencyEdge

Gibt Informationen zu Abhängigkeitsstrukturen für ein Token an. Weitere Informationen zu Abhängigkeitslabels finden Sie unter http://www.aclweb.org/anthology/P13-2017.

JSON-Darstellung
{
  "headTokenIndex": integer,
  "label": enum (Label)
}
Felder
headTokenIndex

integer

Stellt den Kopf dieses Tokens in der Abhängigkeitsstruktur dar. Dies ist der Index des Tokens, der auf dieses Token zeigt. Der Index ist die Position des Tokens im Array der Tokens, die von der API-Methode zurückgegeben werden. Wenn dieses Token ein Stammtoken ist, ist headTokenIndex sein eigener Index.

label

enum (Label)

Das Parse-Label für das Token.

Label

Die Parse-Label-Enum für das Token.

Enums
UNKNOWN Unbekannt
ABBREV Abkürzungsmodifikator
ACOMP Adjektivkomplement
ADVCL Modifikator in Form eines Adverbialsatzes
ADVMOD Adverbialer Modifikator
AMOD Adjektivischer Modifikator einer Nominalphrase
APPOS Appositioneller Modifikator einer Nominalphrase
ATTR Von einem Kopulaverb abhängiges Attribut
AUX Hilfsverb (kein Hauptverb)
AUXPASS Passives Hilfsverb
CC Koordinierende Konjunktion
CCOMP Satzkomplement eines Verbs oder Adjektivs
CONJ Konjunktion
CSUBJ Subjektsatz
CSUBJPASS Satzförmiges Subjekt eines Passivverbs
DEP Abhängigkeit (nicht bestimmbar)
DET Determinativ
DISCOURSE Diskurs
DOBJ Direktes Objekt
EXPL Expletiv
GOESWITH Begleitet (Teil eines Wortes in einem nicht gut bearbeiteten Text)
IOBJ Indirektes Objekt
MARK Marker (Wort, das einen Nebensatz einführt)
MWE Mehrwortausdruck
MWV Verbaler Mehrwortausdruck
NEG Negationsmodifikator
NN Modifikator in einem Nominalkompositum
NPADVMOD Nominalphrase, die als adverbialer Modifikator verwendet wird
NSUBJ Nominalphrase als Subjekt
NSUBJPASS Nominalphrase als Subjekt eines Passivsatzes
NUM Numerischer Modifikator eines Substantivs
NUMBER Element einer zusammengesetzten Zahl
P Satzzeichen
PARATAXIS Koordinative Beziehung
PARTMOD Partizipialer Modifikator
PCOMP Das Komplement einer Präposition ist ein Teilsatz
POBJ Objekt einer Präposition
POSS Possessiver Modifikator
POSTNEG Postverbale Negationspartikel
PRECOMP Prädikativkomplement
PRECONJ Beziehung zwischen dem Kopf einer Nominalphrase und dem Bestandteil eines konjunktionalen Konnektors im ersten Konjunkt einer initialen Koordination
PREDET Prädeterminativ
PREF Präfix
PREP Präpositionaler Modifikator
PRONL Die Beziehung zwischen einem Verb und einem verbalen Morphem
PRT Partikel
PS Assoziativ- oder Possessivmarker
QUANTMOD Quantifikatorphrasenmodifikator
RCMOD Modifikator in Form eines Relativsatzes
RCMODREL Komplementierer in Relativsatz
RDROP Ellipse ohne vorangestelltes Prädikat
REF Referent
REMNANT Rest
REPARANDUM Reparandum
ROOT Wortstamm
SNUM Suffix, das den Numerus kennzeichnet
SUFF Suffix
TMOD Temporaler Modifikator
TOPIC Themamarker
VMOD Teilsatz, dem eine finite Form des Verbs vorangestellt wird, das ein Substantiv modifiziert
VOCATIVE Vokativ
XCOMP Offenes prädikatives Komplement
SUFFIX Namenssuffix
TITLE Titel
ADVPHMOD Modifikator in Form einer Adverbialphrase
AUXCAUS Kausatives Hilfsverb
AUXVV Hilfsverb
DTMOD Rentaishi (pränominaler Modifikator)
FOREIGN Fremdwörter
KW Schlüsselwort
LIST Listenförmige Struktur bei Aneinanderreihungen vergleichbarer Einheiten
NOMC Nominalisierter Satz
NOMCSUBJ Nominalisierter Subjektsatz
NOMCSUBJPASS Nominalisiertes satzförmiges Subjekt eines Passivverbs
NUMC Zusammengesetzter numerischer Modifikator
COP Kopula
DISLOCATED Dislokation (bei Vorfeld-/topikalisierten Konstituenten)
ASP Aspektmarker
GMOD Genitivischer Modifikator
GOBJ Genitivobjekt
INFMOD Infinitivischer Modifikator
MES Maß
NCOMP Nominales Komplement eines Substantivs