Morphologie & Abhängigkeitsstrukturen

Die Methode analyzeSyntax gibt Details zur linguistischen Struktur des gegebenen Textes zurück. Die Natural Language API liefert zu jedem Token im Text Informationen über seine interne Struktur (Morphologie) und seine Rolle im Satz (Syntax).

Morphologie ist die Lehre von der inneren Struktur von Wörtern. Bei der Morphologie geht es hauptsächlich darum, wie die Komponenten in einem Wort (Stämme, Stammwörter, Präfixe, Suffixe usw.) angeordnet oder verändert werden und dabei verschiedene Bedeutungen annehmen. In der englischen Sprache beispielsweise wird der Plural eines Substantivs häufig durch Anfügen von "-s" oder "-es" gebildet. Das Imperfekt wird gebildet, indem "-d" oder "-ed" an ein Verb angefügt wird. Das Suffix "-ly" wird Adjektiven hinzugefügt, um Adverbien zu erstellen (z. B. "happy" [Adjektiv] und "happily" [Adverb]).

Die Natural Language API erschließt anhand der morphologischen Analyse grammatische Informationen zu Wörtern.

Bei der Morphologie gibt es von Sprache zu Sprache große Unterschiede. In Sprachen wie Russisch geben Wortendungen die Rolle eines Wortes in einem Satz an (z. B. "книга" [Buch – Nominativ] wird zu "книгу" [Akkusativ], wenn es das direkte Objekt eines Verbs ist). Dies bedeutet, dass die Wortreihenfolge variieren kann, ohne dass die Bedeutung des Satzes geändert wird, obwohl eine unterschiedliche Wortreihenfolge die kontextabhängige Eignung beeinflusst. Sprachen wie Englisch und Mandarin, die keine Affixe kennen, um den Fall anzugeben, hängen eher von der Reihenfolge der Wörter in einem Satz ab, um die jeweilige Rolle der Wörter anzuzeigen. Daher hängt die morphologische Analyse stark von der Ausgangssprache und dem Verständnis ab, was in dieser Sprache unterstützt wird.

Die Syntax beschäftigt sich mit der Struktur von Wortgruppen und Sätzen. Syntax und Morphologie beschreiben grammatische Beziehungen. Die Arbeitsteilung dieser linguistischen Teildisziplinen ist je nach Sprache unterschiedlich. Beispielsweise wird im Russischen die Rolle des direkten Objekts durch ein Affix ausgedrückt, wie "у" im Wort "книгу". Im Englischen geschieht dies dagegen durch die Reihenfolge der Wörter, wobei das direkte Objekt auf das Verb folgt, z. B. "read the book" (lesen Sie das Buch).

Die Methode analyzeSyntax gibt als Ergebnis morphologische Informationen im Feld partOfSpeech und die syntaktische Beziehung zwischen den Wörtern im Feld dependencyTree zurück.

Wortarten

Bei einer Syntaxanfrage werden Informationen zur Wortart und Morphologie im Feld partOfSpeech der Antwort zurückgegeben. Das partOfSpeech-Feld enthält eine Reihe von Unterfeldern mit Informationen zur Wortart (Part-of-Speech, POS) sowie ausführliche morphologische Informationen. Diese Unterfelder werden unten aufgelistet.

  • tag gibt mit einem groben POS-Tag (SUBSTANTIV, VERB usw.) die Wortart an und stellt allgemeine Syntaxinformationen auf oberster Ebene bereit. POS-Tags sind nützlich, wenn Sie Muster erstellen und/oder die Mehrdeutigkeit für die nachfolgende Sprachanalyse verringern möchten, z. B. "train" mit der Tag-Kennzeichnung SUBSTANTIV und nicht VERB.

  • number gibt den grammatischen Numerus eines Worts an. Im Englischen wird das Suffix "-s" an zählbare Nomen angehängt, um deren Plural auszudrücken, z. B. gibt "dog + s" an, dass es sich um mehr als einen Hund handelt. Fehlt das Pluralsuffix, handelt es sich um die Singularform. Einige Sprachen wie Arabisch haben außerdem das Konzept einer Zweizahl. Dieses Feld kann die folgenden Werte enthalten:

    • SINGULAR gibt eine Anzahl an.
    • PLURAL gibt mehr als eine Anzahl an.
    • DUAL gibt genau zwei Anzahlen an.
  • person gibt die grammatische Person eines Worts an. Im Englischen gibt "I/me" (ich/mich) die erste Person Singular an und bezieht sich auf den Sprecher (oder Autor) eines Ausdrucks. Dagegen bezeichnen "you" (du), "she/her" (sie/ihr) und "he/him" (er/ihn/ihm) den Adressaten (Zuhörer) bzw. eine weitere Person. Dieses Feld kann die folgenden Werte enthalten:

    • FIRST bezeichnet den Sprecher.
    • SECOND bezeichnet den beabsichtigten Adressaten, also die Person, mit der gesprochen wurde.
    • THIRD bezeichnet Nicht-Sprecher/Nicht-Hörer.
    • REFLEXIVE_PERSON gibt beispielsweise an, dass Subjekt und Objekt auf dieselbe Entität verweisen, wie bei "The cat licked itself" (die Katze leckte sich selbst). In diesem Fall wird "-self" (selbst) einem Pronomen hinzugefügt, um die Reflexivität auszudrücken. Im Russischen und Japanischen ist das Reflexiv ein separates Pronomen. "John loves himself" (John liebt sich selbst) heißt auf Russisch beispielsweise "Джон любит себя", wobei "себя" geschlechtsneutral das Wort "self" (selbst) ausdrückt. Im Japanischen heißt der Satz in der romanisierten Version "Tarō wa zibun o aisuru", wobei hier "zibun" geschlechtsneutral "self" ausdrückt. Siehe Reflexivpronomen.
  • gender gibt das grammatische Genus eines Nomens an. Dieses Feld kann die folgenden Werte enthalten:

    • Das Genus FEMININE
    • Das Genus MASCULINE
    • Das Genus NEUTER
  • case bezeichnet den grammatischen Fall eines Worts und seine Rolle in einer Wortgruppe oder einem Satz. Dieses Feld kann die folgenden Werte enthalten:

    • Der ACCUSATIVE-Fall gibt das direkte Objekt eines transitiven Verbs an.
    • Der ADVERBIAL-Fall gibt die adverbiale Form eines Adjektivs an. Beachten Sie, dass in der englischen Sprache verschiedene Wörter verwendet werden, um Adverbien ("well") und Adjektive ("good") voneinander zu unterscheiden. Mit dem Suffix "-ly" werden im Englischen Adverbien von Adjektiven abgeleitet (z. B. "happy", "happily"), obwohl es nicht als "Fall" gilt.
    • Der COMPLEMENTIVE-Fall (Chinesisch) gibt ein Wort an, das erforderlich ist, um die Bedeutung eines potenziellen, beschreibenden oder resultativen Ausdrucks mit einem Konjunktivpartikel zu vervollständigen.
    • Der DATIVE-Fall gibt ein indirektes Objekt an, das sich auf den Referenten bezieht, der das direkte Objekt erhält. Im Englischen wird das indirekte Objekt häufig durch die Präposition "to" angegeben, wie im Satz "He gave the ball to Bobby" (Er gab Bobby den Ball). "Bobby" ist hierbei das indirekte Objekt und somit der Empfänger des Balls. Im russischen Beispiel "Иван дал книгу маше" (Iwan gab Masha das Buch) gibt dagegen "-e" an, dass "маше" das indirekte Objekt und somit Masha die Empfängerin des Buchs ist.
    • Der GENITIVE-Fall gibt ein Besitzverhältnis an. Beachten Sie, dass Besitzverhältnisse im Englischen häufig mithilfe des Affixes "-'s" anstelle eines Genitivs angegeben werden. Das Affix "-'s" kann an das Ende einer Wortgruppe angehängt werden, z. B. "[The man who ran the bill up]’s wife paid a dear price for his excess." (Die Frau des [Manns, der die Rechnung in die Höhe getrieben hatte,] zahlte für seine Ausschweifung einen hohen Preis.). Im russischen Beispiel "Где книга Антона?" wird dagegen das Wort "Антон-" durch das Suffix "-а" als Genitiv gekennzeichnet: "Где книга Антона?" (Wo ist Antons Buch?). Im Russischen wird der Genitiv auch im Komplement von Wörtern wie "mehrere" oder "wenige" ausgedrückt. Im Beispiel "Зимой здесь мало снега" (Im Winter liegt hier wenig Schnee) wird "снег-" (Schnee) durch "-a" als Genitiv gekennzeichnet, da es das Komplement von "мало" (wenig) ist. Hier geht es jedoch um kein Besitzverhältnis.
    • Der INSTRUMENTAL-Fall gibt an, ob ein Substantiv das Mittel ist, mit dem eine Handlung ausgeführt wird. Der Satz "Er öffnete die Tür mit einem Schlüssel" lautet auf Russisch "он открыл дверь ключом", wobei an "ключ" (Schlüssel) "-om" angehängt wurde, um den Instrumentalis anzuzeigen.
    • Der LOCATIVE-Fall gibt bei einem Wort die räumliche Beziehung zu einem Ort an. Im Englischen und Deutschen gibt es keinen Lokativ.
    • Der NOMINATIVE-Fall gibt das Subjekt eines Verbs an. Im Englischen wird das Subjekt eines Satzes durch die Wortstellung angegeben und nicht durch einen Kasus. In dem Satz "The girl won the race" (Das Mädchen gewann das Rennen) ist die Wortgruppe "the girl" (das Mädchen) das Subjekt, das links vom Verb "won" (gewann) steht. Im Russischen kann "девушка" (the/a girl bzw. das/ein Mädchen) entweder vor oder nach dem Verb stehen, "девушка выиграла гонку" oder "гонку выиграла девушка", wobei "выиграла" (won bzw. gewann) das Verb ist.
    • Der OBLIQUE-Fall gibt an, ob ein Wort als Objekt für ein Verb oder eine Präposition verwendet wird.
    • Der PARTITIVE-Fall gibt die "Unvollständigkeit" eines Wortes oder das Fehlen einer bestimmten Identität an. Ein Beispiel für den Partitiv im Englischen ist "three of my friends" (drei von meinen Freunden). Auf Russisch lautet dies "трое моих друзей", wobei "трое" für "three of" (drei von) steht. Im Vergleich dazu steht bei "три друга" das Wort "три" für "three" (drei).
    • Der PREPOSITIONAL-Fall gibt das Objekt einer Präposition an.
    • Der REFLEXIVE_CASE gibt die Identität eines Objekts eines Verbs zu seinem Subjekt an. In den meisten Sprachen ist kein reflexiver Fall vorhanden, da er durch die Verwendung eines bestimmten Reflexivpronomens, wie z. B. "himself", "myself" usw., angegeben wird.
    • Der RELATIVE_CASE (Chinesisch) gibt den Komplementierer eines Relativsatzes an und verbindet ein Substantiv mit einem Verb oder Adjektiv. Beispiele: 工作 [的] 地方 (Arbeit [] Ort :: "Ort, [an dem ich] arbeite"). 便宜 的 餐馆 (preiswerte [] Restaurants :: Restaurants, [die] preiswert sind).
    • Der VOCATIVE-Fall gibt ein Substantiv an, mit dem jemand oder etwas angesprochen wird, normalerweise als Anrede in einem Gespräch.
  • tense gibt die grammatische Zeitform eines Verbs an und steht für den Verweis des Verbs auf einen Zeitpunkt. Beachten Sie, dass sich tense von aspect unterscheidet. Bei Letzterem geht es zwar auch um das Verhältnis des Verbs zur Zeit. Im Mittelpunkt stehen aber die Merkmale dieses Zeitverlaufs statt des Zeitpunkts. Die Tempora IMPERFECT und PLUPERFECT beziehen sich in vielen Sprachen genauer genommen auf bestimmte Kombinationen von Tempus und Aspekt. Dieses Feld kann die folgenden Werte enthalten:

    • CONDITIONAL_TENSE ist ein alternativer Begriff für den häufiger verwendeten morphologischen Begriff "Konditionalis". Weitere Informationen finden Sie unten unter CONDITIONAL_MOOD.
    • FUTURE bezeichnet eine Handlung, die in der Zukunft stattfinden wird. Beachten Sie, dass das Futur im Englischen häufig durch das Hinzufügen des Wortes "will" zu einer Verbalphrase ausgedrückt wird.
    • PAST bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat.
    • PRESENT bezeichnet eine Handlung, die in der Gegenwart stattfindet.
    • IMPERFECT bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat, aber im Bezugsrahmen dieses Tempus nicht abgeschlossen wurde. Beachten Sie, dass das Imperfekt im Englischen meistens durch das Hinzufügen eines Gerundiums (der substantivierten Form eines Verbs) an die Vergangenheitsform ausgedrückt wird, wie in "I was walking". Ein Ereignis im Imperfekt hat in der Vergangenheit stattgefunden, ist jedoch im Verhältnis zu diesem Tempus nicht abgeschlossen.
    • PLUPERFECT bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat und im Bezugsrahmen dieses Tempus auch abgeschlossen wurde. Zum Beispiel fand "I had walked" in der Vergangenheit statt, wurde jedoch im Bezugsrahmen der Vergangenheitsform auch abgeschlossen.
  • aspect bezeichnet den grammatischen Aspekt eines Verbs und ist ein Ausdruck des Zeitverlaufs. Im Gegensatz zu tense mit Fokus auf der zeitlichen Stellung eines Verbs liegt der Fokus beim aspect auf den Merkmalen des Zeitverlaufs, in dem sich der Aspekt ereignet. Dieses Feld kann die folgenden Werte enthalten:

    • Der Aspekt PERFECTIVE bezeichnet ein Ereignis, das "abgeschlossen" ist, entweder weil es sich in der Vergangenheit vollständig ereignet hat oder weil es in der Zukunft vollständig abgeschlossen wird.
    • Der Aspekt IMPERFECTIVE bezeichnet ein unvollständiges Ereignis, das entweder andauert oder sich wiederholt.
    • Der Aspekt PROGRESSIVE bezeichnet ein fortlaufendes Ereignis. Ein progressiver Aspekt wird im Allgemeinen wie ein Sonderfall eines allgemeineren imperfekten Aspekts, der auch Wiederholungen umfasst, behandelt.

  • mood bezeichnet den grammatischen Modus eines Verbs und vermittelt die Einstellung zu einer zugrunde liegenden Handlung. Dieses Feld kann die folgenden Werte enthalten:

    • CONDITIONAL_MOOD bezeichnet eine bedingte Handlung. Beachten Sie, dass Verbformen im Englischen nicht konditional sind. Stattdessen wird konditionales Verhalten durch die Verwendung des Wortes "would" zusammen mit dem Infinitiv des Verbs angegeben.
    • IMPERATIVE bezeichnet einen Befehl oder eine Bitte, wobei die 2. Person verwendet wird.
    • INDICATIVE bezeichnet eine Aussage und wird allgemein "Modus realis" genannt.
    • INTERROGATIVE bezeichnet eine Frage.
    • JUSSIVE bezeichnet einen Befehl oder eine Bitte, wobei die 1. oder 3. Person verwendet wird. Im Englischen ist kein Jussiv vorhanden, aber er wird durch Ausrufe, die mit einem realen oder implizierten "Let us" beginnen, ausgedrückt.
    • SUBJUNCTIVE bezeichnet einen Zustand der Ungewissheit in Bezug auf eine Handlung. Der Subjunktiv wird auch "Irrealis" genannt, im Gegensatz zum indikativischen "Realis". Im Englischen ist kein bestimmter Subjunktiv vorhanden. Stattdessen wird er durch Wörter wie "want", "wish", "hope" usw. ausgedrückt.
  • voice bezeichnet die Diathese eines Verbs, also den Zusammenhang zwischen einer Handlung und einem Subjekt und/oder Objekt. Dieses Feld kann die folgenden Werte enthalten:

    • Die Diathese ACTIVE bezeichnet eine Handlung, die von einem Subjekt ausgeführt wird.
    • Die Diathese CAUSATIVE bezeichnet eine Handlung, die sich auf das Subjekt auswirkt. Im Englischen ist kein Kausativ vorhanden. Stattdessen wird solche Kausalität durch die Verwendung des Verbs "make", wie in "Mom made me go to school", angegeben.
    • Die Diathese PASSIVE bezeichnet eine Handlung, die sich auf das Subjekt auswirkt. In vielen Fällen ist der passive "Agent" nicht benannt oder bekannt.
  • reciprocity bezeichnet die Reziprozität eines Wortes, in der Regel eines Pronomens, und gibt an, dass sich das Pronomen auf eine Nominalphrase im Satz bezieht. Dieses Feld kann die folgenden Werte enthalten:

    • RECIPROCAL gibt an, dass das Pronomen reziprok ist.
    • NON_RECIPROCAL gibt an, dass das Pronomen nicht reziprok ist.
  • proper gibt an, ob ein Substantiv Teil eines Eigennamens ist. Beachten Sie, dass viele Eigennamen aus mehreren Wörtern bestehen. Wenn diese Phrase als Eigenname erkannt wird, werden die einzelnen Tokens ebenfalls als Eigennamen erkannt. Zum Beispiel ist beim Eigennamen "Wrigley Field" das Proper-Attribut von sowohl "Wrigley" als auch "Field" auf PROPER festgelegt. Dieses Feld kann die folgenden Werte enthalten:

    • PROPER gibt an, dass das Token Teil eines Eigennamens ist.
    • NOT_PROPER gibt an, dass das Token kein Teil eines Eigennamens ist.
  • form gibt zusätzliche morphologische Formen an, die sich nicht so recht in die vorherige Reihe von häufig vorkommenden Formen (tense, mood, person usw.) einfügen lassen. Viele dieser Formen beziehen sich auf bestimmte Sprachen. Dieses Feld kann die folgenden Werte enthalten:

    • ADNOMIAL (Koreanisch/Japanisch) gibt ein Wortende (Koreanisch) oder ein Verb (Japanisch) an, von dem eine Nominalphrase geändert wird. Beispiele: 밥을 먹는 사람 [jemand, der Reis isst] und 書く人 [jemand, der schreibt].
    • AUXILIARY (Koreanisch) gibt ein Wortende an, das zwei benachbarte Haupt- und Hilfsprädikate verbindet: 밥을 먹게 하다 [(jemanden) zum Essen bringen]
    • COMPLEMENTIZER (Koreanisch) gibt ein Wortende an, das zwei oder mehr verschiedene Satzteile verbindet: 밥을 먹고 물을 마신다 [(Ich) esse Reis und trinke Wasser]
    • FINAL_ENDING (Koreanisch/Japanisch) gibt ein Wortende an, das den Satzteil oder Satz abschließt und am Ende des Satzteils oder Satzes steht. Beispiele: 밥을 먹는다 [(Ich) esse Reis] und 手紙を書く [einen Brief schreiben].
    • GERUND (Koreanisch/Japanisch) gibt ein Wortende an, das Verben oder Adjektive substantiviert: (Koreanisch) 밥 먹기 [Reis essen] oder Verben mit verschiedenen Hilfsverben verbindet: (Japanisch) 書きたい [schreiben möchten].
    • REALIS (Japanisch) gibt die konditionalen und subjunktiven Formen mit einem konjunktiven Partikel an "ば": 書けば [wenn (ich) schreibe].
    • IRREALIS (Japanisch) gibt verbindende Verben mit negativen, passiven oder kausativen Hilfsverben an: 書かない [nicht schreiben], 書かれる [geschrieben werden], 書かせる [(jemanden) zum Schreiben bringen].
    • ORDER (Japanisch) gibt ein Befehlsverb an, so ähnlich wie ein Imperativ: 書け! [Schreib!]
    • SPECIFIC (Japanisch) gibt Sonderformen an, die von den oben aufgeführten sechs Kategorien nicht abgedeckt werden können. Die häufigste Verwendung dieser Form ist die Ableitung eines Substantivs von einem Adjektiv durch Anhängen eines Suffixes an die Form: かわいさ [Niedlichkeit]
    • SHORT (Russisch) gibt die Kurzform eines Adjektivs oder Partizips an.
    • LONG (Russisch) gibt die Langform eines Adjektivs oder Partizips an, im Gegensatz zur oben genannten SHORT-Form.

Beachten Sie, dass die Natural Language API morphologische Informationen auf Pro-Token-Basis (nicht auf Pro-Phrase-Basis) bereitstellt. Morphologische Konstrukte, die Wortgrenzen überschreiten, werden möglicherweise nicht unterstützt.

Abhängigkeitsstrukturen

Bei einer Syntaxanfrage werden Informationen zur Wortart und Morphologie im Feld partOfSpeech der Antwort zurückgegeben.

Für jeden Satz im Text, der für eine Syntaxanalyse an die Natural Language API übergeben wird, erstellt die API eine Abhängigkeitsstruktur, in der die Syntaxstruktur des jeweiligen Satzes beschrieben wird. Die syntaktischen Informationen werden im Feld dependencyEdge der Antwort zurückgegeben.

Ein Diagramm der Abhängigkeitsstruktur für diesen einzelnen Satz von John F. Kennedys Antrittsrede folgendermaßen:

Das Element dependencyEdge gibt für jedes Token an, welches andere Token es modifiziert (im Feld headTokenIndex) und welche syntaktische Beziehung zwischen dem Token und dem zugehörigen Kopf-Token besteht (im Feld label). Das folgende Beispiel zeigt das Element dependencyEdge für das Token "your" im ersten Vorkommen des Ausdrucks "your country":

      "dependencyEdge": {
        "headTokenIndex": 4,
        "label": "POSS"
      },

Das Element gibt an, dass "your" das fünfte Token modifiziert (der Offset von headTokenIndex ist nullbasiert) und ein Possessivmodifikator ist.

Jede Abhängigkeitsstruktur enthält ein ROOT-Element ("label": ROOT), das dem Hauptverb im Satz entspricht. Im Beispiel oben ist das Element ROOT das erste Wort im Satz ("headTokenIndex": 0). Für das ROOT-Wort "Ask" ist der headTokenIndex der eigene Index.

Obwohl Analysestrukturen keine Satzgrenzen überschreiten, indexiert die Natural Language API Sätze und Tokens mit nullbasierten Offsetwerten innerhalb des Gesamttextes.

Die Natural Language API kennzeichnet syntaktische Beziehungen mit einem gemeinsamen Satz an Abhängigkeiten, die übergreifend über alle unterstützten Sprachen gültig sind. Die Labels werden unten beschrieben. In den Beispielen stehen "Head" (für Kopf) und das Label jeweils unter den Tokens, für die sie gültig sind.

Label Beschreibung
UNKNOWN Unbekannte Beziehung
ABBREV Eine Abkürzung für das Head-Token.

British Broadcasting Company (BBC)
                     Head     ABBREV
ACOMP Eine adjektivische Wortgruppe, die als Ergänzung fungiert (als Objekt des Verbs). Diese Beziehung umfasst insbesondere Kopulakonstruktionen mit "be" und adjektivischen Prädikaten.

The book looks heavy.
         Head  ACOMP

The book is   heavy.
         Head ACOMP
Das Tag gilt auch für Adverbialbestimmungen, die keine Argumente sind, und in Raising-Konstruktionen mit adjektivischen Prädikativa.

She arrived sad.
    Head    ACOMP

I consider John intelligent.
  Head          ACOMP
ADVCL Ein Adverbialsatz, der ein Verb modifiziert, z. B. ein Temporalsatz, eine Konsequenz, eine Bedingung oder ein Zweck.

The accident happened as the night was falling.
             Head                      ADVCL

If you know who did it, you should tell the teacher.
       ADVCL                       Head

He talked to him in order to secure the account.
   Head                      ADVCL
ADVPHMOD Modifikator in Form einer Adverbialphrase (Japanisch)
ADVMOD Ein Adverb oder eine Adverbialphrase, die die Bedeutung eines Wortes modifiziert

Genetically modified food.
ADVMOD      Head

less   often
ADVMOD Head

About  200 people came to the party.
ADVMOD Head
AMOD Eine adjektivische Wortgruppe, die die Bedeutung einer Nominalphrase modifiziert

Sam eats red  meat.
         AMOD Head

Sam took out a 3 million dollar loan.
                         AMOD   Head
APPOS Eine Nominalphrase unmittelbar rechts neben einer anderen Nominalphrase, wobei die zweite Phrase die erste definiert oder modifiziert

Sam, my brother, arrived.
Head    APPOS

Bill (John’s cousin)
Head         APPOS
ATTR Eine Nominalphrase, die von einem Kopulaverb angeführt wird. Beachten Sie den Unterschied zwischen ATTR und ACOMP. Hier ist das abhängige Glied eine Nominalphrase, kein Adjektiv.

He is  a doctor.
   Head ATTR

She resembles her mother.
    Head          ATTR
In Fragen geht das "wh"-Pronomen oder das Substantiv im Fragesatz eine ATTR-Beziehung zum ROOT ein.

What is  your name?
ATTR Head     NSUBJ

What breed is   the dog?
     ATTR  Head     NSUBJ
Auch Raising-Konstruktionen mit Nominalprädikaten verwenden die ATTR-Beziehung.

I consider John an intelligent person.
  Head                         ATTR
AUX Verben, die keine Hauptverben sind, beispielsweise modale Hilfsverben oder Formen von "be", "do" oder "have" in einer periphrastischen Zeitform. Ausgeschlossen ist die Verwendung von "be" als Hilfsverb in einer Passivkonstruktion.

Reagan has died.
       AUX Head

He should leave.
   AUX    Head
AUXPASS Ein Verb, das kein Hauptverb des Satzes ist, im Passiv

Kennedy has been    killed.
        AUX AUXPASS Head

Kennedy was/got killed.
        AUXPASS Head
CC Die Beziehung zwischen einem Element eines Konjunkts und der koordinierenden Konjunktion. Ein Konjunkt einer Konjunktion (in der Regel das erste) wird als Kopf der Konjunktion angesehen.

Bill is big  and honest.
        Head CC

They either ski  or snowboard.
            Head CC

Bill went to Florida but Jane traveled to Alaska.
     Head            CC
CCOMP Ein Nebensatz mit internem Subjekt, der als Objekt des Verbs oder Adjektivs fungiert.

He says that you like  to swim.
   Head          CCOMP

I am certain that he did   it.
     Head            CCOMP

I admire the fact that you are   honest.
             Head          CCOMP
CONJ Die Beziehung zwischen zwei Elementen, die durch eine koordinierende Konjunktion verbunden sind, z. B. "and" oder "or". Der Kopf der Beziehung ist das erste Konjunkt und andere Konjunkte hängen über die Beziehung "conj" von ihm ab.

Bill is big and honest.
        Head    CONJ

They either ski  or snowboard.
            Head    CONJ

We have apples, pears, oranges, and bananas.
        DOBJ    CONJ   CONJ         CONJ
CSUBJ Ein einen Teilsatz bildendes syntaktisches Subjekt eines Satzes, das heißt, das Subjekt selbst ist ein Teilsatz (im Beispiel unten "What she said").

What she said  makes sense.
         CSUBJ Head
CSUBJPASS Ein einen Teilsatz bildendes syntaktisches Subjekt eines Passivsatzes

That she lied was suspected by everyone.
         CSUBJ    Head
DEP Das System kann keine präzisere Abhängigkeitsbeziehung zwischen zwei Wörtern ermitteln.

Then, as if  to show that he could, . . .
         DEP    Head

travel agency florence kentucky
       Head   DEP
DET Die Beziehung zwischen dem Kopf einer Nominalphrase und seinem Determinativ

The man is here.
DET Head

Which book do you prefer?
DET   Head
DISCOURSE Interjektionen und andere Redeelemente, die keine klare Verbindung zur Satzstruktur, sondern nur eine expressive Bedeutung haben. Beispiele sind Interjektionen ("oh", "uh-huh", "Welcome"), Füllelemente ("um", "ah") und Diskursmarker ("well", "like", "actually", "but not", "you know").

Iguazu is   in Argentina :)
       Head              DISCOURSE
DOBJ Die Nominalphrase, die das Akkusativobjekt ([Akkusativ] (https://de.wikipedia.org/wiki/Akkusativ)) eines Verbs ist

She gave me a raise.
    Head      DOBJ

They win  the lottery.
     Head     DOBJ
EXPL Pleonastisches Nominal. Im Englischen betrifft das einige Verwendungen von "it" und "there": das existenzielle "there" und "it" in Konstruktionen mit ungewöhnlichen Satzstellungen. Ein expletives oder pleonastisches Nominal erfüllt nicht die semantische Rolle des Prädikats. In Sprachen mit Expletiven können sie in den Slots für Subjekt und direktes Objekt positioniert werden.

There is   a ghost in the room.
EXPL  Head   NSUBJ

It   is clear that we should decline.
EXPL Head
GOESWITH Verknüpft zwei Teile eines Wortes, die im Text getrennt sind.
IOBJ Die Nominalphrase, die das indirekte Objekt ([Dativ] (https://de.wikipedia.org/wiki/Dativ)) eines Verbs ist

She gave me   a present.
    Head IOBJ   DOBJ
MARK Das Wort, das einen finiten oder unendlichen Nebensatz einleitet, zum Beispiel "that" oder "when". Der Kopf ist der Kopf des Nebensatzes.

Forces engaged in fighting after insurgents attacked.
                           MARK             Head

He says that you like to swim.
        MARK     Head
MWE Eine der beiden Wortverbindungsbeziehungen (neben "NN"). Sie wird für bestimmte fest grammatikalisierte Ausdrücke mit Funktionswörtern verwendet, die sich wie ein einzelnes Funktionswort verhalten. Mehrwortausdrücke werden in einer flachen Struktur mit Anfangsposition des Kopfes annotiert, in der alle Wörter im Ausdruck mit dem Label "MWE" das erste Wort modifizieren.

I like dogs as   well as  cats.
            Head MWE  MWE

He cried because of  you.
         Head    MWE
MWV Verbaler Mehrwortausdruck.
NEG Die Beziehung zwischen einem Negationswort und dem Wort, das es modifiziert

Bill is    not a scientist.
     Head  NEG

Bill is no  scientist.
        NEG Head
NN Jedes Nomen mit der Funktion, das Kopfnomen zu modifizieren

phone book
NN    Head

oil price futures
NN  NN    Head
NPADVMOD Eine Nominalphrase, die als adverbialer Modifikator verwendet wird

The director is 65 years    old.
                   NPADVMOD Head

Six feet     long
    NPADVMOD Head

Shares eased a fraction.
       HEAD    NPADVMOD

The silence is itself   significant.
               NPADVMOD Head

90% of Australians like him, the most     of any country.
                   Head          NPADVMOD
NSUBJ Eine Nominalphrase, die das syntaktische Subjekt eines Satzes ist

Clinton defeated Dole.
NSUBJ   Head

The baby  is   cute
    NSUBJ Head
NSUBJPASS Eine Nominalphrase, die das syntaktische Subjekt eines Passivsatzes ist

Dole       was defeated by Clinton.
NSUBJPASS      Head
NUM Jeder numerische Ausdruck mit der Funktion, die Bedeutung des Nomens mit einer Mengenangabe zu modifizieren

Sam ate three sheep.
        NUM   Head
NUMBER Teil eines numerischen Ausdrucks

I have four   thousand sheep.
       NUMBER Head
P Jedes Satzzeichen in einem Satz.
PARATAXIS Die Parataxis-Beziehung (aus dem Griechischen für "Beiordnung") ist eine Beziehung zwischen einem Wort (oft das Hauptprädikat eines Satzes) und anderen Elementen, die ohne explizite Koordination, Unterordnung oder Argumentation mit dem Kopfwort nebeneinander angeordnet sind. Parataxis ist ein diskursähnliches Äquivalent der Koordination.

Let's face it we're annoyed.
Head                PARATAXIS

The guy, John said,     left early in the morning.
              PARATAXIS Head
PARTMOD Partizipialer Modifikator
PCOMP Wird verwendet, wenn das Komplement einer Präposition ein Teilsatz oder eine Präpositionalphrase (oder gelegentlich eine Adverbialphrase) ist

We have no information on   whether users are   at risk.
                       Head               PCOMP

They heard about you missing classes.
           Head      PCOMP
POBJ Der Kopf einer Nominalphrase, die einer Präposition oder den Adverbien "here" und "there" folgt.

I sat on   the chair.
      Head     POBJ

What does CPR stand for?
POBJ                Head
POSS Ein possessives Determinativ oder Genitiv-Modifikator (https://de.wikipedia.org/wiki/Genitiv)

their offices
POSS  Head

Bill’s clothes.
POSS   Head
POSTNEG Postverbale Negationspartikel
PRECOMP Prädikativkomplement
PRECONJ Ein Wort, das am Anfang steht und eine Konjunktion einbindet, z. B. "entweder", "Beides", "nbei".

Both    the boys and the girls are here.
PRECONJ     Head
PREDET Ein Wort, das der Bedeutung eines Nominalphrasen-Determinativs vorangestellt ist und sie modifiziert

All    the boys are here.
PREDET     Head
PREF Präfix
PREP Jede Präpositionalphrase mit der Funktion, die Bedeutung eines Verbs, Adjektivs, Nomens oder sogar einer anderen Präposition zu modifizieren

I saw a cat  in   a hat.
        Head PREP

I saw  a cat with a telescope.
  Head       PREP

He is responsible for  meals.
      Head        PREP
PRONL Die Beziehung zwischen einem Verb und einem verbalen Morphem (Französisch)
PRT Ein Verbpartikel

They shut down the station.
     Head PRT

He would not put  up  with it.
             Head PRT
PS Assoziativ- oder Possessivmarker
QUANTMOD Quantifikatorphrasenmodifikator
RCMOD Eine Verbindung von einem Nomen zum Verb, das einen Relativsatz anführt

I saw the man  you love.
          Head     RCMOD

the book that you bought
    Head          RCMOD

Bell, a company which is based in LA, makes and distributes computer products.
        Head             RCMOD
RCMODREL Komplementierer im Relativsatz (Chinesisch)
RDROP Ellipse ohne vorausgehendes Prädikat (Japanisch)
REF Referent (Hindi)
REMNANT Wird für Ellipsen verwendet

John won bronze, Mary silver, and Sandy gold.
         Head         REMNANT           REMNANT
REPARANDUM Zeigt Störungen an, die in einer Sprachkorrektur übergangen werden

Go to         the righ- to   the left.
   REPARANDUM           Head
ROOT Das Hauptglied des Satzes. In den allermeisten Fällen ein Verb.
SNUM Suffix, das den Numerus kennzeichnet (Japanisch)
SUFF Suffix
TMOD Ein Bestandteil der Nominalphrase, die dazu dient, die Bedeutung des Bestandteils durch Angabe einer Zeit zu modifizieren. "TMOD" erfasst nur Zeitpunkte und -dauer; Wiederholungen wie "two times" werden durch NPADVMOD erfasst.

Last night, I swam in the pool.
     TMOD     Head
TOPIC Themenmarker (Chinesisch)
VMOD Teilsatz, dem eine infinite Form des Verbs vorangestellt wird

Berries gathered on this side of the mountain are sweeter.
Head    VMOD

He sat  in the armchair reading the morning newspaper.
   Head                 VMOD

I have nothing to say  to them.
       Head       VMOD
VOCATIVE Markiert einen im Text angesprochenen Dialogteilnehmer (üblich in E-Mails und Newsgroup-Postings)

Anna,    can you bring a tent?
VOCATIVE         Head
XCOMP Eine Satzergänzung ohne eigenes Subjekt, deren Referenz von einem externen Subjekt bestimmt wird

He says that you like to swim.
                 Head    XCOMP

I am ready to leave.
     Head     XCOMP
SUFFIX Namenssuffix
TITLE Titel
AUXCAUS Kausatives Hilfsverb (Japanisch)
AUXVV Hilfsverb (Japanisch)
DTMOD Rentaishi (pränominaler Modifikator)
FOREIGN Fremdwörter
KW Schlüsselwort
LIST Listenförmige Struktur bei Aneinanderreihungen vergleichbarer Einheiten
NOMC Nominalisierter Satz
NOMCSUBJ Nominalisierter Subjektsatz
NOMCSUBJPASS Nominalisiertes satzförmiges Subjekt eines Passivverbs
NUMC Zusammengesetzter numerischer Modifikator (Japanisch)
COP Kopula (Spanisch)
DISLOCATED Dislokation (bei Vorfeld-/topikalisierten Konstituenten)
ASP Aspektmarker
GMOD Genitivischer Modifikator
GOBJ Genitivobjekt
INFMOD Infinitivischer Modifikator
MES Maß
NCOMP Nominales Komplement eines Substantivs

Weitere Informationen zu Abhängigkeitsstrukturen finden Sie im Universal Dependency Treebank-Projekt. Außerdem enthält das Dokument Universal Dependency Annotation for Multilingual Processing Hintergrundinformationen zur Methodologie, die bei der Interpretation einer solchen Abhängigkeitsstruktur verwendet wird.

Antwort einer syntaktischen Analyse parsen

Der folgende Pseudocode stellt ein allgemeines Muster bereit, das für iterative Vorgänge an der Antwort der syntaktischen Analyse verwendet werden kann:

index = 0
  for sentence in self.sentences:
    content  = sentence['text']['content']
    sentence_begin = sentence['text']['beginOffset']
    sentence_end = sentence_begin + len(content) - 1
    while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
      # This token is in this sentence
      index += 1