Die Methode analyzeSyntax
gibt Details zur linguistischen Struktur des gegebenen Textes zurück. Die Natural Language API liefert zu jedem Token im Text Informationen über seine interne Struktur (Morphologie) und seine Rolle im Satz (Syntax).
Morphologie ist die Lehre von der inneren Struktur von Wörtern. Bei der Morphologie geht es hauptsächlich darum, wie die Komponenten in einem Wort (Stämme, Stammwörter, Präfixe, Suffixe usw.) angeordnet oder verändert werden und dabei verschiedene Bedeutungen annehmen. In der englischen Sprache beispielsweise wird der Plural eines Substantivs häufig durch Anfügen von "-s" oder "-es" gebildet. Das Imperfekt wird gebildet, indem "-d" oder "-ed" an ein Verb angefügt wird. Das Suffix "-ly" wird Adjektiven hinzugefügt, um Adverbien zu erstellen (z. B. "happy" [Adjektiv] und "happily" [Adverb]).
Die Natural Language API erschließt anhand der morphologischen Analyse grammatische Informationen zu Wörtern.
Bei der Morphologie gibt es von Sprache zu Sprache große Unterschiede. In Sprachen wie Russisch geben Wortendungen die Rolle eines Wortes in einem Satz an (z. B. "книга" [Buch – Nominativ] wird zu "книгу" [Akkusativ], wenn es das direkte Objekt eines Verbs ist). Dies bedeutet, dass die Wortreihenfolge variieren kann, ohne dass die Bedeutung des Satzes geändert wird, obwohl eine unterschiedliche Wortreihenfolge die kontextabhängige Eignung beeinflusst. Sprachen wie Englisch und Mandarin, die keine Affixe kennen, um den Fall anzugeben, hängen eher von der Reihenfolge der Wörter in einem Satz ab, um die jeweilige Rolle der Wörter anzuzeigen. Daher hängt die morphologische Analyse stark von der Ausgangssprache und dem Verständnis ab, was in dieser Sprache unterstützt wird.
Die Syntax beschäftigt sich mit der Struktur von Wortgruppen und Sätzen. Syntax und Morphologie beschreiben grammatische Beziehungen. Die Arbeitsteilung dieser linguistischen Teildisziplinen ist je nach Sprache unterschiedlich. Beispielsweise wird im Russischen die Rolle des direkten Objekts durch ein Affix ausgedrückt, wie "у" im Wort "книгу". Im Englischen geschieht dies dagegen durch die Reihenfolge der Wörter, wobei das direkte Objekt auf das Verb folgt, z. B. "read the book" (lesen Sie das Buch).
Die Methode analyzeSyntax
gibt als Ergebnis morphologische Informationen im Feld partOfSpeech
und die syntaktische Beziehung zwischen den Wörtern im Feld dependencyTree
zurück.
Wortarten
Bei einer Syntaxanfrage werden Informationen zur Wortart und Morphologie im Feld partOfSpeech
der Antwort zurückgegeben. Das partOfSpeech
-Feld enthält eine Reihe von Unterfeldern mit Informationen zur Wortart (Part-of-Speech, POS) sowie ausführliche morphologische Informationen. Diese Unterfelder werden unten aufgelistet.
tag
gibt mit einem groben POS-Tag (SUBSTANTIV, VERB usw.) die Wortart an und stellt allgemeine Syntaxinformationen auf oberster Ebene bereit. POS-Tags sind nützlich, wenn Sie Muster erstellen und/oder die Mehrdeutigkeit für die nachfolgende Sprachanalyse verringern möchten, z. B. "train" mit der Tag-Kennzeichnung SUBSTANTIV und nicht VERB.number
gibt den grammatischen Numerus eines Worts an. Im Englischen wird das Suffix "-s" an zählbare Nomen angehängt, um deren Plural auszudrücken, z. B. gibt "dog + s" an, dass es sich um mehr als einen Hund handelt. Fehlt das Pluralsuffix, handelt es sich um die Singularform. Einige Sprachen wie Arabisch haben außerdem das Konzept einer Zweizahl. Dieses Feld kann die folgenden Werte enthalten:SINGULAR
gibt eine Anzahl an.PLURAL
gibt mehr als eine Anzahl an.DUAL
gibt genau zwei Anzahlen an.
person
gibt die grammatische Person eines Worts an. Im Englischen gibt "I/me" (ich/mich) die erste Person Singular an und bezieht sich auf den Sprecher (oder Autor) eines Ausdrucks. Dagegen bezeichnen "you" (du), "she/her" (sie/ihr) und "he/him" (er/ihn/ihm) den Adressaten (Zuhörer) bzw. eine weitere Person. Dieses Feld kann die folgenden Werte enthalten:FIRST
bezeichnet den Sprecher.SECOND
bezeichnet den beabsichtigten Adressaten, also die Person, mit der gesprochen wurde.THIRD
bezeichnet Nicht-Sprecher/Nicht-Hörer.REFLEXIVE_PERSON
gibt beispielsweise an, dass Subjekt und Objekt auf dieselbe Entität verweisen, wie bei "The cat licked itself" (die Katze leckte sich selbst). In diesem Fall wird "-self" (selbst) einem Pronomen hinzugefügt, um die Reflexivität auszudrücken. Im Russischen und Japanischen ist das Reflexiv ein separates Pronomen. "John loves himself" (John liebt sich selbst) heißt auf Russisch beispielsweise "Джон любит себя", wobei "себя" geschlechtsneutral das Wort "self" (selbst) ausdrückt. Im Japanischen heißt der Satz in der romanisierten Version "Tarō wa zibun o aisuru", wobei hier "zibun" geschlechtsneutral "self" ausdrückt. Siehe Reflexivpronomen.
gender
gibt das grammatische Genus eines Nomens an. Dieses Feld kann die folgenden Werte enthalten:- Das Genus
FEMININE
- Das Genus
MASCULINE
- Das Genus
NEUTER
- Das Genus
case
bezeichnet den grammatischen Fall eines Worts und seine Rolle in einer Wortgruppe oder einem Satz. Dieses Feld kann die folgenden Werte enthalten:- Der
ACCUSATIVE
-Fall gibt das direkte Objekt eines transitiven Verbs an. - Der
ADVERBIAL
-Fall gibt die adverbiale Form eines Adjektivs an. Beachten Sie, dass in der englischen Sprache verschiedene Wörter verwendet werden, um Adverbien ("well") und Adjektive ("good") voneinander zu unterscheiden. Mit dem Suffix "-ly" werden im Englischen Adverbien von Adjektiven abgeleitet (z. B. "happy", "happily"), obwohl es nicht als "Fall" gilt. - Der
COMPLEMENTIVE
-Fall (Chinesisch) gibt ein Wort an, das erforderlich ist, um die Bedeutung eines potenziellen, beschreibenden oder resultativen Ausdrucks mit einem Konjunktivpartikel zu vervollständigen. - Der
DATIVE
-Fall gibt ein indirektes Objekt an, das sich auf den Referenten bezieht, der das direkte Objekt erhält. Im Englischen wird das indirekte Objekt häufig durch die Präposition "to" angegeben, wie im Satz "He gave the ball to Bobby" (Er gab Bobby den Ball). "Bobby" ist hierbei das indirekte Objekt und somit der Empfänger des Balls. Im russischen Beispiel "Иван дал книгу маше" (Iwan gab Masha das Buch) gibt dagegen "-e" an, dass "маше" das indirekte Objekt und somit Masha die Empfängerin des Buchs ist. - Der
GENITIVE
-Fall gibt ein Besitzverhältnis an. Beachten Sie, dass Besitzverhältnisse im Englischen häufig mithilfe des Affixes "-'s" anstelle eines Genitivs angegeben werden. Das Affix "-'s" kann an das Ende einer Wortgruppe angehängt werden, z. B. "[The man who ran the bill up]’s wife paid a dear price for his excess." (Die Frau des [Manns, der die Rechnung in die Höhe getrieben hatte,] zahlte für seine Ausschweifung einen hohen Preis.). Im russischen Beispiel "Где книга Антона?" wird dagegen das Wort "Антон-" durch das Suffix "-а" als Genitiv gekennzeichnet: "Где книга Антона?" (Wo ist Antons Buch?). Im Russischen wird der Genitiv auch im Komplement von Wörtern wie "mehrere" oder "wenige" ausgedrückt. Im Beispiel "Зимой здесь мало снега" (Im Winter liegt hier wenig Schnee) wird "снег-" (Schnee) durch "-a" als Genitiv gekennzeichnet, da es das Komplement von "мало" (wenig) ist. Hier geht es jedoch um kein Besitzverhältnis. - Der
INSTRUMENTAL
-Fall gibt an, ob ein Substantiv das Mittel ist, mit dem eine Handlung ausgeführt wird. Der Satz "Er öffnete die Tür mit einem Schlüssel" lautet auf Russisch "он открыл дверь ключом", wobei an "ключ" (Schlüssel) "-om" angehängt wurde, um den Instrumentalis anzuzeigen. - Der
LOCATIVE
-Fall gibt bei einem Wort die räumliche Beziehung zu einem Ort an. Im Englischen und Deutschen gibt es keinen Lokativ. - Der
NOMINATIVE
-Fall gibt das Subjekt eines Verbs an. Im Englischen wird das Subjekt eines Satzes durch die Wortstellung angegeben und nicht durch einen Kasus. In dem Satz "The girl won the race" (Das Mädchen gewann das Rennen) ist die Wortgruppe "the girl" (das Mädchen) das Subjekt, das links vom Verb "won" (gewann) steht. Im Russischen kann "девушка" (the/a girl bzw. das/ein Mädchen) entweder vor oder nach dem Verb stehen, "девушка выиграла гонку" oder "гонку выиграла девушка", wobei "выиграла" (won bzw. gewann) das Verb ist. - Der
OBLIQUE
-Fall gibt an, ob ein Wort als Objekt für ein Verb oder eine Präposition verwendet wird. - Der
PARTITIVE
-Fall gibt die "Unvollständigkeit" eines Wortes oder das Fehlen einer bestimmten Identität an. Ein Beispiel für den Partitiv im Englischen ist "three of my friends" (drei von meinen Freunden). Auf Russisch lautet dies "трое моих друзей", wobei "трое" für "three of" (drei von) steht. Im Vergleich dazu steht bei "три друга" das Wort "три" für "three" (drei). - Der
PREPOSITIONAL
-Fall gibt das Objekt einer Präposition an. - Der
REFLEXIVE_CASE
gibt die Identität eines Objekts eines Verbs zu seinem Subjekt an. In den meisten Sprachen ist kein reflexiver Fall vorhanden, da er durch die Verwendung eines bestimmten Reflexivpronomens, wie z. B. "himself", "myself" usw., angegeben wird. - Der
RELATIVE_CASE
(Chinesisch) gibt den Komplementierer eines Relativsatzes an und verbindet ein Substantiv mit einem Verb oder Adjektiv. Beispiele: 工作 [的] 地方 (Arbeit [] Ort :: "Ort, [an dem ich] arbeite"). 便宜 的 餐馆 (preiswerte [] Restaurants :: Restaurants, [die] preiswert sind). - Der
VOCATIVE
-Fall gibt ein Substantiv an, mit dem jemand oder etwas angesprochen wird, normalerweise als Anrede in einem Gespräch.
- Der
tense
gibt die grammatische Zeitform eines Verbs an und steht für den Verweis des Verbs auf einen Zeitpunkt. Beachten Sie, dass sichtense
vonaspect
unterscheidet. Bei Letzterem geht es zwar auch um das Verhältnis des Verbs zur Zeit. Im Mittelpunkt stehen aber die Merkmale dieses Zeitverlaufs statt des Zeitpunkts. Die TemporaIMPERFECT
undPLUPERFECT
beziehen sich in vielen Sprachen genauer genommen auf bestimmte Kombinationen von Tempus und Aspekt. Dieses Feld kann die folgenden Werte enthalten:CONDITIONAL_TENSE
ist ein alternativer Ausdruck für den vorherrschenden morphologischen Ausdruck "Conditional Mood". (sieheCONDITIONAL_MOOD
unten)FUTURE
bezeichnet eine Handlung, die in der Zukunft stattfinden wird. Beachten Sie, dass das Futur im Englischen häufig durch das Hinzufügen des Wortes "will" zu einer Verbalphrase ausgedrückt wird.PAST
bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat.PRESENT
bezeichnet eine Handlung, die in der Gegenwart stattfindet.IMPERFECT
bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat, aber im Bezugsrahmen dieses Tempus nicht abgeschlossen wurde. Beachten Sie, dass das Imperfekt im Englischen meistens durch das Hinzufügen eines Gerundiums (der substantivierten Form eines Verbs) an die Vergangenheitsform ausgedrückt wird, wie in "I was walking". Ein Ereignis im Imperfekt hat in der Vergangenheit stattgefunden, ist jedoch im Verhältnis zu diesem Tempus nicht abgeschlossen.PLUPERFECT
bezeichnet eine Handlung, die in der Vergangenheit stattgefunden hat und im Bezugsrahmen dieses Tempus auch abgeschlossen wurde. Zum Beispiel fand "I had walked" in der Vergangenheit statt, wurde jedoch im Bezugsrahmen der Vergangenheitsform auch abgeschlossen.
aspect
bezeichnet den grammatischen Aspekt eines Verbs und ist ein Ausdruck des Zeitverlaufs. Im Gegensatz zutense
mit Fokus auf der zeitlichen Stellung eines Verbs liegt der Fokus beimaspect
auf den Merkmalen des Zeitverlaufs, in dem sich der Aspekt ereignet. Dieses Feld kann die folgenden Werte enthalten:- Der Aspekt
PERFECTIVE
bezeichnet ein Ereignis, das "abgeschlossen" ist, entweder weil es sich in der Vergangenheit vollständig ereignet hat oder weil es in der Zukunft vollständig abgeschlossen wird. - Der Aspekt
IMPERFECTIVE
bezeichnet ein unvollständiges Ereignis, das entweder andauert oder sich wiederholt. - Der Aspekt
PROGRESSIVE
bezeichnet ein fortlaufendes Ereignis. Ein progressiver Aspekt wird im Allgemeinen wie ein Sonderfall eines allgemeineren imperfekten Aspekts, der auch Wiederholungen umfasst, behandelt.
- Der Aspekt
mood
bezeichnet den grammatischen Modus eines Verbs und vermittelt die Einstellung zu einer zugrunde liegenden Handlung. Dieses Feld kann die folgenden Werte enthalten:CONDITIONAL_MOOD
bezeichnet eine bedingte Handlung. Beachten Sie, dass Verbformen im Englischen nicht konditional sind. Stattdessen wird konditionales Verhalten durch die Verwendung des Wortes "would" zusammen mit dem Infinitiv des Verbs angegeben.IMPERATIVE
bezeichnet einen Befehl oder eine Bitte, wobei die 2. Person verwendet wird.INDICATIVE
bezeichnet eine Aussage und wird allgemein "Modus realis" genannt.INTERROGATIVE
bezeichnet eine Frage.JUSSIVE
bezeichnet einen Befehl oder eine Bitte, wobei die 1. oder 3. Person verwendet wird. Im Englischen ist kein Jussiv vorhanden, aber er wird durch Ausrufe, die mit einem realen oder implizierten "Let us" beginnen, ausgedrückt.SUBJUNCTIVE
bezeichnet einen Zustand der Ungewissheit in Bezug auf eine Handlung. Der Subjunktiv wird auch "Irrealis" genannt, im Gegensatz zum indikativischen "Realis". Im Englischen ist kein bestimmter Subjunktiv vorhanden. Stattdessen wird er durch Wörter wie "want", "wish", "hope" usw. ausgedrückt.
voice
bezeichnet die Diathese eines Verbs, also den Zusammenhang zwischen einer Handlung und einem Subjekt und/oder Objekt. Dieses Feld kann die folgenden Werte enthalten:- Die Diathese
ACTIVE
bezeichnet eine Handlung, die von einem Subjekt ausgeführt wird. - Die Diathese
CAUSATIVE
bezeichnet eine Handlung, die sich auf das Subjekt auswirkt. Im Englischen ist kein Kausativ vorhanden. Stattdessen wird solche Kausalität durch die Verwendung des Verbs "make", wie in "Mom made me go to school", angegeben. - Die Diathese
PASSIVE
bezeichnet eine Handlung, die sich auf das Subjekt auswirkt. In vielen Fällen ist der passive "Agent" nicht benannt oder bekannt.
- Die Diathese
reciprocity
bezeichnet die Reziprozität eines Wortes, in der Regel eines Pronomens, und gibt an, dass sich das Pronomen auf eine Nominalphrase im Satz bezieht. Dieses Feld kann die folgenden Werte enthalten:RECIPROCAL
gibt an, dass das Pronomen reziprok ist.NON_RECIPROCAL
gibt an, dass das Pronomen nicht reziprok ist.
proper
gibt an, ob ein Substantiv Teil eines Eigennamens ist. Beachten Sie, dass viele Eigennamen aus mehreren Wörtern bestehen. Wenn diese Phrase als Eigenname erkannt wird, werden die einzelnen Tokens ebenfalls als Eigennamen erkannt. Zum Beispiel ist beim Eigennamen "Wrigley Field" das Proper-Attribut von sowohl "Wrigley" als auch "Field" aufPROPER
festgelegt. Dieses Feld kann die folgenden Werte enthalten:PROPER
gibt an, dass das Token Teil eines Eigennamens ist.NOT_PROPER
gibt an, dass das Token kein Teil eines Eigennamens ist.
form
gibt zusätzliche morphologische Formen an, die sich nicht so recht in die vorherige Reihe von häufig vorkommenden Formen (tense
,mood
,person
usw.) einfügen lassen. Viele dieser Formen beziehen sich auf bestimmte Sprachen. Dieses Feld kann die folgenden Werte enthalten:ADNOMIAL
(Koreanisch/Japanisch) gibt ein Wortende (Koreanisch) oder ein Verb (Japanisch) an, von dem eine Nominalphrase geändert wird. Beispiele: 밥을 먹는 사람 [jemand, der Reis isst] und 書く人 [jemand, der schreibt].AUXILIARY
(Koreanisch) gibt ein Wortende an, das zwei benachbarte Haupt- und Hilfsprädikate verbindet: 밥을 먹게 하다 [(jemanden) zum Essen bringen]COMPLEMENTIZER
(Koreanisch) gibt ein Wortende an, das zwei oder mehr verschiedene Satzteile verbindet: 밥을 먹고 물을 마신다 [(Ich) esse Reis und trinke Wasser]FINAL_ENDING
(Koreanisch/Japanisch) gibt ein Wortende an, das den Satzteil oder Satz abschließt und am Ende des Satzteils oder Satzes steht. Beispiele: 밥을 먹는다 [(Ich) esse Reis] und 手紙を書く [einen Brief schreiben].GERUND
(Koreanisch/Japanisch) gibt ein Wortende an, das Verben oder Adjektive substantiviert: (Koreanisch) 밥 먹기 [Reis essen] oder Verben mit verschiedenen Hilfsverben verbindet: (Japanisch) 書きたい [schreiben möchten].REALIS
(Japanisch) gibt die konditionalen und subjunktiven Formen mit einem konjunktiven Partikel an "ば": 書けば [wenn (ich) schreibe].IRREALIS
(Japanisch) gibt verbindende Verben mit negativen, passiven oder kausativen Hilfsverben an: 書かない [nicht schreiben], 書かれる [geschrieben werden], 書かせる [(jemanden) zum Schreiben bringen].ORDER
(Japanisch) gibt ein Befehlsverb an, so ähnlich wie ein Imperativ: 書け! [Schreib!]SPECIFIC
(Japanisch) gibt Sonderformen an, die von den oben aufgeführten sechs Kategorien nicht abgedeckt werden können. Die häufigste Verwendung dieser Form ist die Ableitung eines Substantivs von einem Adjektiv durch Anhängen eines Suffixes an die Form: かわいさ [Niedlichkeit]SHORT
(Russisch) gibt die Kurzform eines Adjektivs oder Partizips an.LONG
(Russisch) gibt die Langform eines Adjektivs oder Partizips an, im Gegensatz zur oben genanntenSHORT
-Form.
Beachten Sie, dass die Natural Language API morphologische Informationen auf Pro-Token-Basis (nicht auf Pro-Phrase-Basis) bereitstellt. Morphologische Konstrukte, die Wortgrenzen überschreiten, werden möglicherweise nicht unterstützt.
Abhängigkeitsstrukturen
Bei einer Syntaxanfrage werden Informationen zur Wortart und Morphologie im Feld partOfSpeech
der Antwort zurückgegeben.
Für jeden Satz im Text, der für eine Syntaxanalyse an die Natural Language API übergeben wird, erstellt die API eine Abhängigkeitsstruktur, in der die Syntaxstruktur des jeweiligen Satzes beschrieben wird. Die syntaktischen Informationen werden im Feld dependencyEdge
der Antwort zurückgegeben.
Hier ist ein Diagramm mit der Abhängigkeitsstruktur für einen einzelnen Satz aus der Antrittsrede von John F. Kennedy:
Das Element dependencyEdge
gibt für jedes Token an, welches andere Token es modifiziert (im Feld headTokenIndex
) und welche syntaktische Beziehung zwischen dem Token und dem zugehörigen Kopf-Token besteht (im Feld label
). Das folgende Beispiel zeigt das Element dependencyEdge
für das Token "your" im ersten Vorkommen des Ausdrucks "your country":
"dependencyEdge": {
"headTokenIndex": 4,
"label": "POSS"
},
Das Element gibt an, dass "your" das fünfte Token modifiziert (der Offset von headTokenIndex
ist nullbasiert) und ein Possessivmodifikator ist.
Jede Abhängigkeitsstruktur enthält ein ROOT
-Element ("label": ROOT
), das dem Hauptverb im Satz entspricht. Im Beispiel oben ist das Element ROOT
das erste Wort im Satz ("headTokenIndex": 0
). Für das ROOT
-Wort "Ask" ist der headTokenIndex
der eigene Index.
Obwohl Analysestrukturen keine Satzgrenzen überschreiten, indexiert die Natural Language API Sätze und Tokens mit nullbasierten Offsetwerten innerhalb des Gesamttextes.
Die Natural Language API kennzeichnet syntaktische Beziehungen mit einem gemeinsamen Satz an Abhängigkeiten, die übergreifend über alle unterstützten Sprachen gültig sind. Die Labels werden unten beschrieben. In den Beispielen stehen "Head" (für Kopf) und das Label jeweils unter den Tokens, für die sie gültig sind.
Label | Beschreibung |
---|---|
UNKNOWN |
Unbekannte Beziehung |
ABBREV |
Eine Abkürzung für das Kopf-Token.British Broadcasting Company (BBC) Head ABBREV |
ACOMP |
Eine adjektivische Wortgruppe, die als Ergänzung fungiert (als Objekt des Verbs). Diese Beziehung umfasst insbesondere Kopulakonstruktionen mit "be" und adjektivischen Prädikaten.
The book looks heavy. Head ACOMP The book is heavy. Head ACOMP She arrived sad. Head ACOMP I consider John intelligent. Head ACOMP |
ADVCL |
Ein Adverbialsatz, der ein Verb modifiziert, beispielsweise ein Temporalsatz, eine Folge, eine Bedingung oder ein Zweck.The accident happened as the night was falling. Head ADVCL If you know who did it, you should tell the teacher. ADVCL Head He talked to him in order to secure the account. Head ADVCL |
ADVPHMOD |
Modifikator in Form einer Adverbialphrase (Japanisch) |
ADVMOD |
Ein Adverb oder eine Adverbialphrase, die die Bedeutung eines Wortes modifiziertGenetically modified food. ADVMOD Head less often ADVMOD Head About 200 people came to the party. ADVMOD Head |
AMOD |
Eine adjektivische Wortgruppe, die die Bedeutung einer Nominalphrase modifiziertSam eats red meat. AMOD Head Sam took out a 3 million dollar loan. AMOD Head |
APPOS |
Eine Nominalphrase unmittelbar rechts neben einer anderen Nominalphrase, wobei die zweite Phrase die erste definiert oder modifiziertSam, my brother, arrived. Head APPOS Bill (John’s cousin) Head APPOS |
ATTR |
Eine Nominalphrase, die von einem Kopulaverb angeführt wird. Beachten Sie den Unterschied zwischen ATTR und ACOMP. Hier ist das abhängige Glied eine Nominalphrase, kein Adjektiv.He is a doctor. Head ATTR She resembles her mother. Head ATTR What is your name? ATTR Head NSUBJ What breed is the dog? ATTR Head NSUBJ I consider John an intelligent person. Head ATTR |
AUX |
Verben, die keine Hauptverben sind, beispielsweise modale Hilfsverben oder Formen von "be", "do" oder "have" in einer periphrastischen Zeitform. Ausgeschlossen ist die Verwendung von "be" als Hilfsverb in einer Passivkonstruktion.Reagan has died. AUX Head He should leave. AUX Head |
AUXPASS |
Ein Verb, das kein Hauptverb des Satzes ist, im PassivKennedy has been killed. AUX AUXPASS Head Kennedy was/got killed. AUXPASS Head |
CC |
Die Beziehung zwischen einem Element eines Konjunkts und der koordinierenden Konjunktion. Ein Konjunkt einer Konjunktion (in der Regel das erste) wird als Kopf der Konjunktion angesehen.Bill is big and honest. Head CC They either ski or snowboard. Head CC Bill went to Florida but Jane traveled to Alaska. Head CC |
CCOMP |
Ein Nebensatz mit internem Subjekt, der als Objekt des Verbs oder Adjektivs fungiert.He says that you like to swim. Head CCOMP I am certain that he did it. Head CCOMP I admire the fact that you are honest. Head CCOMP |
CONJ |
Die Beziehung zwischen zwei Elementen, die durch eine koordinierende Konjunktion wie "and" oder "or" verbunden sind. Das erste Konjunkt ist der Kopf der Beziehung, die anderen Konjunkte hängen über die Beziehung CONJ von ihm ab.Bill is big and honest. Head CONJ They either ski or snowboard. Head CONJ We have apples, pears, oranges, and bananas. DOBJ CONJ CONJ CONJ |
CSUBJ |
Ein einen Teilsatz bildendes syntaktisches Subjekt eines Satzes, das heißt, das Subjekt selbst ist ein Teilsatz (im Beispiel unten „What she said“).What she said makes sense. CSUBJ Head |
CSUBJPASS |
Ein einen Teilsatz bildendes syntaktisches Subjekt eines PassivsatzesThat she lied was suspected by everyone. CSUBJ Head |
DEP |
Das System kann keine präzisere Abhängigkeitsbeziehung zwischen zwei Wörtern ermitteln.Then, as if to show that he could, . . . DEP Head travel agency florence kentucky Head DEP |
DET |
Die Beziehung zwischen dem Kopf einer Nominalphrase und seinem DeterminativThe man is here. DET Head Which book do you prefer? DET Head |
DISCOURSE |
Interjektionen und andere Redeelemente, die keine klare Verbindung zur Satzstruktur, sondern nur eine expressive Bedeutung haben. Beispiele sind Interjektionen ("oh", "uh-huh", "Welcome"), Füllelemente ("um", "ah") und Diskursmarker ("well", "like", "actually", "but not", "you know").Iguazu is in Argentina :) Head DISCOURSE |
DOBJ |
Die Nominalphrase, die das Akkusativobjekt ([Akkusativ] (https://de.wikipedia.org/wiki/Akkusativ)) eines Verbs istShe gave me a raise. Head DOBJ They win the lottery. Head DOBJ |
EXPL |
Pleonastisches Nominal. Im Englischen betrifft das einige Verwendungen von "it" und "there": das existenzielle "there" und "it" in Konstruktionen mit ungewöhnlichen Satzstellungen. Ein expletives oder pleonastisches Nominal erfüllt nicht die semantische Rolle des Prädikats. In Sprachen mit Expletiven können sie in den Slots für Subjekt und direktes Objekt positioniert werden.There is a ghost in the room. EXPL Head NSUBJ It is clear that we should decline. EXPL Head |
GOESWITH |
Verknüpft zwei Teile eines Wortes, die im Text getrennt sind. |
IOBJ |
Die Nominalphrase, die das indirekte Objekt ([Dativ] (https://de.wikipedia.org/wiki/Dativ)) eines Verbs ist.She gave me a present. Head IOBJ DOBJ |
MARK |
Das Wort, das einen finiten oder infiniten Nebensatz einleitet, beispielsweise "that" oder "whether". Der Kopf ist der Kopf des Nebensatzes.Forces engaged in fighting after insurgents attacked. MARK Head He says that you like to swim. MARK Head |
MWE |
Eine der beiden Wortverbindungsbeziehungen (neben "NN"). Sie wird für bestimmte fest grammatikalisierte Ausdrücke mit Funktionswörtern verwendet, die sich wie ein einzelnes Funktionswort verhalten. Mehrwortausdrücke werden in einer flachen Struktur mit Anfangsposition des Kopfes annotiert, in der alle Wörter im Ausdruck mit dem Label "MWE" das erste Wort modifizieren.I like dogs as well as cats. Head MWE MWE He cried because of you. Head MWE |
MWV |
Verbaler Mehrwortausdruck. |
NEG |
Die Beziehung zwischen einem Negationswort und dem Wort, das es modifiziertBill is not a scientist. Head NEG Bill is no scientist. NEG Head |
NN |
Jedes Nomen mit der Funktion, das Kopfnomen zu modifizierenphone book NN Head oil price futures NN NN Head |
NPADVMOD |
Eine Nominalphrase, die als adverbialer Modifikator verwendet wirdThe director is 65 years old. NPADVMOD Head Six feet long NPADVMOD Head Shares eased a fraction. HEAD NPADVMOD The silence is itself significant. NPADVMOD Head 90% of Australians like him, the most of any country. Head NPADVMOD |
NSUBJ |
Eine Nominalphrase, die das syntaktische Subjekt eines Satzes istClinton defeated Dole. NSUBJ Head The baby is cute NSUBJ Head |
NSUBJPASS |
Eine Nominalphrase, die das syntaktische Subjekt eines Passivsatzes istDole was defeated by Clinton. NSUBJPASS Head |
NUM |
Jeder numerische Ausdruck mit der Funktion, die Bedeutung des Nomens mit einer Mengenangabe zu modifizierenSam ate three sheep. NUM Head |
NUMBER |
Teil eines numerischen AusdrucksI have four thousand sheep. NUMBER Head |
P |
Jedes Satzzeichen in einem Satz. |
PARATAXIS |
Die Parataxis-Beziehung (aus dem Griechischen für "Beiordnung") ist eine Beziehung zwischen einem Wort (oft das Hauptprädikat eines Satzes) und anderen Elementen, die ohne explizite Koordination, Unterordnung oder Argumentation mit dem Kopfwort nebeneinander angeordnet sind. Parataxis ist ein diskursähnliches Äquivalent der Koordination.Let's face it we're annoyed. Head PARATAXIS The guy, John said, left early in the morning. PARATAXIS Head |
PARTMOD |
Partizipialer Modifikator |
PCOMP |
Wird verwendet, wenn das Komplement einer Präposition ein Teilsatz oder eine Präpositionalphrase (oder gelegentlich eine Adverbialphrase) istWe have no information on whether users are at risk. Head PCOMP They heard about you missing classes. Head PCOMP |
POBJ |
Der Kopf einer Nominalphrase, der einer Präposition oder den Adverbien "here" und "there" folgt.I sat on the chair. Head POBJ What does CPR stand for? POBJ Head |
POSS |
Ein possessives Determinativ oder Genitiv-Modifikator (https://de.wikipedia.org/wiki/Genitiv)their offices POSS Head Bill’s clothes. POSS Head |
POSTNEG |
Postverbale Negationspartikel |
PRECOMP |
Prädikativkomplement |
PRECONJ |
Ein Wort, das am Anfang steht und eine Konjunktion einbindet, zum Beispiel "either", "both", "neither".Both the boys and the girls are here. PRECONJ Head |
PREDET |
Ein Wort, das der Bedeutung eines Nominalphrasen-Determinativs vorangestellt ist und sie modifiziertAll the boys are here. PREDET Head |
PREF |
Präfix |
PREP |
Jede Präpositionalphrase mit der Funktion, die Bedeutung eines Verbs, Adjektivs, Nomens oder sogar einer anderen Präposition zu modifizierenI saw a cat in a hat. Head PREP I saw a cat with a telescope. Head PREP He is responsible for meals. Head PREP |
PRONL |
Die Beziehung zwischen einem Verb und einem verbalen Morphem (Französisch) |
PRT |
Ein VerbpartikelThey shut down the station. Head PRT He would not put up with it. Head PRT |
PS |
Assoziativ- oder Possessivmarker |
QUANTMOD |
Quantifikatorphrasenmodifikator |
RCMOD |
Eine Verbindung von einem Nomen zum Verb, das einen Relativsatz anführtI saw the man you love. Head RCMOD the book that you bought Head RCMOD Bell, a company which is based in LA, makes and distributes computer products. Head RCMOD |
RCMODREL |
Komplementierer im Relativsatz (Chinesisch) |
RDROP |
Ellipse ohne vorausgehendes Prädikat (Japanisch) |
REF |
Referent (Hindi) |
REMNANT |
Wird für Ellipsen verwendetJohn won bronze, Mary silver, and Sandy gold. Head REMNANT REMNANT |
REPARANDUM |
Zeigt Störungen an, die in einer Sprachkorrektur übergangen werdenGo to the righ- to the left. REPARANDUM Head |
ROOT |
Das Hauptglied des Satzes. In den allermeisten Fällen ein Verb. |
SNUM |
Suffix, das den Numerus kennzeichnet (Japanisch) |
SUFF |
Suffix |
TMOD |
Ein Bestandteil der Nominalphrase, die dazu dient, die Bedeutung des Bestandteils durch Angabe einer Zeit zu modifizieren. "TMOD" erfasst nur Zeitpunkte und -dauer; Wiederholungen wie "two times" werden durch NPADVMOD erfasst.Last night, I swam in the pool. TMOD Head |
TOPIC |
Themenmarker (Chinesisch) |
VMOD |
Teilsatz, dem eine infinite Form des Verbs vorangestellt wirdBerries gathered on this side of the mountain are sweeter. Head VMOD He sat in the armchair reading the morning newspaper. Head VMOD I have nothing to say to them. Head VMOD |
VOCATIVE |
Markiert einen im Text angesprochenen Dialogteilnehmer (üblich in E-Mails und Newsgroup-Postings)Anna, can you bring a tent? VOCATIVE Head |
XCOMP |
Eine Satzergänzung ohne eigenes Subjekt, deren Referenz von einem externen Subjekt bestimmt wirdHe says that you like to swim. Head XCOMP I am ready to leave. Head XCOMP |
SUFFIX |
Namenssuffix |
TITLE |
Titel |
AUXCAUS |
Kausatives Hilfsverb (Japanisch) |
AUXVV |
Hilfsverb (Japanisch) |
DTMOD |
Rentaishi (pränominaler Modifikator) |
FOREIGN |
Fremdwörter |
KW |
Schlüsselwort |
LIST |
Listenförmige Struktur bei Aneinanderreihungen vergleichbarer Einheiten |
NOMC |
Nominalisierter Satz |
NOMCSUBJ |
Nominalisierter Subjektsatz |
NOMCSUBJPASS |
Nominalisiertes satzförmiges Subjekt eines Passivverbs |
NUMC |
Zusammengesetzter numerischer Modifikator (Japanisch) |
COP |
Kopula (Spanisch) |
DISLOCATED |
Dislokation (bei Vorfeld-/topikalisierten Konstituenten) |
ASP |
Aspektmarker |
GMOD |
Genitivischer Modifikator |
GOBJ |
Genitivobjekt |
INFMOD |
Infinitivischer Modifikator |
MES |
Maß |
NCOMP |
Nominales Komplement eines Substantivs |
Weitere Informationen zu Abhängigkeitsstrukturen finden Sie im Universal Dependency Treebank-Projekt. Außerdem enthält das Dokument Universal Dependency Annotation for Multilingual Processing Hintergrundinformationen zur Methodologie, die bei der Interpretation einer solchen Abhängigkeitsstruktur verwendet wird.
Antwort einer syntaktischen Analyse parsen
Der folgende Pseudocode stellt ein allgemeines Muster bereit, das für iterative Vorgänge an der Antwort der syntaktischen Analyse verwendet werden kann:
index = 0 for sentence in self.sentences: content = sentence['text']['content'] sentence_begin = sentence['text']['beginOffset'] sentence_end = sentence_begin + len(content) - 1 while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end: # This token is in this sentence index += 1