Arborescences de morphologies et de dépendances

La méthode analyzeSyntax renvoie des informations sur la structure linguistique du texte donné. Pour chaque jeton du texte, l'API Natural Language fournit des informations sur sa structure interne (morphologie) et son rôle dans la phrase (syntaxe).

La morphologie est la branche de la linguistique qui étudie la structure interne des mots. Cette discipline se concentre sur la manière dont les parties d'un mot (radicaux, racines, préfixes, suffixes, etc.) sont disposées ou modifiées pour créer des sens différents. L'anglais, par exemple, ajoute souvent "-s" ou "-es" à la fin d'un nom dénombrable pour marquer le pluriel, et "-d" ou "-ed" à la fin d'un verbe pour indiquer le passé. Le suffixe "-ly" est ajouté aux adjectifs pour créer des adverbes (par exemple, "happy" [adjectif] et "happily" [adverbe]).

L'API Natural Language utilise l'analyse morphologique pour déduire des informations grammaticales sur les mots.

La morphologie varie considérablement d'une langue à l'autre. Dans des langues telles que le russe, la terminaison d'un mot indique son rôle dans la phrase (par exemple, "книга" (le livre) [nominatif] devient "книгу" [accusatif] lorsqu'il est objet direct du verbe). Cela signifie que l'ordre des mots peut varier sans changer le sens de la phrase, bien qu'un ordre des mots différent ait une incidence sur la justesse contextuelle. Des langues telles que l'anglais et le mandarin, qui sont dépourvues d'affixes indiquant le cas, reposent davantage sur l'ordre des mots dans la phrase pour indiquer les rôles respectifs des mots. En conséquence, l'analyse morphologique dépend fortement de la langue source et de la compréhension de ce qui est accepté dans cette langue.

La syntaxe est la branche de la linguistique qui étude la structure des syntagmes et des phrases. Ensemble, la syntaxe et la morphologie expriment des relations grammaticales, la division du travail s'opérant différemment en fonction des langues. Par exemple, le russe utilise un affixe pour exprimer le rôle d'objet direct ("у" dans "книгу"), tandis que le français utilise l'ordre des mots, où l'objet direct suit le verbe ("lire le livre").

La réponse analyzeSyntax renvoie des informations morphologiques dans le champ partOfSpeech et la relation syntaxique entre les mots dans le champ dependencyTree.

Classes de mots

Dans une requête syntaxique, les informations morphologiques et sur la classe de mots sont renvoyées dans le champ partOfSpeech de la réponse. Le champ partOfSpeech contient un ensemble de sous-champs avec des informations sur la classe de mots (POS), ainsi que des informations morphologiques plus explicites. Ces sous-champs sont énumérés ci-dessous.

  • tag indique la classe de mots à l'aide d'un tag POS à faible niveau de précision (NOUN, VERB, etc.) et fournit des informations sur la syntaxe superficielle de niveau supérieur. Les tags POS s'avèrent utiles si vous souhaitez créer des modèles et/ou réduire l'ambiguïté d'une analyse linguistique ultérieure (par exemple, "train" marqué avec le tag NOUN au lieu de VERB).

  • number (nombre) désigne le nombre grammatical d'un mot. En français, le suffixe "-s" est ajouté à un nom dénombrable pour indiquer un nombre supérieur à un (par exemple, "chien + s" indique plus d'un chien). L'absence de suffixe pluriel est souvent appelée forme singulière. Certaines langues, telles que l'arabe, comportent également la notion de duel. Ce champ peut contenir les valeurs suivantes :

    • SINGULAR (singulier) désigne une quantité.
    • PLURAL (pluriel) désigne plus d'une quantité.
    • DUAL désigne précisément deux quantités.
  • person (personne) identifie la personne grammaticale d'un mot. En français, "je/moi" est la première personne du singulier et désigne le locuteur (ou l'auteur) de l'expression, alors que "tu/vous", "elle/lui" et "il/lui" font référence au destinataire (auditeur) et à une autre personne, respectivement. Ce champ peut contenir les valeurs suivantes :

    • FIRST (première personne) désigne le locuteur.
    • SECOND (deuxième personne) désigne le destinataire prévu, c'est-à-dire la personne à qui on parle.
    • THIRD (troisième personne) désigne les personnes qui ne sont ni locuteurs, ni auditeurs.
    • REFLEXIVE_PERSON (réfléchi) indique, par exemple, que le sujet et l'objet font référence à la même entité, comme dans "Le chat se lèche", où le pronom "se" est utilisé pour indiquer la réflexivité. En russe et en japonais, le pronom réfléchi est autonome. Par exemple, "John s'aime" se traduirait en russe par "Джон лбит себя", où "себя" exprime une réflexivité neutre, tandis qu'en japonais, cette réflexivité neutre serait exprimée par "zibun" dans "Tarō wa zibun o aisuru" (version romanisée). Consultez la page Pronom réfléchi.
  • gender (genre) désigne le genre grammatical d'un nom. Ce champ peut contenir les valeurs suivantes :

    • Genre grammatical FEMININE
    • Genre grammatical MASCULINE (masculin)
    • Genre grammatical NEUTER
  • case (cas) désigne le cas grammatical d'un mot et son rôle dans un syntagme ou une phrase. Ce champ peut contenir les valeurs suivantes :

    • Le cas ACCUSATIVE (accusatif) indique l'objet direct d'un verbe transitif.
    • Le cas ADVERBIAL (adverbial) indique la forme adverbiale d'un adjectif. Notez que l'anglais utilise des mots distincts pour les adverbes et les adjectifs ("well"/"good"). En français, le suffixe -ment permet de créer des adverbes à partir d'adjectifs (par exemple, "heureux" -> "heureusement"), bien que cela ne soit pas considéré comme un "cas".
    • En chinois, le cas COMPLEMENTIVE (complémentif) indique un mot nécessaire pour compléter le sens d'une expression potentielle, descriptive ou résultative à l'aide d'une particule conjonctive.
    • Le cas DATIVE (datif) indique un objet indirect qui fait référence au référent recevant l'objet direct. En français, l'objet indirect est souvent désigné par la préposition "à" comme dans la phrase "Il a donné la balle à Bobby", où "Bobby" est l'objet indirect et la personne recevant la balle. Dans cet exemple russe "Иван дал книгу маше" (Ivan a donné le livre à Masha), "-e" indique que "маше" est l'objet indirect et que Masha est la personne recevant le livre.
    • Le cas GENITIVE (génitif) exprime la possession. Notez que le français exprime la possession avec la préposition "de" et non avec le génitif. Dans cet exemple russe, en revanche, le suffixe "-а" donne à "Антон-" la marque du génitif : "Где книга Антона?" (Où est le livre d'Anton ?). En russe, le génitif est également utilisé comme complément de mots tels que "plusieurs" ou "peu". Par exemple, dans "Зимой здесь мало снега" (En hiver, il y a peu de neige par ici), “-a” donne à "снег" (neige) la marque du génitif, puisqu'il s'agit du complément de "мало" ("peu").
    • Le cas INSTRUMENTAL (instrumental) indique si un nom est l'instrument par lequel une action est effectuée. En russe, la phrase "Il a ouvert la porte avec une clé" serait traduite par "он открыл дверь ключом", où "-om" est attaché à "ключ" (clé) pour indiquer le cas instrumental.
    • Le cas LOCATIVE (locatif) indique l'utilisation d'un mot pour désigner un lieu. Le français n'a pas recours au locatif.
    • Le cas NOMINATIVE (nominatif) est associé au sujet d'un verbe. En français, le sujet d'une phrase est déterminé par l'ordre des mots et non par le cas grammatical. Dans la phrase "La fille a gagné la course", "la fille" est le sujet qui apparaît à gauche du verbe "a gagné". En russe, "девушка" (la/une fille) peut apparaître avant ou après le verbe : "девушка выиграла гонку" ou "гонку выиграла девушка", où le verbe est "выиграла" (a gagné).
    • Le cas OBLIQUE (oblique) indique l'utilisation d'un mot en tant qu'objet d'un verbe ou d'une préposition.
    • Le cas PARTITIVE (partitif) exprime le "caractère partiel" ou l'absence d'identité spécifique d'un mot. Un exemple de partitif en français serait "trois de mes amis". En russe, cela s'exprimerait par "трое моих друзей", où "трое" signifie "trois de" (à comparer avec "три друга", où "три" signifie "trois").
    • Le cas PREPOSITIONAL (prépositionnel) indique l'objet d'une préposition.
    • Le cas REFLEXIVE_CASE (réflexif) indique l'identité d'un objet d'un verbe par rapport à son sujet. Rares sont les langues qui utilisent ce cas, car cet emploi est plutôt indiqué par le recours à des pronoms réfléchis spéciaux (tels que "lui-même", "moi-même", etc.).
    • En chinois, le cas RELATIVE_CASE (relatif) indique le complétiviseur d'une clause relative reliant un nom à un verbe ou à un adjectif. Exemples : "工作 [的] 地方" ("travail [] lieu" : "lieu [où je] travaille"). "便宜 的 餐馆" ("bon marché [] restaurants" : "restaurants [qui sont] bon marché").
    • Le cas VOCATIVE (vocatif) exprime l'interpellation directe ou l'invocation d'une personne (ou d'une chose).
  • tense (temps) désigne le temps grammatical d'un verbe, ce qui indique la référence du verbe à une position dans le temps. Notez que tense est différent de aspect, qui traite également du rapport d'un verbe au temps, mais se concentre sur les caractéristiques de cet écoulement du temps, plutôt que sur sa position. Dans de nombreuses langues, les temps IMPERFECT (imparfait) et PLUPERFECT (plus-que-parfait) se réfèrent plus précisément à des combinaisons spécifiques de temps et d'aspect. Ce champ peut contenir les valeurs suivantes :

    • CONDITIONAL_TENSE (temps conditionnel) est utilisé comme synonyme de "mode conditionnel", qui est plus courant (voir CONDITIONAL_MOOD ci-dessous).
    • FUTURE (futur) indique une action qui se déroule dans le futur. Notez qu'en français, le futur est exprimé en ajoutant une terminaison à l'infinitif du verbe.
    • PAST (passé) indique une action qui se déroule dans le passé.
    • PRESENT (présent) indique une action qui se déroule dans le présent.
    • IMPERFECT (imparfait) indique une action qui s'est déroulée dans le passé, mais qui n'était pas achevée dans le cadre de référence de ce temps. Notez qu'en français, l'imparfait est exprimé en ajoutant une terminaison spécifique à la racine du verbe ("Je marchais"). Un événement à l'imparfait se produit dans le passé, mais n'est pas achevé par rapport à ce point de référence.
    • PLUPERFECT (plus-que-parfait) indique une action qui s'est déroulée dans le passé et qui s'est également achevée dans le cadre de référence de ce temps. Par exemple, "J'avais marché" désigne une action qui a eu lieu dans le passé, mais qui a également été achevée dans le cadre de référence du passé.
  • aspect indique l'aspect grammatical d'un verbe ; l'état exprimé par le verbe est envisagé du point de son déroulement. Contrairement à tense, qui porte sur la position d'un verbe dans le temps, aspect se concentre sur les caractéristiques de l'écoulement temporel où il se produit. Ce champ peut contenir les valeurs suivantes :

    • L'aspect PERFECTIVE (perfectif) indique un événement qui est "achevé", soit parce qu'il s'est complètement produit dans le passé, soit parce qu'il se produira complètement dans le futur.
    • L'aspect IMPERFECTIVE (imperfectif) indique un événement "inachevé", soit parce qu'il est continu, soit parce qu'il se répète.
    • L'aspect PROGRESSIVE (progressif) indique un événement continu. Un aspect progressif est généralement considéré comme un cas particulier de l'aspect imperfectif, plus général (qui couvre également la répétition).

  • mood désigne le mode grammatical d'un verbe, qui indique l'attitude par rapport à une action sous-jacente. Ce champ peut contenir les valeurs suivantes :

    • CONDITIONAL_MOOD (mode conditionnel) indique une action contingente.
    • IMPERATIVE (impératif) indique une demande ou un ordre à la deuxième personne.
    • INDICATIVE (indicatif) indique un état de fait, plus généralement connu sous le nom de "mode réel".
    • INTERROGATIVE (interrogatif) indique une question.
    • JUSSIVE (jussif) indique une demande ou un ordre exprimé à la première ou à la troisième personne. Le jussif n'existe pas en français, même s'il peut être reproduit en utilisant le présent du subjonctif, comme dans "Qu'il vienne !" (exhortation).
    • SUBJUNCTIVE (subjonctif) indique une qualité d'incertitude liée à une action ; on parle également de "mode irréel" (par opposition au mode indicatif "réel").
  • voice (voix) dénote la voix grammaticale d'un verbe, c'est-à-dire la relation entre une action et un sujet et/ou un objet. Ce champ peut contenir les valeurs suivantes :

    • La voix ACTIVE indique une action effectuée par le sujet.
    • La voix CAUSATIVE indique une action dont le sujet subit l'effet. En français, il n'existe pas de causatif direct ; pour rendre cette causalité, on emploie plutôt le verbe "faire", comme dans la phrase "Maman m'a fait aller à l'école".
    • La voix PASSIVE indique une action dont le sujet subit l'effet. Dans de nombreux cas, un "agent" passif est tacite ou inconnu.
  • reciprocity (réciprocité) dénote la réciprocité d'un mot (généralement un pronom), ce qui indique que le pronom fait référence à un syntagme nominal ailleurs dans la phrase. Ce champ peut contenir les valeurs suivantes :

    • RECIPROCAL indique que le pronom est réciproque.
    • NON_RECIPROCAL (non réciproque) indique que le pronom n'est pas réciproque.
  • proper (propre) indique si un nom fait partie ou non d'un nom propre. Notez que beaucoup de noms propres se composent de plusieurs mots. Si ce syntagme est identifié comme étant un nom propre, chaque jeton sera également détecté comme tel. Par exemple, l'attribut des éléments "Wrigley" et "Field" qui composent le nom propre "Wrigley Field" sera défini sur PROPER. Ce champ peut contenir les valeurs suivantes :

    • PROPER indique que le jeton fait partie d'un nom propre.
    • NOT_PROPER indique que le jeton ne fait pas partie d'un nom propre.
  • form (forme) désigne des formes morphologiques supplémentaires qui ne correspondent pas parfaitement à l'ensemble de formes courantes mentionné précédemment (tense, mood, person, etc.). La plupart de ces formes sont propres à des langues bien spécifiques. Ce champ peut contenir les valeurs suivantes :

    • ADNOMIAL (coréen/japonais) indique une terminaison de mot (coréen) ou un verbe (japonais) qui modifie un syntagme nominal. Exemples : "밥을 먹는 사람" [quelqu'un qui mange du riz] et "書く人" [quelqu'un qui écrit].
    • AUXILIARY (coréen) indique une terminaison de mot qui relie deux prédicats principaux et auxiliaires adjacents : "밥을 먹게 하다" [faire manger (quelqu'un)].
    • COMPLEMENTIZER (coréen) indique une terminaison de mot qui relie plusieurs (deux ou plus) clauses différentes : "밥을 먹고 물을 마신다" [(Je) mange du riz et bois de l'eau].
    • FINAL_ENDING (coréen/japonais) indique une terminaison de mot qui met fin à la clause ou à la phrase. Exemples : 밥을 먹는다 [(Je) mange du riz] et 手紙を書く [écrire une lettre].
    • GERUND (coréen/japonais) indique une terminaison de mot qui nominalise des verbes ou des adjectifs (coréen : "밥 먹기" [mangeant du riz]) ou qui relie des verbes à divers verbes auxiliaires (japonais : "書きたい" [vouloir écrire]).
    • REALIS (japonais) indique des formes conditionnelles et subjonctives avec une particule conjonctive "ば" : "書けば" [si (j')écris].
    • IRREALIS (japonais) indique des verbes connectifs avec des verbes auxiliaires négatifs, passifs ou causatifs : '書かない' [ne pas écrire], '書かれる' [être écrit] ou '書かせる' [faire écrire (quelqu'un)].
    • ORDER (japonais) indique un verbe de commande, semblable à l'impératif : 書け! [écris !].
    • SPECIFIC (japonais) indique des formes spéciales qui ne peuvent pas être couvertes par les six catégories décrites ci-dessus. L'utilisation la plus courante de cette forme est un dérivé d'un nom à partir d'un adjectif en ajoutant un suffixe à la forme : "かわいさ" [côté mignon].
    • SHORT (russe) indique un adjectif ou un participe de forme courte.
    • LONG (russe) indique un adjectif ou un participe de forme longue, par opposition à la forme SHORT ci-dessus.

Notez que l'API Natural Language fournit des informations morphologiques jeton par jeton (et non syntagme par syntagme). Il se peut que les constructions morphologiques qui dépassent les frontières du mot ne soient pas acceptées.

Arborescences de dépendances (ou stemmata)

Dans une requête syntaxique, les informations morphologiques et sur la classe de mots sont renvoyées dans le champ partOfSpeech de la réponse.

Pour chaque phrase du texte fourni à l'API Natural Language en vue d'une analyse syntaxique, l'API construit un stemma qui en décrit la structure syntaxique. Les informations syntaxiques sont renvoyées dans le champ dependencyEdge de la réponse.

L'exemple ci-dessous illustre un diagramme du stemma pour une phrase extraite du discours inaugural de John F. Kennedy :

Pour chaque jeton, l'élément dependencyEdge identifie l'autre jeton qu'il modifie (dans le champ headTokenIndex), ainsi que la relation syntaxique entre ce jeton et son jeton principal (dans le champ label). Par exemple, voici l'élément dependencyEdge du jeton "your" dans la première occurrence du syntagme "your country" :

      "dependencyEdge": {
        "headTokenIndex": 4,
        "label": "POSS"
      },

Cet élément indique que "your" modifie le cinquième jeton (headTokenIndex utilise un décalage basé sur zéro) et qu'il s'agit d'un modificateur possessif.

Chaque arborescence de dépendances comprend un élément ROOT ("label": ROOT) qui correspond au verbe principal de la phrase. Dans l'exemple ci-dessus, il se trouve que l'élément ROOT est le premier mot de la phrase ("headTokenIndex": 0). S'agissant du mot ROOT "Ask", headTokenIndex est son propre index.

Bien que les arborescences d'analyse ne s'étendent pas au-delà des frontières de la phrase, l'API Natural Language indexe les phrases et les jetons à l'aide de valeurs de décalage basées sur zéro dans l'ensemble du texte.

L'API Natural Language ajoute un libellé aux relations syntaxiques à l'aide d'un ensemble commun de dépendances qui s'appliquent aux langues acceptées. Les libellés sont décrits ci-dessous. Dans l'exemple de texte, "Head" et le libellé apparaissent sous les jetons auxquels ils s'appliquent.

Libellé Description
UNKNOWN Relation inconnue
ABBREV Abréviation du jeton principal.

British Broadcasting Company (BBC)
                     Head     ABBREV
ACOMP Syntagme adjectival qui fonctionne comme un complément (comme un objet du verbe). Cette relation inclut spécifiquement des constructions du copule "be" avec des prédicats adjectivaux.

The book looks heavy.
         Head  ACOMP

The book is   heavy.
         Head ACOMP
Le tag s'applique également aux adjoints adjectivaux non-arguments et aux constructions de montée avec des prédicats adjectivaux.

She arrived sad.
    Head    ACOMP

I consider John intelligent.
  Head          ACOMP
ADVCL Clause adverbiale qui modifie un verbe, comme une proposition adverbiale de temps, une conséquence, une proposition adverbiale de condition ou une proposition adverbiale de but.

The accident happened as the night was falling.
             Head                      ADVCL

If you know who did it, you should tell the teacher.
       ADVCL                       Head

He talked to him in order to secure the account.
   Head                      ADVCL
ADVPHMOD Modificateur de syntagme adverbial (japonais)
ADVMOD Adverbe (non clausal) ou syntagme adverbial servant à modifier le sens d'un mot.

Genetically modified food.
ADVMOD      Head

less   often
ADVMOD Head

About  200 people came to the party.
ADVMOD Head
AMOD Syntagme adjectival servant à modifier le sens d'un syntagme nominal.

Sam eats red  meat.
         AMOD Head

Sam took out a 3 million dollar loan.
                         AMOD   Head
APPOS Syntagme nominal situé immédiatement à droite d'un autre syntagme nominal, le second servant à définir ou à modifier le premier.

Sam, my brother, arrived.
Head    APPOS

Bill (John’s cousin)
Head         APPOS
ATTR Syntagme nominal centré sur un verbe copulatif. Notez que "ATTR" est différent de "ACOMP", en ce sens que le dépendant est un syntagme nominal et non un adjectif.

He is  a doctor.
   Head ATTR

She resembles her mother.
    Head          ATTR
Dans les questions, le pronom Qu- (ou wh- en anglais) ou le nom situé dans le syntagme Qu- (ou wh- en anglais) se trouve dans la relation "ATTR" par rapport à "ROOT".

What is  your name?
ATTR Head     NSUBJ

What breed is   the dog?
     ATTR  Head     NSUBJ
La relation "ATTR" est également employée dans des constructions à montée avec des prédicats nominaux.

I consider John an intelligent person.
  Head                         ATTR
AUX Verbe non principal, tel qu'un auxiliaire modal ou une forme de "be", "do" ou "have", dans une périphrase verbale. Exclut l'utilisation de "be" comme auxiliaire dans une construction passive.

Reagan has died.
       AUX Head

He should leave.
   AUX    Head
AUXPASS Verbe non principal d'une clause à la voix passive.

Kennedy has been    killed.
        AUX AUXPASS Head

Kennedy was/got killed.
        AUXPASS Head
CC Relation entre un élément d'un conjoint et la conjonction de coordination. Le conjoint d'une conjonction (en principe le premier) est traité comme le noyau de la conjonction.

Bill is big  and honest.
        Head CC

They either ski  or snowboard.
            Head CC

Bill went to Florida but Jane traveled to Alaska.
     Head            CC
CCOMP Clause dépendante avec un sujet interne qui fonctionne comme un objet du verbe ou de l'adjectif.

He says that you like  to swim.
   Head          CCOMP

I am certain that he did   it.
     Head            CCOMP

I admire the fact that you are   honest.
             Head          CCOMP
CONJ Relation entre deux éléments liés par une conjonction de coordination, comme "and" ou "or". Le noyau de la relation est le premier conjoint et les autres conjonctions en dépendent via la relation "conj".

Bill is big and honest.
        Head    CONJ

They either ski  or snowboard.
            Head    CONJ

We have apples, pears, oranges, and bananas.
        DOBJ    CONJ   CONJ         CONJ
CSUBJ Sujet syntaxique clausal d'une clause ; en d'autres termes, le sujet est lui-même une clause ("What she said" dans l'exemple ci-dessous).

What she said  makes sense.
         CSUBJ Head
CSUBJPASS Sujet syntaxique clausal d'une clause passive.

That she lied was suspected by everyone.
         CSUBJ    Head
DEP Le système n'est pas en mesure de déterminer une relation de dépendance plus précise entre deux mots.

Then, as if  to show that he could, . . .
         DEP    Head

travel agency florence kentucky
       Head   DEP
DET Relation entre le noyau d'un syntagme nominal et son déterminant.

The man is here.
DET Head

Which book do you prefer?
DET   Head
DISCOURSE Interjections et autres éléments du discours qui ne sont pas clairement liés à la structure de la phrase, sauf de manière expressive. Exemples : interjections ("oh", "uh-huh", "Welcome"), tics de langage ("um", "ah") et marqueurs conversationnels ("well", "like", "actually", mais pas "you know").

Iguazu is   in Argentina :)
       Head              DISCOURSE
DOBJ Syntagme nominal qui est l'objet ([accusatif]https://fr.wikipedia.org/wiki/Accusatif)) d'un verbe.

She gave me a raise.
    Head      DOBJ

They win  the lottery.
     Head     DOBJ
EXPL Syntagme nominal pléonastique. En anglais, il s'agit de quelques emplois de "it" et de "there" : le "there" existentiel et "it" lorsqu'il est utilisé dans des constructions d'extraposition. On qualifie d'explétif ou de nominal pléonastique un mot qui n'a ou ne semble avoir aucun rôle sémantique dans l'énoncé où il apparaît. Dans les langues contenant des explétifs, ces derniers peuvent être positionnés aux emplacements du sujet et de l'objet direct.

There is   a ghost in the room.
EXPL  Head   NSUBJ

It   is clear that we should decline.
EXPL Head
GOESWITH Lie deux parties d'un mot qui sont séparées dans le texte.
IOBJ Syntagme nominal qui est l'objet indirect ([datif](https://fr.wikipedia.org/wiki/Datif)) d'un verbe.

She gave me   a present.
    Head IOBJ   DOBJ
MARK Mot introduisant une clause subordonnée finie ou non finie, comme "that" ou "whether". Le noyau est le noyau de la clause subordonnée.

Forces engaged in fighting after insurgents attacked.
                           MARK             Head

He says that you like to swim.
        MARK     Head
MWE Une des deux relations (avec "NN") utilisées pour la composition. Il est utilisé pour certaines expressions grammaticalisées fixes avec des mots-outils qui se comportent comme un seul mot-outil. Les expressions à plusieurs mots sont annotées dans une structure centrifuge plate, dans laquelle tous les mots de l'expression modifient le premier à l'aide du libellé "MWE".

I like dogs as   well as  cats.
            Head MWE  MWE

He cried because of  you.
         Head    MWE
MWV Expression verbale à plusieurs mots.
NEG Relation entre un mot marquant la négation et le mot qu'il modifie.

Bill is    not a scientist.
     Head  NEG

Bill is no  scientist.
        NEG Head
NN Tout nom servant à modifier le nom principal (noyau).

phone book
NN    Head

oil price futures
NN  NN    Head
NPADVMOD Syntagme nominal utilisé comme modificateur adverbial.

The director is 65 years    old.
                   NPADVMOD Head

Six feet     long
    NPADVMOD Head

Shares eased a fraction.
       HEAD    NPADVMOD

The silence is itself   significant.
               NPADVMOD Head

90% of Australians like him, the most     of any country.
                   Head          NPADVMOD
NSUBJ Syntagme nominal qui est le sujet syntaxique d'une clause.

Clinton defeated Dole.
NSUBJ   Head

The baby  is   cute
    NSUBJ Head
NSUBJPASS Syntagme nominal qui est le sujet syntaxique d'une clause passive.

Dole       was defeated by Clinton.
NSUBJPASS      Head
NUM Tout syntagme numéral servant à modifier le sens du nom avec une quantité.

Sam ate three sheep.
        NUM   Head
NUMBER Partie d'un syntagme numéral.

I have four   thousand sheep.
       NUMBER Head
P Tout élément de ponctuation d'une clause.
PARATAXIS La relation parataxique (du grec signifiant "placer côte à côte") est une relation entre un mot (souvent le prédicat principal d'une phrase) et d'autres éléments placés côte à côte sans rapport d'argument, de subordination ou de coordination explicite avec le mot principal. La parataxe est l'équivalent discursif de la coordination.

Let's face it we're annoyed.
Head                PARATAXIS

The guy, John said,     left early in the morning.
              PARATAXIS Head
PARTMOD Modificateur participial
PCOMP Utilisé lorsque le complément d'une préposition est une clause ou un syntagme prépositionnel (ou occasionnellement, un syntagme adverbial).

We have no information on   whether users are   at risk.
                       Head               PCOMP

They heard about you missing classes.
           Head      PCOMP
POBJ Noyau d'un syntagme nominal suivant une préposition ou les adverbes "here" et "there".

I sat on   the chair.
      Head     POBJ

What does CPR stand for?
POBJ                Head
POSS Déterminant possessif ou modificateur [génitif] (https://fr.wikipedia.org/wiki/G%C3%A9nitif).

their offices
POSS  Head

Bill’s clothes.
POSS   Head
POSTNEG Particule négative postverbale
PRECOMP Complément de prédicat
PRECONJ Mot qui apparaît en position initiale, encadrant une conjonction, tel que "either", "both" et "neither".

Both    the boys and the girls are here.
PRECONJ     Head
PREDET Mot qui précède et modifie le sens d'un déterminant de syntagme nominal.

All    the boys are here.
PREDET     Head
PREF Préfixe
PREP Tout syntagme prépositionnel servant à modifier le sens d'un verbe, d'un adjectif, d'un nom, voire d'une autre préposition.

I saw a cat  in   a hat.
        Head PREP

I saw  a cat with a telescope.
  Head       PREP

He is responsible for  meals.
      Head        PREP
PRONL Relation entre un verbe et un morphème verbal (français)
PRT Particule verbale.

They shut down the station.
     Head PRT

He would not put  up  with it.
             Head PRT
PS Marqueur associatif ou possessif
QUANTMOD Modificateur de syntagme de quantification
RCMOD Lien entre un nom et le verbe qui dirige une clause relative.

I saw the man  you love.
          Head     RCMOD

the book that you bought
    Head          RCMOD

Bell, a company which is based in LA, makes and distributes computer products.
        Head             RCMOD
RCMODREL Complétiviseur dans une clause relative (chinois)
RDROP Ellipse sans prédicat précédent (japonais)
REF Référent (hindi)
REMNANT Utilisé pour l'ellipse.

John won bronze, Mary silver, and Sandy gold.
         Head         REMNANT           REMNANT
REPARANDUM Indique des disfluences verbales ignorées dans le cadre d'une correction conversationnelle.

Go to         the righ- to   the left.
   REPARANDUM           Head
ROOT Racine de la phrase. Dans la grande majorité des cas, il s'agit d'un verbe.
SNUM Suffixe indiquant une unité de nombre (japonais)
SUFF Suffixe
TMOD Constituant d'un syntagme nominal nu qui sert à modifier le sens du constituant en spécifiant un moment. "TMOD" capture les points temporels et la durée ; il ne capture pas la répétition (dans le cas de "two times", il sera question de "NPADVMOD").

Last night, I swam in the pool.
     TMOD     Head
TOPIC Thématiseur (chinois)
VMOD Clause centrée sur une forme infinie du verbe.

Berries gathered on this side of the mountain are sweeter.
Head    VMOD

He sat  in the armchair reading the morning newspaper.
   Head                 VMOD

I have nothing to say  to them.
       Head       VMOD
VOCATIVE Marque un participant au dialogue auquel on s'adresse dans le texte (courant dans les e-mails et les publications dans les groupes de discussion).

Anna,    can you bring a tent?
VOCATIVE         Head
XCOMP Complément clausal sans son propre sujet, dont la référence est déterminée par un sujet externe.

He says that you like to swim.
                 Head    XCOMP

I am ready to leave.
     Head     XCOMP
SUFFIX Suffixe du nom
TITLE Titre du nom
AUXCAUS Auxiliaire causatif (japonais)
AUXVV Auxiliaire adjuvant (japonais)
DTMOD Rentaishi (modificateur prénominal)
FOREIGN Mots étrangers
KW Mot clé
LIST Liste de chaînes d'éléments comparables
NOMC Clause substantivée
NOMCSUBJ Sujet clausal substantivé
NOMCSUBJPASS Passif clausal substantivé
NUMC Composé de modificateur numérique (japonais)
COP Copule (espagnol)
DISLOCATED Relation disloquée (pour les éléments antéposés/thématisés)
ASP Marqueur d'aspect
GMOD Modificateur génitif
GOBJ Objet génitif
INFMOD Modificateur infinitif
MES Mesure
NCOMP Complément nominal d'un nom

Pour plus d'informations sur les arborescences de dépendances (ou stemmata), consultez le projet Universal Dependency Treebank. Le document Universal Dependency Annotation for Multilingual Processing contient, en outre, des informations générales sur la méthodologie utilisée pour interpréter un tel stemma.

Analyser une réponse d'analyse syntaxique

Le pseudo-code ci-dessous fournit un modèle commun à utiliser pour effectuer des opérations itératives sur la réponse d'analyse syntaxique :

index = 0
  for sentence in self.sentences:
    content  = sentence['text']['content']
    sentence_begin = sentence['text']['beginOffset']
    sentence_end = sentence_begin + len(content) - 1
    while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
      # This token is in this sentence
      index += 1