Morfología y árboles de dependencia

El método analyzeSyntax muestra detalles sobre la estructura lingüística de un texto dado. Para cada token que aparece en el texto, la API de Natural Language proporciona información sobre su estructura interna (morfología) y su función en la oración (sintaxis).

La Morfología es el estudio de las estructuras internas de las palabras. La morfología se centra en la forma en la que los componentes de una palabra (raíces, prefijos, sufijos, etc.) se organizan o modifican para crear significados diferentes. El inglés, por ejemplo, a menudo agrega "-s" o "-es" al final de los sustantivos contables para indicar pluralidad, y "-d" o "-ed" a un verbo para indicar que está en tiempo pasado. El sufijo "-ly" se agrega a los adjetivos para crear adverbios (por ejemplo, "happy" (feliz) [adjectivo] y "happily" (felizmente) [adverbio]).

La API deNatural Language utiliza el análisis morfológico para inferir información gramatical sobre las palabras.

La morfología varía mucho según el idioma. En idiomas como el ruso, las terminaciones de las palabras indican la función de una palabra en una oración, (por ejemplo, “книга” [libro - caso nominativo] se convierte en “книгу” [caso acusativo] cuando es el objeto directo de un verbo). Esto significa que el orden de las palabras puede variar sin cambiar el significado de la oración, aunque el cambio en el orden de las palabras sí afecta a la adecuación contextual. Idiomas como el inglés y el chino mandarín, los cuales carecen de afijos, dependen más del orden de las palabras en una oración para indicar la función correspondiente de las mismas. Como resultado, el análisis morfológico depende en gran medida del idioma fuente y de la comprensión sobre lo que se acepta en ese idioma.

La sintaxis es el estudio de la estructura de frases y oraciones. La sintaxis y la morfología trabajan en conjunto para indicar las relaciones gramaticales, con los distintos idiomas dividiendo la tarea entre ellos de manera diferente. Por ejemplo, el ruso usa un afijo para la función de objeto directo ("у" en "книгу"), mientras que el inglés usa el orden de las palabras, en el cual el objeto directo sucede al verbo (read the book) [lee el libro].

La respuesta analyzeSyntax muestra información morfológica en el campo partOfSpeech y la relación sintáctica entre las palabras en el campo dependencyTree.

Categorías gramaticales

Dentro de una solicitud sintáctica, las categorías gramaticales y la información morfológica se muestran en el campo partOfSpeech de la respuesta. El campo partOfSpeech contiene un conjunto de subcampos con información de la categoría gramatical (POS), así como información morfológica más explícita. Estos subcampos se enumeran a continuación.

  • tag denota la categoría gramatical con una etiqueta general para las POS (NOUN [SUSTANTIVO], VERB [VERBO], etc.) y proporciona información sintáctica superficial de nivel alto. Las etiquetas de las POS son útiles si quieres crear patrones o reducir la ambigüedad para el análisis subsecuente del idioma (por ejemplo, "train" [tren] etiquetado como NOUN [SUSTANTIVO] en vez de VERB [VERBO]).

  • number denota el número gramatical de una palabra. En inglés, el sufijo "-s" se agrega a los sustantivos contables para indicar que hay más de uno (por ejemplo, "dog+s" [perro+s] indica que es más de un perro). La ausencia del sufijo plural se refiere a menudo como la forma singular. Algunos idiomas, como el árabe, también tienen la noción del número dual. Este campo puede contener los siguientes valores:

    • SINGULAR denota una cantidad.
    • PLURAL denota más de una cantidad.
    • DUAL denota precisamente dos cantidades.
  • person identifica la persona gramatical de una palabra. En inglés, "I/me" (yo) es la primera persona singular y se refiere al emisor (o escritor) de la expresión, mientras que "you" (tú) y "she/her" (ella/su) y "he/him" (él/su) se refieren al receptor (oyente) a quien está destinada y a otra persona, respectivamente. Este campo puede contener los siguientes valores:

    • FIRST (primera) persona denota al emisor.
    • SECOND (segunda) persona denota al receptor, es decir, la persona a quien se le habla.
    • THIRD (tercera) persona denota a quien no es el emisor o receptor.
    • REFLEXIVE_PERSON (persona reflexiva) indica, por ejemplo, que el sujeto y el objeto hacen referencia a la misma entidad, como en "The cat licked itself" (El gato se lamió), donde -self (a sí mismo) se agrega a un pronombre para indicar reflexividad. En ruso y japonés, el reflexivo es un pronombre independiente. Por ejemplo, "John loves himself" (John se ama a sí mismo) en ruso es "Джон любит себя"; себя es la expresión "self" (sí mismo), de género neutro. Por otro lado, en japonés, es "Tarō wa zibun o aisuru" (versión romanizada); "zibun" es la expresión "self" (sí mismo), de género neutro. Consulta pronombre reflexivo.
  • gender denota el género gramatical de un sustantivo. Este campo puede contener los siguientes valores:

    • El género gramatical FEMININE (neutro)
    • El género gramatical MASCULINE (neutro)
    • El género gramatical NEUTER (neutro)
  • case denota el caso gramatical de una palabra y su función en una oración o frase. Este campo puede contener los siguientes valores:

    • El caso ACCUSATIVE (acusativo) indica el objeto directo de un verbo transitivo.
    • El caso ADVERBIAL indica una forma adverbial de un adjetivo. Ten en cuenta que el inglés usa adverbios ("well") (bien) y adjetivos ("good") (bueno) con palabras diferentes. El sufijo -ly en inglés transforma adjetivos en adverbios (por ejemplo, "happy" [feliz] y "happily" [felizmente]), aunque esto no se considera un "caso".
    • El caso COMPLEMENTIVE (comitativo) (chino) indica una palabra que es necesaria para completar el significado de una expresión potencial, descriptiva o resultativa, usando una partícula conjuntiva.
    • El caso DATIVE (dativo) indica un objeto indirecto que hace referencia al referente que recibe el objeto directo. En inglés, el objeto indirecto a menudo se indica con la preposición "to" (a), como en la oración "He gave the ball to Bobby" (Él le dio la pelota a Bobby), donde "Bobby" es el objeto indirecto y quien recibe la pelota. Mientras que en este ejemplo en ruso: Иван дал книгу маше (Ivan gave the book to Masha) (Ivan le entregó el libro a Masha), "-e" indica que “маше” es el objeto indirecto y Masha es quien recibe el libro.
    • El caso GENITIVE (genitivo) indica posesión. Ten en cuenta que a menudo el inglés indica posesión con el afijo "-'s" (de), en lugar de usar un caso genitivo. El sufijo "-'s" puede adjuntarse al final de una frase (por ejemplo, “The man who ran the bill up’s wife paid a dear price for his excess” (La esposa del hombre que se endeudó pagó un precio muy alto por sus excesos), mientras que, en ruso, “-а” marca “Антон-” como genitivo: “Где книга Антона?” (Where is Anton’s book? [¿Dónde está el libro de Anton?]). En ruso, el caso genitivo también aparece como el complemento de palabras como "varios", "pocos". Por ejemplo, en Зимой здесь мало снега ("En invierno, hay poca nieve aquí"), "-a" marca "снег-" (nieve) como genitivo, ya que es el complemento de "мало" ("poca"). No hay ninguna posesión involucrada.
    • El caso INSTRUMENTAL indica si un sustantivo es el instrumento mediante el cual se completa una acción. En ruso, la oración en inglés "He opened the door with a key" (Él abrió la puerta con una llave) sería: "он открыл дверь ключом", donde "-om" se agrega a "ключ" (key) (llave) para indicar un caso instrumental.
    • El caso LOCATIVE (locativo) indica el uso de una palabra para referirse a una ubicación. El inglés no tiene un caso locative.
    • El caso NOMINATIVE (nominativo) está asociado con el sujeto de un verbo. En inglés, el sujeto de una oración se indica a través del orden de las palabras, no del caso. En la oración “The girl won the race” (La niña ganó la carrera), la frase "la niña" es el sujeto, que aparece a la izquierda del verbo "ganó". En ruso, девушка (la/una niña) puede aparecer antes o después el verbo: "девушка выиграла гонку" o "гонку выиграла девушка"; el verbo es выиграла (ganó).
    • El caso OBLIQUE (oblicuo) indica que una palabra se usa como objeto para un verbo o una preposición.
    • El caso PARTITIVE (partitivo) indica la "parcialidad" o falta de identidad específica de una palabra. Un ejemplo del caso partitivo en inglés sería "three of my friends" (tres de mis amigos). En ruso, sería "трое моих друзей"; "трое" es "tres de" (a diferencia de "три друга", donde "три" es "tres").
    • El caso PREPOSITIONAL (preposicional) indica el objeto de una preposición.
    • El REFLEXIVE_CASE (caso reflexivo) indica la identidad de un objeto de un verbo con respecto a su sujeto. La mayoría de los idiomas no utilizan el caso reflexivo, ya que este uso se indica, en cambio, mediante el uso de pronombres reflexivos (como "himself" [él mismo], "myself" [yo mismo], etc.")
    • El RELATIVE_CASE (vaso relativo) (chino) indica el complemento de una frase relativa que conecta un sustantivo con un verbo o un adjetivo. Ejemplos: 工作 [的] 地方 (work [] place :: "place [where I] work") (lugar de [] trabajo:: "lugar [donde yo] trabajo"). 便宜 的 餐馆 (inexpensive [] restaurants :: restaurants [that are] inexpensive) (resturantes [] baratos:: restaurantes [que son] baratos).
    • El caso VOCATIVE (vocativo) indica un sustantivo utilizado para dirigirse a alguien o algo, generalmente, cuando se le habla.
  • tense denota el tiempo gramatical de un verbo, que indica la referencia del verbo a una posición en el tiempo. Ten en cuenta que tense es distinto de aspect, que también se asocia a la relación de un verbo con el tiempo, pero se centra en las características de ese flujo de tiempo en lugar de su posición. Los tiempos IMPERFECT (imperfecto) y PLUPERFECT (pluscuamperfecto) en muchos idiomas se refieren, de manera más precisa, a combinaciones específicas de tiempo y aspecto. Este campo puede contener los siguientes valores:

    • CONDITIONAL_TENSE es un término alternativo para el término morfológico más anterior al estado "condicional". (Consulta CONDITIONAL_MOOD a continuación).
    • FUTURE (futuro) denota una acción que se llevará a cabo en el futuro. Ten en cuenta que en inglés el tiempo futuro generalmente se indica agregando la palabra "will" a una frase verbal.
    • PAST (pasado) denota una acción que se llevó a cabo en el pasado.
    • PRESENT (presente) denota una acción que se lleva a cabo en el presente.
    • IMPERFECT (imperfecto) denota una acción que se llevó a cabo en el pasado, pero que no se completó en el marco de referencia de ese tiempo. Ten en cuenta que, en inglés, el tiempo imperfecto, generalmente, se denota agregando un verbo en forma de gerundio al tiempo pasado, como en "I was walking" (Yo estaba caminando). Un evento en tiempo imperfecto sucede en el pasado, pero no se completa en ese tiempo pasado.
    • PLUPERFECT (pluscuamperfecto) denota una acción que se llevó a cabo en el pasado y que se completó en el marco de referencia de ese tiempo. Por ejemplo, "I had walked" (Había caminado) ocurre en el pasado, pero además se completó en el marco de referencia del tiempo pasado.
  • aspect denota el aspecto gramatical de un verbo, su expresión del flujo de tiempo. A diferencia del tense, que se centra en la posición de un verbo en el tiempo, el aspect se enfoca en las características de ese flujo de tiempo donde en el que ocurre. Este campo puede contener los siguientes valores:

    • El aspecto PERFECTIVE (perfecto) denota un evento que se "completó", ya sea porque ocurrió "por completo" en el pasado o porque ocurrirá "por completo" en el futuro.
    • El aspecto IMPERFECTIVE (imperfecto) denota un evento que está incompleto, ya sea porque es continuo o porque se repite.
    • El aspecto PROGRESSIVE (progresivo) denota un evento que es continuo. Un aspecto progresivo generalmente se trata como un caso especial del aspecto imperfectivo más general (que también cubre la repetición).

  • mood denota el modo gramatical de un verbo, el cual representa una actitud con respecto a una acción subyacente. Este campo puede contener los siguientes valores:

    • CONDITIONAL_MOOD (modo condicional) indica una acción que es contingente. Ten en cuenta que en inglés las formas verbales no son condicionales; en cambio, el comportamiento condicional se observa mediante el uso de la palabra "would" (podría) combinado con el infinitivo del verbo.
    • IMPERATIVE (imperativo) indica una orden o solicitud en segunda persona.
    • INDICATIVE (indicativo) indica una declaración de un hecho y se suele conocer como "modus realis".
    • INTERROGATIVE (interrogativo) indica una pregunta.
    • JUSSIVE (yusivo) indica una orden o solicitud en primera o tercera persona. El inglés no cuenta con un modo yusivo, aunque las órdenes que comienzan con la expresión "Let us" (Vamos a) real o implícita expresan este modo yusivo.
    • SUBJUNCTIVE (subjuntivo) indica una cualidad de incertidumbre relacionada con una acción, también conocido como "modus irrealis" (en contraste con el "modus realis" indicativo). El inglés no tiene un modo subjuntivo específico; en cambio, palabras como "want" (quiero), "wish" (deseo), "hope" (espero), etc. expresan la relevancia el modo subjuntivo.
  • voice denota la voz gramatical de un verbo, la relación entre una acción y un sujeto o un objeto. Este campo puede contener los siguientes valores:

    • La voz ACTIVE (activa) indica una acción que realiza el sujeto gramatical.
    • La voz CAUSATIVE (pasiva) indica una acción cuyo efecto afecta al sujeto gramatical. En inglés no existe la voz causativa directa; en cambio, la causatividad se expresa mediante el uso del verbo "make" (hacer), como en "Mom made me go to school" (Mi mamá me hizo ir a la escuela).
    • La voz PASSIVE (pasiva) indica una acción cuyo efecto afecta al sujeto gramatical. En muchos casos, un "agente" pasivo es tácito o desconocido.
  • reciprocity denota la reciprocidad de una palabra (por lo general, un pronombre); indica que el pronombre hace referencia a una frase nominal en otra ubicación de la oración. Este campo puede contener los siguientes valores:

    • RECIPROCAL (recíproco) indica que el pronombre es recíproco.
    • NON_RECIPROCAL (NO recíproco) indica que el pronombre no es recíproco.
  • proper denota si un sustantivo es parte de un nombre propio. Ten en cuenta que muchos nombres propios constan de varias palabras; si esta frase se detecta como un nombre propio, cada token se detectará como propio también. Por ejemplo, tanto "Wrigley" como "Field" en el nombre propio "Wrigley Field" tendrán su atributo propio configurado como PROPER. Este campo puede contener los siguientes valores:

    • PROPER (propio) denota que el token es parte de un nombre propio.
    • NOT_PROPER (no propio) denota que el token no es parte de un nombre propio.
  • form denota formas morfológicas adicionales que no encajan perfectamente en el conjunto anterior de formas comunes (tense, mood, person, etcétera). La mayoría de estas formas son específicas para idiomas únicos. Este campo puede contener los siguientes valores:

    • ADNOMIAL (adnominal) (coreano/japonés) indica la terminación de una palabra (coreano) o un verbo (japonés) que modifica una frase nominal. Ejemplos: 밥을 먹는 사람 [someone who eats rice] (persona que come arroz) y 書く人 [someone who writes] (persona que escribe).
    • AUXILIARY (auxiliar) (coreano) indica la terminación de una palabra que conecta dos predicados, una principal y uno secundario adyacentes: 밥을 먹게 하다 [make (someone) to eat] (hacer (que alguien) coma).
    • COMPLEMENTIZER (complementativo) (coreano) indica la terminación de una palabra que conecta dos o más frases distintas: 밥을 먹고 물을 마신다 [(I) eat rice and drink water] ([Yo] como arroz y bebo agua)
    • FINAL_ENDING (terminación final) (coreano/japonés) indica la terminación de una palabra que finaliza la frase o oración que está al final de la frase o oración. Ejemplos: 밥을 먹는다 [(I) eat rice] ([Yo] como arroz) y 手紙を書く [write a letter] (Escribir una carta).
    • GERUND (Gerundio) (coreano/japonés) indica la terminación de una palabra que nominaliza a los verbos o adjetivos ([coreano] 밥 먹기 [eating rice] (comiendo arroz), o conecta los verbos con varios verbos auxiliares ((japonés) 書きたい [want to write] (quiero escribir)).
    • REALIS (realis) (japonés) indica las formas condicionales y subjuntivas que tiene una partícula conjuntiva "ば": 書けば [if (I) write] (Si (yo) escribo).
    • IRREALIS (irrealis) (japonés) indica la conexión de verbos con verbos auxiliares negativos, pasivos o causativos: 書かない [do not write] (no escribir), 書かれる [to be written] (estar escrito), 書かせる [make (someone) write] (hacer que alguien escriba).
    • ORDER (orden) (japonés) indica un verbo de orden, similar a un imperativo: 書け! [write!] (¡Escribe!)
    • SPECIFIC (específico) (japonés) indica formas especiales que no pertenecen a ninguna de las seis categorías anteriores. El uso más común de esta forma es la derivación de un sustantivo a partir de un adjetivo agregando un sufijo a la forma: かわいさ [cuteness] (ternura).
    • SHORT (corto) (ruso) indica un adjetivo o participio de forma corta.
    • LONG (largo) (ruso) indica un adjetivo o participio de forma larga, en contraste con la forma SHORT anterior.

Ten en cuenta que la API de Natural Language proporciona información morfológica por token (no por frase). Es posible que las construcciones morfológicas que cruzan los límites de las palabras no sean compatibles.

Árboles de dependencia

Dentro de una solicitud sintáctica, las categorías gramaticales y la información morfológica se muestran en el campo partOfSpeech de la respuesta.

Para cada oración dentro del texto proporcionado a la API de Natural Language para el análisis sintáctico, la API construye un árbol de dependencia que describe la estructura sintáctica de esa oración. La información sintáctica se muestra en el campo dependencyEdge de la respuesta.

Un diagrama del árbol de dependencias para esta oración única de John F. El discurso inaugural de Kennedy se muestra a continuación:

Para cada token, el elemento dependencyEdge identifica a qué otro token modifica (en el campo headTokenIndex) y la relación sintáctica entre este token y el token principal (en el campo label). Por ejemplo, aquí está el elemento dependencyEdge para el token "your" (tu) en (la primera aparición de) la frase "your country" (tu país):

      "dependencyEdge": {
        "headTokenIndex": 4,
        "label": "POSS"
      },

Este elemento indica que "your" modifica el quinto token (headTokenIndex usa un desplazamiento basado en cero) y que es un modificador posesivo.

Cada árbol de dependencia incluye un elemento ROOT ("label": ROOT), que corresponde al verbo principal de la oración. En el ejemplo anterior, el elemento ROOT es la primera palabra de la oración ("headTokenIndex": 0). Para la palabra ROOT "Ask", el headTokenIndex es su propio índice.

Aunque los árboles de análisis no cruzan los límites de las oraciones, la API de Natural Language indexa las oraciones y los tokens que utilizan valores de desplazamiento basados en cero en el texto como un todo.

La API de Natural Language etiqueta las relaciones sintácticas mediante el uso de un conjunto de dependencias comunes que se aplican a todos los idiomas compatibles. Las etiquetas se describen a continuación. En el texto de ejemplo, "Head" y la etiqueta aparecen debajo de los tokens a los que se aplican.

Etiqueta Descripción
UNKNOWN Relación desconocida
ABBREV Abreviatura del token principal

British Broadcasting Company (BBC)
                     Head     ABBREV
ACOMP Frase adjetiva que funciona como un complemento (como un objeto del verbo). Esta relación incluye específicamente as construcciones copulativas "be" con predicados adjetivales.

The book looks heavy.
         Head  ACOMP

The book is   heavy.
         Head ACOMP
La etiqueta también se aplica a los adjetivos sin argumentos auxiliares y al elevar construcciones con predicados adjetivales.

She arrived sad.
    Head    ACOMP

I consider John intelligent.
  Head          ACOMP
ADVCL Frase adverbial que modifica un verbo, como una frase temporal, una consecuencia, una frase condicional o una cláusula de propósito.

The accident happened as the night was falling.
             Head                      ADVCL

If you know who did it, you should tell the teacher.
       ADVCL                       Head

He talked to him in order to secure the account.
   Head                      ADVCL
ADVPHMOD Modificador de frase adverbial (japonés)
ADVMOD Adverbio (no oracional) o frase adverbial que sirve para modificar el significado de una palabra.

Genetically modified food.
ADVMOD      Head

less   often
ADVMOD Head

About  200 people came to the party.
ADVMOD Head
AMOD Frase adjetival que sirve para modificar el significado de una frase nominal.

Sam eats red  meat.
         AMOD Head

Sam took out a 3 million dollar loan.
                         AMOD   Head
APPOS Frase nominal inmediatamente a la derecha de otra frase nominal, siendo la segunda frase la que tiene la función de definir o modificar a la primera.

Sam, my brother, arrived.
Head    APPOS

Bill (John’s cousin)
Head         APPOS
ATTR Frase nominal encabezada por un verbo copulativo. Ten en cuenta que "ATTR" se diferencia de "ACOMP" en que el dependiente es una frase nominal, no un adjetivo.

He is  a doctor.
   Head ATTR

She resembles her mother.
    Head          ATTR
En las preguntas, el pronombre -wh o el nombre en la frase -wh están en la relación de "ATTR" con "ROOT".

What is  your name?
ATTR Head     NSUBJ

What breed is   the dog?
     ATTR  Head     NSUBJ
Para elevar construcciones con predicados nominales también se usa la relación "ATTR".

I consider John an intelligent person.
  Head                         ATTR
AUX Verbo no principal, como un auxiliar modal o una forma de "be", "do", o "have" en un tiempo perifrástico. Excluye el uso de "be" como auxiliar en una construcción pasiva.

Reagan has died.
       AUX Head

He should leave.
   AUX    Head
AUXPASS Verbo no principal de una frase en la voz pasiva.

Kennedy has been    killed.
        AUX AUXPASS Head

Kennedy was/got killed.
        AUXPASS Head
CC Relación entre un elemento de una conjunción y la conjunción coordinante. Una conjunción de una conjunción (normalmente la primera), se trata como la parte principal de la conjunción.

Bill is big  and honest.
        Head CC

They either ski  or snowboard.
            Head CC

Bill went to Florida but Jane traveled to Alaska.
     Head            CC
CCOMP Frase dependiente con un sujeto interno que funciona como un objeto del verbo o adjetivo.

He says that you like  to swim.
   Head          CCOMP

I am certain that he did   it.
     Head            CCOMP

I admire the fact that you are   honest.
             Head          CCOMP
CONJ La relación entre dos elementos conectados por una conjunción coordinante, como "y" o "o". La parte principal de la relación es la primera conjunción y otras conjunciones dependen de ella a través de la relación "conj".

Bill is big and honest.
        Head    CONJ

They either ski  or snowboard.
            Head    CONJ

We have apples, pears, oranges, and bananas.
        DOBJ    CONJ   CONJ         CONJ
CSUBJ Sujeto sintáctico oracional de una frase; es decir, el sujeto es en sí mismo una frase (por ejemplo, "What she said" (Lo que ella dijo) en el ejemplo a continuación).

What she said  makes sense.
         CSUBJ Head
CSUBJPASS Un sujeto sintáctico oracional de una frase pasiva.

That she lied was suspected by everyone.
         CSUBJ    Head
DEP El sistema no puede determinar una relación de dependencia más precisa entre dos palabras.

Then, as if  to show that he could, . . .
         DEP    Head

travel agency florence kentucky
       Head   DEP
DET La relación entre la parte principal de una frase nominal y su determinante.

The man is here.
DET Head

Which book do you prefer?
DET   Head
DISCOURSE Interjecciones y otros elementos del discurso que no están claramente vinculados a la estructura de la oración, excepto de manera expresiva. Algunos ejemplos son las interjecciones ("oh", "uh-huh", "Welcome"), las muletillas ("um", "ah") y los marcadores de discurso ("well", "like", "actually", pero no "you know").

Iguazu is   in Argentina :)
       Head              DISCOURSE
DOBJ Frase nominal que es el objeto ([acusativo] (https://en.wikipedia.org/wiki/Accusative_case)) de un verbo.

She gave me a raise.
    Head      DOBJ

They win  the lottery.
     Head     DOBJ
EXPL Nominal pleonástico. En inglés, esto es algunos usos de "it" y "there": el existencial "there" y "it" cuando se usa en construcciones de extraposición. Un nominal expletivo o pleonástico es aquel en el que el nominal no cumple una función semántica en el predicado. En idiomas con expletivos, se pueden colocar en el sujeto y en las ranuras de objetos directos.

There is   a ghost in the room.
EXPL  Head   NSUBJ

It   is clear that we should decline.
EXPL Head
GOESWITH Enlaza dos partes de una palabra que están separadas en el texto.
IOBJ La frase nominal que es el objeto indirecto de un verbo ([dativo] (https://en.wikipedia.org/wiki/Dative_case)).

She gave me   a present.
    Head IOBJ   DOBJ
MARK La palabra que ingresa una cláusula subordinada finita o no finita, como "that" o "head" es la cabeza de la cláusula subordinada.

Forces engaged in fighting after insurgents attacked.
                           MARK             Head

He says that you like to swim.
        MARK     Head
MWE Una de las dos relaciones (junto a "NN") para el compuesto. Se utiliza para ciertas expresiones gramaticales fijas con palabras funcionales que se comportan como una sola palabra funcional. Las expresiones de varias palabras se anotan en una estructura plana principal inicial, en la que todas las palabras de la expresión modifican a la primera mediante la etiqueta "MWE".

I like dogs as   well as  cats.
            Head MWE  MWE

He cried because of  you.
         Head    MWE
MWV Expresión verbal de varias palabras.
NEG La relación entre una palabra de negación y la palabra que modifica.

Bill is    not a scientist.
     Head  NEG

Bill is no  scientist.
        NEG Head
NN Cualquier sustantivo que sirva para modificar el sustantivo principal.

phone book
NN    Head

oil price futures
NN  NN    Head
NPADVMOD Frase nominal utilizada como un modificador adverbial.

The director is 65 years    old.
                   NPADVMOD Head

Six feet     long
    NPADVMOD Head

Shares eased a fraction.
       HEAD    NPADVMOD

The silence is itself   significant.
               NPADVMOD Head

90% of Australians like him, the most     of any country.
                   Head          NPADVMOD
NSUBJ Frase nominal que es el sujeto sintáctico de una frase.

Clinton defeated Dole.
NSUBJ   Head

The baby  is   cute
    NSUBJ Head
NSUBJPASS Frase nominal que es el sujeto sintáctico de una frase pasiva.

Dole       was defeated by Clinton.
NSUBJPASS      Head
NUM Cualquier frase numérica que sirve para modificar el significado del sustantivo con una cantidad.

Sam ate three sheep.
        NUM   Head
NUMBER Parte de una frase numérica.

I have four   thousand sheep.
       NUMBER Head
P Cualquier pieza de puntuación en una frase.
PARATAXIS La relación de parataxis (griego para "ubicar lado a lado") es una relación entre una palabra (a menudo el predicado principal de una oración) y otros elementos ubicados lado a lado sin ninguna relación explícita de coordinación, subordinación o argumento con la palabra principal. La parataxis es un discurso equivalente a la coordinación.

Let's face it we're annoyed.
Head                PARATAXIS

The guy, John said,     left early in the morning.
              PARATAXIS Head
PARTMOD Modificador participial
PCOMP Se utiliza cuando el complemento de una preposición es una frase o oración preposicional (o ocasionalmente, una frase adverbial).

We have no information on   whether users are   at risk.
                       Head               PCOMP

They heard about you missing classes.
           Head      PCOMP
POBJ La parte superior de una frase nominal que sigue a una preposición o los adverbios"`'aquí&"

I sat on   the chair.
      Head     POBJ

What does CPR stand for?
POBJ                Head
POSS Determinador posesivo o modificador [genitivo] (https://en.wikipedia.org/wiki/Genitive_case).

their offices
POSS  Head

Bill’s clothes.
POSS   Head
POSTNEG Partícula negativa posverbal
PRECOMP Complemento del predicado
PRECONJ Palabra que aparece al comienzo entre corchetes de una conjunción, como "ambos"; o ninguno, dos o tres;

Both    the boys and the girls are here.
PRECONJ     Head
PREDET Palabra que precede y modifica el significado de un determinante de una frase nominal.

All    the boys are here.
PREDET     Head
PREF Prefijo
PREP Cualquier frase preposicional que sirve para modificar el significado de un verbo, adjetivo, sustantivo o incluso otra preposición.

I saw a cat  in   a hat.
        Head PREP

I saw  a cat with a telescope.
  Head       PREP

He is responsible for  meals.
      Head        PREP
PRONL La relación entre un verbo y un morfema verbal (francés)
PRT Una partícula del verbo.

They shut down the station.
     Head PRT

He would not put  up  with it.
             Head PRT
PS Marcador asociativo o posesivo
QUANTMOD Modificador de frase cuantificador
RCMOD Un vínculo desde un sustantivo al verbo principal de una frase relativa.

I saw the man  you love.
          Head     RCMOD

the book that you bought
    Head          RCMOD

Bell, a company which is based in LA, makes and distributes computer products.
        Head             RCMOD
RCMODREL Complementador en una frase relativa (chino)
RDROP Elipsis sin predicado anterior (japonés)
REF Referente (hindi)
REMNANT Se utiliza para la elipsis.

John won bronze, Mary silver, and Sandy gold.
         Head         REMNANT           REMNANT
REPARANDUM Indica errores de fluidez anulados en una corrección de pronunciación.

Go to         the righ- to   the left.
   REPARANDUM           Head
ROOT La raíz de la oración. En la gran mayoría de los casos es un verbo.
SNUM Sufijo que especifica una unidad de número (japonés)
SUFF Sufijo
TMOD Componente de una frase nominal simple que sirve para modificar el significado del componente especificando un tiempo. "TMOD" captura los puntos temporales y la duración; no captura la repetición ("two times", que sería un "NPADVMOD").

Last night, I swam in the pool.
     TMOD     Head
TOPIC Marcador de tema (chino)
VMOD Frase cuya parte principal es una forma infinita del verbo.

Berries gathered on this side of the mountain are sweeter.
Head    VMOD

He sat  in the armchair reading the morning newspaper.
   Head                 VMOD

I have nothing to say  to them.
       Head       VMOD
VOCATIVE Marca un diálogo del participante mencionado en texto (común en correos electrónicos y publicaciones de grupos de noticias).

Anna,    can you bring a tent?
VOCATIVE         Head
XCOMP Complemento oracional sin su tema propio, cuya referencia está determinada por un sujeto externo.

He says that you like to swim.
                 Head    XCOMP

I am ready to leave.
     Head     XCOMP
SUFFIX Sufijo nominal
TITLE Título del nombre
AUXCAUS Auxiliar causativo (japonés)
AUXVV Auxiliar de ayuda (japonés)
DTMOD Rentaishi (modificador prenominal)
FOREIGN Palabras extranjeras
KW Palabra clave
LIST Lista para cadenas de elementos comparables
NOMC Frase nominalizada
NOMCSUBJ Sujeto oracional nominalizado
NOMCSUBJPASS Pasivo oracional nominalizado
NUMC Compuesto del modificador numérico (japonés)
COP Cópula (español)
DISLOCATED Relación dislocada (para elementos llevados al frente/topicalizados)
ASP Marcador de aspecto
GMOD Modificador genitivo
GOBJ Objeto genitivo
INFMOD Modificador infinitivo
MES Medir
NCOMP Complemento nominal de un sustantivo

Para obtener más información sobre los árboles de dependencia, consulta el Proyecto Universal Dependency Treebank. Además, el documento Universal Dependency Annotation for Multilingual Processing contiene información básica sobre la metodología utilizada para interpretar ese árbol de dependencias.

Analizar una respuesta de análisis sintáctico

El siguiente pseudocódigo proporciona un patrón común para usar cuando se realizan operaciones iterativas en la respuesta del análisis sintáctico:

index = 0
  for sentence in self.sentences:
    content  = sentence['text']['content']
    sentence_begin = sentence['text']['beginOffset']
    sentence_end = sentence_begin + len(content) - 1
    while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
      # This token is in this sentence
      index += 1