형태론 및 종속성 트리

analyzeSyntax 메서드는 주어진 텍스트의 언어 구조에 대한 세부정보를 반환합니다. 텍스트에 있는 각 토큰에 대해 Natural Language API는 내부 구조(형태론) 및 문장 내 역할(구문)에 대한 정보를 제공합니다.

형태론은 단어의 내부 구조를 연구하는 것입니다. 형태론은 단어 내 구성요소(어간, 어근, 접두사, 접미사 등)가 어떻게 정렬 또는 수정되어 다양한 의미를 만들어내는지에 초점을 맞춥니다. 예를 들어 영어에서는 종종 가산명사 끝에 '-s' 또는 '-es'를 추가하여 복수형을 나타내고 동사 뒤에 '-d' 또는 '-ed'를 추가하여 과거형을 나타냅니다. 접미사 '-ly'를 형용사에 추가해 부사를 만듭니다(예: 'happy'[형용사]와 'happily'[부사]).

Natural Language API는 형태론 분석을 사용하여 단어에 대한 문법적 정보를 추론합니다.

형태론은 언어에 따라 크게 다릅니다. 러시아어와 같은 언어에서 단어 끝은 문장에서 단어의 역할을 나타냅니다(예: 'книга'[책, 주격]이 동사의 직접 대상이 될 때 'книгу'[목적격]으로 변합니다). 즉, 단어 순서는 문장의 의미 변화 없이 바뀔 수 있지만 단어 순서가 바뀌면 문맥적 적합성에 영향을 줍니다. 격을 나타내는 접사가 부족한 영어와 북경어 같은 언어는 각 단어의 역할을 표시하기 위해 문장 내 단어 순서에 더 많이 의존합니다. 그 결과, 형태론적 분석은 출발어에 크게 의존하며 해당 언어 내에서 무엇이 지원되는지를 이해해야 합니다.

구문은 문구와 문장의 구조에 대한 연구입니다. 구문 및 형태론은 서로 연동되어 문법적 관계를 나타내지만, 언어마다 이 둘이 사용되는 방법이 다릅니다. 예를 들어 러시아어에서는 접사를 사용하여 직접 목적어의 역할을 나타내는 반면('книгу'의 'у'), 영어에서는 직접 목적어가 동사 뒤에 오는(read the book) 단어 순서를 사용합니다.

analyzeSyntax 응답은 partOfSpeech 필드에 형태론적 정보를, dependencyTree 필드에 단어 간 구문적 관계를 반환합니다.

품사

구문 요청 안에서는 품사와 형태론적 정보가 응답의 partOfSpeech 필드 내에 반환됩니다. partOfSpeech 필드는 좀 더 명확한 형태론적 정보 뿐만 아니라 품사(POS) 정보를 가진 일련의 하위 필드를 포함합니다. 해당 하위 필드는 다음과 같습니다.

  • tag는 간단한 POS 태그(NOUN, VERB 등)를 사용하여 품사를 표시하며 대략적인 구문 정보를 제공합니다. POS 태그는 후속 언어 분석을 위해 패턴을 만들거나 모호성을 줄이고자 하는 경우에 유용합니다(예: 'train'에 VERB가 아닌 NOUN를 태깅함).

  • number는 단어의 문법적 수를 나타냅니다. 영어에서 접미사 '-s'는 가산 명사에 추가되어 둘 이상을 나타냅니다. 예를 들어 'dog+s'는 두 마리 이상의 개를 나타냅니다. 복수형 서픽스의 부재는 단수형을 나타내는 경우가 많습니다. 아랍어 같은 일부 언어에서는 양수(두 개 또는 한 쌍을 나타내는 수)도 표시합니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • SINGULAR는 1개를 나타냅니다.
    • PLURAL은 2개 이상을 나타냅니다.
    • DUAL은 정확히 2개를 나타냅니다.
  • person은 단어의 문법적 인칭을 식별합니다. 영어에서 'I/me'는 1인칭 단수이며 표현의 화자(또는 필자)를 가리키며 'you', 'she/her 및 he/him'은 각각 의도된 수신인(청취자)과 그 외의 다른 사람을 가리킵니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • FIRST: 화자를 나타냅니다.
    • SECOND: 의도된 수신인, 즉 말을 듣는 당사자를 나타냅니다.
    • THIRD: 화자/청취자 이외의 사람을 나타냅니다.
    • REFLEXIVE_PERSON은 예를 들어 주어, 그리고 같은 항목을 참조하는 목적어를 나타냅니다(예: 'The cat licked itself'). 여기서 -self는 대명사에 연결되어 재귀성을 나타냅니다. 러시아어와 일본어에서는 독립형 대명사로 재귀 용법을 나타냅니다. 예를 들어 'John loves himself'를 러시아어로 하면 'Джон любит себя'이며, 여기서 себя는 성별 중립적인 'self'입니다. 일본어에서는 'Tarō wa zibun o aisuru'(로마자 표기 버전)이며 여기서 'zibun'은 성별 중립적인 'self'입니다. 재귀대명사를 참조하세요.
  • gender는 명사의 문법적 성을 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • 문법적 성 FEMININE
    • 문법적 성 MASCULINE
    • 문법적 성 NEUTER
  • case는 단어의 문법적 격과 문구 또는 문장에서 그 역할을 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • ACCUSATIVE은 타동사의 직접목적어를 나타냅니다.
    • ADVERBIAL은 형용사의 부사형을 나타냅니다. 영어는 부사('well')와 형용사('good')에 개별 단어를 사용합니다. 영어에서 서픽스 -ly는 형용사에서 부사를 파생하지만(예: 'happy', 'happily'), '격'으로 간주되지는 않습니다.
    • COMPLEMENTIVE 격(중국어)은 접속사를 사용하여 잠재적, 서술적, 결과적 표현의 의미를 완성하는 데 필요한 단어를 나타냅니다.
    • DATIVE은 직접목적어를 받는 지시 대상을 가리키는 간접목적어를 나타냅니다. 영어에서 간접목적어는 전치사 'to'로 가리키는 경우가 많습니다. 예를 들어 'He gave the ball to Bobby'에서 'Bobby'는 간접목적어이며 공을 받는 사람입니다. 반면 러시아어 예문 Иван дал книгу маше(Ivan gave the book to Masha)에서 '-e'는 'маше'가 간접목적어임을 나타내며, Masha는 책을 받는 사람입니다.
    • GENITIVE은 소유를 나타냅니다. 영어의 경우 소유격을 사용하는 대신 '-'s' 접사를 사용하여 소유를 나타내는 경우가 많습니다. '-'s' 접사는 문구의 끝에 붙을 수 있습니다(예: '[The man who ran the bill up]’s wife paid a dear price for his excess.'). 반면 러시아어 예문 'Где книга Антона?'(Where is Anton’s book)에서 '-а'는 'Антон-'를 소유격으로 표시합니다. 러시아어에서 소유격은 'several', 'few'와 같은 단어의 보어로 나타날 수도 있습니다. 예를 들어 Зимой здесь мало снега('In winter there is little snow here')에서 '-a' 는 'мало'('little')의 보어이므로 'снег-'(snow)를 소유격으로 표시합니다.
    • INSTRUMENTAL은 명사가 행동 완료의 매개체인지 여부를 나타냅니다. 러시아어로 영어 문장 'He opened the door with a key'는 'он открыл дверь ключом'이며, 여기서 '-om'은 'ключ'(key)에 붙어 구격을 나타냅니다.
    • LOCATIVE은 위치를 가리키기 위한 단어 사용을 나타냅니다. 영어에는 처격이 없습니다.
    • NOMINATIVE은 동사의 주어와 관련됩니다. 영어에서 문장의 주어는 격이 아닌 단어 순서를 통해 명시됩니다. 'The girl won the race' 문장에서 주어는 'the girl' 문구이며 동사 'won'의 왼쪽에 나타납니다. 러시아어에서 девушка(the/a girl)는 동사 앞 또는 뒤에 올 수 있으며('девушка выиграла гонку' 또는 'гонку выиграла девушка') 여기서 동사는 выиграла(won)입니다.
    • OBLIQUE은 단어가 동사 또는 전치사의 목적어로 사용되었음을 나타냅니다.
    • PARTITIVE은 단어의 '불완전성' 또는 구체적인 독자성 부족을 나타냅니다. 영어에서 부분사의 예로는 'three of my friends.'가 있습니다. 러시아어로는 'трое моих друзей'이며 여기서 'трое'는 'three of'(비교하면 'три друга'에서는 'три'이 'three'에 해당)입니다.
    • PREPOSITIONAL은 전치사의 목적어를 나타냅니다.
    • REFLEXIVE_CASE는 동사의 목적어가 주어에 해당함을 나타냅니다. 대부분의 언어는 재귀격을 사용하지 않습니다. 이 용례는 특수한 재귀대명사를 대신 사용하여 나타내기 때문입니다('himself', 'myself' 등).
    • RELATIVE_CASE(중국어)는 명사와 동사/형용사를 연결하는 관계절의 보문 표시를 나타냅니다. 예: 工作 [的] 地方(work [] place :: 'place [where I] work'). 便宜 的 餐馆(inexpensive [] restaurants :: restaurants [that are] inexpensive).
    • VOCATIVE은 주로 말을 걸 때 누구 또는 무엇을 부르는 데 사용되는 명사를 나타냅니다.
  • tense는 시간 속에서 동사가 차지하는 위치를 기준으로 하는 동사의 문법적 시제를 나타냅니다. tense는 동사의 시간 관계를 다루는 또 다른 구성요소인 aspect와 다릅니다. aspect는 시간 속의 위치보다는 시간의 흐름이라는 특성에 초점을 맞추기 때문입니다. 여러 언어에서 등장하는 IMPERFECTPLUPERFECT 시제는 시제와 상의 구체적인 조합을 보다 정확하게 보여줍니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • CONDITIONAL_TENSE는 흔히 알려진 형태론적 용어인 '조건법'의 대체 용어입니다. 아래 CONDITIONAL_MOOD를 참조하세요.
    • FUTURE는 미래에 진행될 행동을 나타냅니다. 영어에서는 대부분의 경우 동사구에 'will'이라는 단어를 추가함으로써 미래형을 나타냅니다.
    • PAST는 과거에 진행된 행동을 나타냅니다.
    • PRESENT는 현재 진행되는 행동을 나타냅니다.
    • IMPERFECT는 과거에 진행되었지만 해당 시제의 시점을 기준으로 아직 완료되지 않았던 행동을 나타냅니다. 영어에서는 대부분의 경우 'I was walking'과 같이 과거형에 동명사 형태의 동사를 추가함으로써 미완료 시제를 나타냅니다. 미완료 시제 사건은 과거에 진행되었지만 해당 과거 시점을 기준으로는 아직 완료되지 않은 것입니다.
    • PLUPERFECT는 과거에 진행되었으며 해당 시제를 기준으로 완료된 행동을 나타냅니다. 예를 들어 'I had walked'는 과거에 진행되었으며 과거형 시점을 기준으로 완료된 것입니다.
  • aspect는 동사의 문법적 상, 즉 시간 흐름의 표현을 나타냅니다. 시간 속의 동사 위치에 초점을 맞추는 tense와 달리, aspect는 동사의 행동이 진행되는 곳에서 시간 흐름의 특성에 초점을 맞춥니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • PERFECTIVE은 사건이 과거에서 완전히 끝났거나 완전히 미래에서 진행될 것이기 때문에 '완료된' 사건을 나타냅니다.
    • IMPERFECTIVE은 지속적이거나 반복적이기 때문에 완료되지 않은 사건을 나타냅니다.
    • PROGRESSIVE은 지속적인 사건을 나타냅니다. 대개의 경우 진행형은 좀더 일반적인 미완료형(반복도 포함함)의 특수 용법으로 취급됩니다.

  • mood는 행동에 대한 태도를 나타내는 동사의 서법을 의미합니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • CONDITIONAL_MOOD는 불확정적인 행동을 나타냅니다. 영어에서는 조건부 동사형이 없습니다. 대신 'would'와 동사 원형을 결합하여 조건부 행동을 표시합니다.
    • IMPERATIVE는 2인칭을 사용하는 명령이나 요청을 나타냅니다.
    • INDICATIVE는 사실의 기술을 나타냅니다. '현실적 서법'이라는 표현으로 더 잘 알려져 있습니다.
    • INTERROGATIVE는 질문을 나타냅니다.
    • JUSSIVE는 1인칭 또는 3인칭을 사용하는 명령이나 요청을 나타냅니다. 영어에는 명령 서법이 없습니다. 대신, 실질적인 또는 암시적인 'Let us'로 시작되는 권고가 이러한 명령 서법과 비슷합니다.
    • SUBJUNCTIVE는 행동과 관련된 불확실성의 정도를 나타냅니다. 이를 '비현실적' 서법이라고도 합니다('현실적' 직설법과 대비되는 개념). 영어에는 구체적인 가정법이 없습니다. 대신 'want', 'wish', 'hope' 등의 단어로 가정법의 의미를 전달합니다.
  • voice는 행동과 주어/목적어 간의 관계인 동사의 문법적 태를 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • ACTIVE는 주어가 행동을 수행하는 것을 나타냅니다.
    • CAUSATIVE는 주어가 행동의 영향을 받는 것을 나타냅니다. 영어에서는 직접적인 사역태가 존재하지 않습니다. 대신 'Mom made me go to school'에서처럼 동사 'make'를 사용하여 표현합니다.
    • PASSIVE는 주어가 행동의 영향을 받는 것을 나타냅니다. 대부분의 경우 수동태의 '행위자'는 언급되지 않거나 알 수 없습니다.
  • reciprocity는 단어(일반적으로 대명사)의 상호관계를 나타냅니다. 상호관계란 대명사가 같은 문장의 다른 곳에 있는 명사구에 해당한다는 것을 의미합니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • RECIPROCAL은 대명사가 상호적임을 나타냅니다.
    • NON_RECIPROCAL은 대명사가 상호적이 아님을 나타냅니다.
  • proper는 명사가 고유명사의 일부인지를 나타냅니다. 많은 고유명사는 여러 개의 단어로 구성되어 있습니다. 구가 고유명사로 감지되는 경우 각 토큰도 고유명사로 감지됩니다. 예를 들어 고유명사 'Wrigley Field'에 포함된 'Wrigley'와 'Field' 모두 고유명사 속성이 PROPER로 설정됩니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • PROPER는 토큰이 고유명사의 일부임을 나타냅니다.
    • NOT_PROPER는 토큰이 고유명사의 일부가 아님을 나타냅니다.
  • form은 앞서 언급한 공통 형태(tense, mood, person 등)에 정확히 맞지 않는 추가적인 형태론적 형태를 나타냅니다. 이러한 형태 중 대부분은 고유 언어의 특성입니다. 이 필드는 다음 값을 포함할 수 있습니다.

    • ADNOMIAL(한국어/일본어)은 명사구를 수정하는 어미(한국어) 또는 동사(일본어)를 나타냅니다. 예: 밥을 먹는 사람 [someone who eats rice] 및 書く人 [someone who writes].
    • AUXILIARY(한국어)는 두 개의 인접한 주용언과 보조용언을 연결하는 어미를 나타냅니다. 예: 밥을 먹게 하다 [make (someone) to eat]
    • COMPLEMENTIZER(한국어)는 서로 다른 두 개의 절을 연결하는 어미를 나타냅니다. 예: 밥을 먹고 물을 마신다 [ (I) eat rice and drink water]
    • FINAL_ENDING(한국어/일본어)은 절이나 문장의 끝에서 절 또는 문장을 마치는 어미를 나타냅니다. 예: 밥을 먹는다 [(I) eat rice] 및 手紙を書く [write a letter]
    • GERUND(한국어/일본어)는 동사나 형용사를 명사로 만드는 어미를 나타냅니다. 예: (한국어) 밥 먹기 [eating rice]. 또는 동사를 다양한 보조동사와 연결하는 어미를 나타냅니다. 예: (일본어) 書きたい [want to write]
    • REALIS(일본어)는 접속사가 있는 조건법 및 가정법을 나타냅니다. 예: 'ば': 書けば [if (I) write].
    • IRREALIS(일본어)는 부정적, 수동적, 사역적 보조용언을 사용하여 동사를 연결하는 것을 나타냅니다. 예: 書かない [do not write], 書かれる [to be written], 書かせる [make (someone) write].
    • ORDER(일본어)는 명령법과 비슷한 명령 동사를 나타냅니다. 예: 書け! [write!]
    • SPECIFIC(일본어)은 위의 6개 카테고리로 다룰 수 없는 특수 형태를 나타냅니다. 이 형태의 가장 일반적인 용례는 원형에 서픽스를 추가함으로써 형용사에서 파생된 명사입니다. 예: かわいさ [cuteness]
    • SHORT(러시아어)는 짧은 형태의 형용사 또는 분사를 나타냅니다.
    • LONG(러시아어)은 위의 SHORT 형태와 구분되는 긴 형태의 형용사 또는 분사를 나타냅니다.

Natural Language API는 구가 아닌 토큰별로 형태론적 정보를 제공합니다. 단어 경계를 넘어가는 형태론적 구조는 지원되지 않습니다.

종속성 트리

구문 요청 안에서는 품사와 형태론적 정보가 응답의 partOfSpeech 필드 내에 반환됩니다.

구문 분석을 위해 Natural Language API에 제공되는 텍스트 내의 각 문장에 대해 API는 해당 문장의 구문 구조를 설명하는 종속성 트리를 구성합니다. 구문 정보는 응답의 dependencyEdge 필드 내에 반환됩니다.

아래는 John F. Kennedy의 취임 연설에서 발췌한 한 문장의 종속성 트리 다이어그램입니다.

각 토큰에 대해 dependencyEdge 요소는 해당 토큰이 수식하는 다른 토큰을 식별하며(headTokenIndex 필드) 이 토큰과 헤드 토큰 사이의 구문 관계를 분석합니다(label 필드). 예를 들어 다음은 첫 번째 'your country' 구에서 토큰 'your'의 dependencyEdge 요소입니다.

      "dependencyEdge": {
        "headTokenIndex": 4,
        "label": "POSS"
      },

이 요소는 'your'가 다섯 번째 토큰(headTokenIndex는 0부터 시작되는 오프셋을 사용함)을 수식하며 소유형 수식어임을 나타냅니다.

모든 종속성 트리는 문장의 주동사에 해당하는 ROOT 요소("label": ROOT)를 포함합니다. 위 예시에서 ROOT 요소는 문장의 첫 번째 단어입니다("headTokenIndex": 0). ROOT 단어 'Ask'의 headTokenIndex는 자신의 색인입니다.

구문 분석 트리는 문장 경계를 넘어가지 않지만 Natural Language API는 전체 텍스트 내에서 0부터 시작되는 오프셋 값을 사용하여 문장과 토큰의 색인을 생성합니다.

Natural Language API는 지원되는 언어 전체에 적용되는 공통 종속성 집합을 사용하여 구문 관계의 라벨을 지정합니다. 라벨은 아래에 설명되어 있습니다. 예제 텍스트에서 'Head'와 라벨은 해당 항목이 적용되는 토큰 아래에 나타납니다.

라벨 설명
UNKNOWN 알 수 없는 관계
ABBREV 헤드 토큰의 축약형입니다.

British Broadcasting Company (BBC)
                     Head     ABBREV
ACOMP (동사의 목적어와 같이) 보어 역할을 하는 형용사구입니다. 특히 이 관계는 형용사 술부가 있는 'be' 계사 구조를 포함합니다.

The book looks heavy.
         Head  ACOMP

The book is   heavy.
         Head ACOMP
이 태그는 비인수 형용사 부사류 그리고 형용사 술부가 있는 인상 구조에서도 적용됩니다.

She arrived sad.
    Head    ACOMP

I consider John intelligent.
  Head          ACOMP
ADVCL 때를 나타내는 절, 결과, 조건절, 목적절 등 동사를 수식하는 부사절입니다.

The accident happened as the night was falling.
             Head                      ADVCL

If you know who did it, you should tell the teacher.
       ADVCL                       Head

He talked to him in order to secure the account.
   Head                      ADVCL
ADVPHMOD 부사구 수식어(일본어)
ADVMOD 단어의 의미를 수식하는 데 사용되는 절이 아닌 부사 또는 부사구입니다.

Genetically modified food.
ADVMOD      Head

less   often
ADVMOD Head

About  200 people came to the party.
ADVMOD Head
AMOD 명사구의 의미를 수식하는 데 사용되는 형용사구입니다.

Sam eats red  meat.
         AMOD Head

Sam took out a 3 million dollar loan.
                         AMOD   Head
APPOS 다른 명사구의 바로 오른쪽에 있는 명사구로, 두 번째 구는 첫 번째 구를 정의하거나 수식하는 데 사용됩니다.

Sam, my brother, arrived.
Head    APPOS

Bill (John’s cousin)
Head         APPOS
ATTR 연결동사가 앞에 붙는 명사구입니다. 종속물이 형용사가 아닌 명사구라는 점에서 'ATTR'은 'ACOMP'과 다릅니다.

He is  a doctor.
   Head ATTR

She resembles her mother.
    Head          ATTR
질문에서 wh 대명사 또는 wh 구에 있는 명사는 'ROOT'와 'ATTR' 관계에 있습니다.

What is  your name?
ATTR Head     NSUBJ

What breed is   the dog?
     ATTR  Head     NSUBJ
명사 술부도 'ATTR' 관계를 사용하는 인상 구조입니다.

I consider John an intelligent person.
  Head                         ATTR
AUX 법 조동사나 우언적 시제의 'be', 'do', 'have' 형태 등 본동사가 아닌 동사입니다. 수동태 구조에서 'be'를 보조동사로 사용하는 경우는 제외됩니다.

Reagan has died.
       AUX Head

He should leave.
   AUX    Head
AUXPASS 수동태의 절에서 본동사가 아닌 동사입니다.

Kennedy has been    killed.
        AUX AUXPASS Head

Kennedy was/got killed.
        AUXPASS Head
CC 접속어와 등위 접속사 간의 관계입니다. 접속어의 한 단어(일반적으로 첫 번째)가 접속사의 헤드로 간주됩니다.

Bill is big  and honest.
        Head CC

They either ski  or snowboard.
            Head CC

Bill went to Florida but Jane traveled to Alaska.
     Head            CC
CCOMP 내부 주어가 동사나 형용사의 목적어 역할을 하는 종속절입니다.

He says that you like  to swim.
   Head          CCOMP

I am certain that he did   it.
     Head            CCOMP

I admire the fact that you are   honest.
             Head          CCOMP
CONJ 'and' 또는 'or' 같은 등위 접속사에 연결되는 두 요소 간의 관계입니다. 관계의 헤드는 첫 번째 접속어이며 다른 접속어는 'conj' 관계를 통해 헤드에 종속됩니다.

Bill is big and honest.
        Head    CONJ

They either ski  or snowboard.
            Head    CONJ

We have apples, pears, oranges, and bananas.
        DOBJ    CONJ   CONJ         CONJ
CSUBJ 절 구문으로 되어 있는 절의 주어입니다. 즉, 주어 자체가 하나의 절입니다(아래의 예에서 'What she said').

What she said  makes sense.
         CSUBJ Head
CSUBJPASS 절 구문으로 되어 있는 수동절의 주어입니다.

That she lied was suspected by everyone.
         CSUBJ    Head
DEP 시스템이 두 단어 간에 좀더 정확한 종속성 관계를 파악할 수 없습니다.

Then, as if  to show that he could, . . .
         DEP    Head

travel agency florence kentucky
       Head   DEP
DET 명사구 헤드와 한정사 간의 관계입니다.

The man is here.
DET Head

Which book do you prefer?
DET   Head
DISCOURSE 감탄하는 표현을 제외하고는 문장의 구조와 명확하게 연결되어 있지 않은 감탄사 및 기타 담화 요소입니다. 예로는 감탄사('oh', 'uh-huh', 'Welcome'), 말을 잇는 표현('um', 'ah'), 담화 표지('well', 'like', 'actually', but not 'you know')가 있습니다.

Iguazu is   in Argentina :)
       Head              DISCOURSE
DOBJ 동사의 ([accusative](https://en.wikipedia.org/wiki/Accusative_case)) 목적어인 명사구입니다.

She gave me a raise.
    Head      DOBJ

They win  the lottery.
     Head     DOBJ
EXPL 용어법 명사입니다. 영어에는 'it' 및 'there'의 몇몇 용례입니다. 존재한다는 것을 나타내는 'there' 그리고 외치 변형 구조의 'it'이 여기에 해당합니다. 비어 명사 또는 용어법 명사란 명사가 술부에서 어떠한 의미론적 역할도 하지 못하는 것을 의미합니다. 비어를 사용하는 언어에서는 주제 또는 직접목적어 자리에 들어갈 수 있습니다.

There is   a ghost in the room.
EXPL  Head   NSUBJ

It   is clear that we should decline.
EXPL Head
GOESWITH 텍스트에서 분리된 단어의 두 부분을 연결합니다.
IOBJ 동사의 ([dative](https://en.wikipedia.org/wiki/Dative_case)) 간접목적어인 명사구입니다.

She gave me   a present.
    Head IOBJ   DOBJ
MARK 'that' 또는 'whether'와 같이 유한 종속절이나 무한 종속절을 이끄는 단어입니다. 헤드는 종속절의 헤드입니다.

Forces engaged in fighting after insurgents attacked.
                           MARK             Head

He says that you like to swim.
        MARK     Head
MWE 결합을 위한 두 관계 중 하나입니다('NN'과 함께 사용됨). 여러 기능어가 하나의 기능어처럼 작용하는 몇몇 고정된 문법적 표현에 사용됩니다. 여러 단어로 된 표현은 헤드가 맨 앞에 오는 일반 구조로 주석 처리됩니다. 그리고 해당 표현에 속하는 모든 단어가 'MWE' 라벨을 사용하여 첫 번째 단어를 수식하게 됩니다.

I like dogs as   well as  cats.
            Head MWE  MWE

He cried because of  you.
         Head    MWE
MWV 여러 단어로 된 언어 표현입니다.
NEG 부정 단어 그리고 해당 단어가 수식하는 단어의 관계입니다.

Bill is    not a scientist.
     Head  NEG

Bill is no  scientist.
        NEG Head
NN 헤드 명사를 수식하는 데 사용되는 명사입니다.

phone book
NN    Head

oil price futures
NN  NN    Head
NPADVMOD 부사 수식어로 사용되는 명사구입니다.

The director is 65 years    old.
                   NPADVMOD Head

Six feet     long
    NPADVMOD Head

Shares eased a fraction.
       HEAD    NPADVMOD

The silence is itself   significant.
               NPADVMOD Head

90% of Australians like him, the most     of any country.
                   Head          NPADVMOD
NSUBJ 절의 주어인 명사구입니다.

Clinton defeated Dole.
NSUBJ   Head

The baby  is   cute
    NSUBJ Head
NSUBJPASS 수동절의 주어인 명사구입니다.

Dole       was defeated by Clinton.
NSUBJPASS      Head
NUM 수량을 통해 명사구의 의미를 수식하는 데 사용되는 숫자구입니다.

Sam ate three sheep.
        NUM   Head
NUMBER 숫자구의 일부입니다.

I have four   thousand sheep.
       NUMBER Head
P 절에서 구두점이 있는 부분입니다.
PARATAXIS 병렬 관계(parataxis, '나란히 배치'를 뜻하는 그리스어에서 파생됨)는 단어(종종 문장의 주술부) 그리고 헤드 명사와의 명시적인 등위, 종속 또는 인수와 관계없이 배치된 다른 요소 간의 관계입니다. 패러택시스는 담화에서 등위와 같습니다.

Let's face it we're annoyed.
Head                PARATAXIS

The guy, John said,     left early in the morning.
              PARATAXIS Head
PARTMOD 부분 수식어
PCOMP 전치사의 보어가 절이거나 전치사구(또는 간혹 부사구)일 때 사용됩니다.

We have no information on   whether users are   at risk.
                       Head               PCOMP

They heard about you missing classes.
           Head      PCOMP
POBJ 전치사 또는 'here'와 'there' 부사 뒤에 오는 명사구의 헤드입니다.

I sat on   the chair.
      Head     POBJ

What does CPR stand for?
POBJ                Head
POSS 소유 한정사 또는 [genitive](https://en.wikipedia.org/wiki/Genitive_case) 수식어입니다.

their offices
POSS  Head

Bill’s clothes.
POSS   Head
POSTNEG 동사 뒤에 오는 부정어 부분
PRECOMP 술부 보어
PRECONJ 'either', 'both', 'neither' 등 접속어를 묶을 때 그 앞에 나타나는 단어입니다.

Both    the boys and the girls are here.
PRECONJ     Head
PREDET 명사구 한정사의 앞에서 그 의미를 수식하는 단어입니다.

All    the boys are here.
PREDET     Head
PREF 접두사
PREP 동사, 형용사, 명사 또는 심지어 다른 전치사의 의미를 수식하는 데 사용되는 전치사구입니다.

I saw a cat  in   a hat.
        Head PREP

I saw  a cat with a telescope.
  Head       PREP

He is responsible for  meals.
      Head        PREP
PRONL 동사와 어순 간의 관계(프랑스어)
PRT 동사 소사입니다.

They shut down the station.
     Head PRT

He would not put  up  with it.
             Head PRT
PS 연합 또는 속격 조사
QUANTMOD 수량구 수식어
RCMOD 관계절을 이끄는 명사와 동사를 연결합니다.

I saw the man  you love.
          Head     RCMOD

the book that you bought
    Head          RCMOD

Bell, a company which is based in LA, makes and distributes computer products.
        Head             RCMOD
RCMODREL 관계절의 보문 표시(중국어)
RDROP 앞에 술어가 없는 생략 기호(일본어)
REF 관계항(힌디어)
REMNANT 생략 기호에 사용됩니다.

John won bronze, Mary silver, and Sandy gold.
         Head         REMNANT           REMNANT
REPARANDUM 담화를 다듬으면서 고쳐 쓴 말더듬 부분을 나타냅니다.

Go to         the righ- to   the left.
   REPARANDUM           Head
ROOT 문장의 중심입니다. 거의 대부분의 경우 동사입니다.
SNUM 숫자 단위를 지정하는 접미사(일본어)
SUFF 접미사
TMOD 시간을 지정함으로써 구성성분의 의미를 수식하는 데 사용되는 명사구 구성성분입니다. 'TMOD'는 시점 및 기간을 캡처합니다. 반복의 의미는 캡처하지 않습니다('two times'는 'NPADVMOD'가 됨).

Last night, I swam in the pool.
     TMOD     Head
TOPIC 주제 마커(중국어)
VMOD 부정형 동사가 앞에 오는 절입니다.

Berries gathered on this side of the mountain are sweeter.
Head    VMOD

He sat  in the armchair reading the morning newspaper.
   Head                 VMOD

I have nothing to say  to them.
       Head       VMOD
VOCATIVE 텍스트에서 화자가 말을 거는 상대를 표시합니다(이메일 및 뉴스그룹 게시물에서 흔히 볼 수 있음).

Anna,    can you bring a tent?
VOCATIVE         Head
XCOMP 자체적인 주어가 없는 종속절로, 외부 주어에 의해 주어가 결정됩니다.

He says that you like to swim.
                 Head    XCOMP

I am ready to leave.
     Head     XCOMP
SUFFIX 이름 접미사
TITLE 이름 직함
AUXCAUS 사역적 보조동사(일본어)
AUXVV 조동사(일본어)
DTMOD 연체사(명사 앞에 오는 수식어)
FOREIGN 외국어
KW 키워드
LIST 비교 가능한 항목 체인의 목록
NOMC 명사화된 절
NOMCSUBJ 명사화된 주어 절
NOMCSUBJPASS 명사화된 수동절
NUMC 숫자 수식어의 복합어(일본어)
COP 계사(스페인어)
DISLOCATED 위치가 바뀐 관계(앞쪽/주제 요소의 경우)
ASP 상 마커
GMOD 소유격 수식어
GOBJ 소유격 목적어
INFMOD 부정사 수식어
MES 측정
NCOMP 명사의 명사적 보어

종속성 트리에 대한 자세한 내용은 Universal Dependency Treebank 프로젝트를 참조하세요. 또한 Universal Dependency Annotation for Multilingual Processing에는 이러한 종속성 트리를 해석하는 데 사용되는 방법론에 대한 배경 정보가 들어 있습니다.

구문 분석 응답 파싱

다음의 의사 코드는 구문 분석 응답에 대해 반복적 작업을 수행할 때 사용하는 공통 패턴을 제공합니다.

index = 0
  for sentence in self.sentences:
    content  = sentence['text']['content']
    sentence_begin = sentence['text']['beginOffset']
    sentence_end = sentence_begin + len(content) - 1
    while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
      # This token is in this sentence
      index += 1