analyzeSyntax
메서드는 주어진 텍스트의 언어 구조에 대한 세부정보를 반환합니다. 텍스트에 있는 각 토큰에 대해 Natural Language API는 내부 구조(형태론) 및 문장 내 역할(구문)에 대한 정보를 제공합니다.
형태론은 단어의 내부 구조를 연구하는 것입니다. 형태론은 단어 내 구성요소(어간, 어근, 접두사, 접미사 등)가 어떻게 정렬 또는 수정되어 다양한 의미를 만들어내는지에 초점을 맞춥니다. 예를 들어 영어에서는 종종 가산명사 끝에 '-s' 또는 '-es'를 추가하여 복수형을 나타내고 동사 뒤에 '-d' 또는 '-ed'를 추가하여 과거형을 나타냅니다. 접미사 '-ly'를 형용사에 추가해 부사를 만듭니다(예: 'happy'[형용사]와 'happily'[부사]).
Natural Language API는 형태론 분석을 사용하여 단어에 대한 문법적 정보를 추론합니다.
형태론은 언어에 따라 크게 다릅니다. 러시아어와 같은 언어에서 단어 끝은 문장에서 단어의 역할을 나타냅니다(예: 'книга'[책, 주격]이 동사의 직접 대상이 될 때 'книгу'[목적격]으로 변합니다). 즉, 단어 순서는 문장의 의미 변화 없이 바뀔 수 있지만 단어 순서가 바뀌면 문맥적 적합성에 영향을 줍니다. 격을 나타내는 접사가 부족한 영어와 북경어 같은 언어는 각 단어의 역할을 표시하기 위해 문장 내 단어 순서에 더 많이 의존합니다. 그 결과, 형태론적 분석은 출발어에 크게 의존하며 해당 언어 내에서 무엇이 지원되는지를 이해해야 합니다.
구문은 문구와 문장의 구조에 대한 연구입니다. 구문 및 형태론은 서로 연동되어 문법적 관계를 나타내지만, 언어마다 이 둘이 사용되는 방법이 다릅니다. 예를 들어 러시아어에서는 접사를 사용하여 직접 목적어의 역할을 나타내는 반면('книгу'의 'у'), 영어에서는 직접 목적어가 동사 뒤에 오는(read the book) 단어 순서를 사용합니다.
analyzeSyntax
응답은 partOfSpeech
필드에 형태론적 정보를, dependencyTree
필드에 단어 간 구문적 관계를 반환합니다.
품사
구문 요청 안에서는 품사와 형태론적 정보가 응답의 partOfSpeech
필드 내에 반환됩니다. partOfSpeech
필드는 좀 더 명확한 형태론적 정보 뿐만 아니라 품사(POS) 정보를 가진 일련의 하위 필드를 포함합니다. 해당 하위 필드는 다음과 같습니다.
tag
는 간단한 POS 태그(NOUN, VERB 등)를 사용하여 품사를 표시하며 대략적인 구문 정보를 제공합니다. POS 태그는 후속 언어 분석을 위해 패턴을 만들거나 모호성을 줄이고자 하는 경우에 유용합니다(예: 'train'에 VERB가 아닌 NOUN를 태깅함).number
는 단어의 문법적 수를 나타냅니다. 영어에서 접미사 '-s'는 가산 명사에 추가되어 둘 이상을 나타냅니다. 예를 들어 'dog+s'는 두 마리 이상의 개를 나타냅니다. 복수형 서픽스의 부재는 단수형을 나타내는 경우가 많습니다. 아랍어 같은 일부 언어에서는 양수(두 개 또는 한 쌍을 나타내는 수)도 표시합니다. 이 필드는 다음 값을 포함할 수 있습니다.SINGULAR
는 1개를 나타냅니다.PLURAL
은 2개 이상을 나타냅니다.DUAL
은 정확히 2개를 나타냅니다.
person
은 단어의 문법적 인칭을 식별합니다. 영어에서 'I/me'는 1인칭 단수이며 표현의 화자(또는 필자)를 가리키며 'you', 'she/her 및 he/him'은 각각 의도된 수신인(청취자)과 그 외의 다른 사람을 가리킵니다. 이 필드는 다음 값을 포함할 수 있습니다.FIRST
: 화자를 나타냅니다.SECOND
: 의도된 수신인, 즉 말을 듣는 당사자를 나타냅니다.THIRD
: 화자/청취자 이외의 사람을 나타냅니다.REFLEXIVE_PERSON
은 예를 들어 주어, 그리고 같은 항목을 참조하는 목적어를 나타냅니다(예: 'The cat licked itself'). 여기서 -self는 대명사에 연결되어 재귀성을 나타냅니다. 러시아어와 일본어에서는 독립형 대명사로 재귀 용법을 나타냅니다. 예를 들어 'John loves himself'를 러시아어로 하면 'Джон любит себя'이며, 여기서 себя는 성별 중립적인 'self'입니다. 일본어에서는 'Tarō wa zibun o aisuru'(로마자 표기 버전)이며 여기서 'zibun'은 성별 중립적인 'self'입니다. 재귀대명사를 참조하세요.
gender
는 명사의 문법적 성을 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.- 문법적 성
FEMININE
- 문법적 성
MASCULINE
- 문법적 성
NEUTER
- 문법적 성
case
는 단어의 문법적 격과 문구 또는 문장에서 그 역할을 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.ACCUSATIVE
격은 타동사의 직접목적어를 나타냅니다.ADVERBIAL
격은 형용사의 부사형을 나타냅니다. 영어는 부사('well')와 형용사('good')에 개별 단어를 사용합니다. 영어에서 서픽스 -ly는 형용사에서 부사를 파생하지만(예: 'happy', 'happily'), '격'으로 간주되지는 않습니다.COMPLEMENTIVE
격(중국어)은 접속사를 사용하여 잠재적, 서술적, 결과적 표현의 의미를 완성하는 데 필요한 단어를 나타냅니다.DATIVE
격은 직접목적어를 받는 지시 대상을 가리키는 간접목적어를 나타냅니다. 영어에서 간접목적어는 전치사 'to'로 가리키는 경우가 많습니다. 예를 들어 'He gave the ball to Bobby'에서 'Bobby'는 간접목적어이며 공을 받는 사람입니다. 반면 러시아어 예문 Иван дал книгу маше(Ivan gave the book to Masha)에서 '-e'는 'маше'가 간접목적어임을 나타내며, Masha는 책을 받는 사람입니다.GENITIVE
격은 소유를 나타냅니다. 영어의 경우 소유격을 사용하는 대신 '-'s' 접사를 사용하여 소유를 나타내는 경우가 많습니다. '-'s' 접사는 문구의 끝에 붙을 수 있습니다(예: '[The man who ran the bill up]’s wife paid a dear price for his excess.'). 반면 러시아어 예문 'Где книга Антона?'(Where is Anton’s book)에서 '-а'는 'Антон-'를 소유격으로 표시합니다. 러시아어에서 소유격은 'several', 'few'와 같은 단어의 보어로 나타날 수도 있습니다. 예를 들어 Зимой здесь мало снега('In winter there is little snow here')에서 '-a' 는 'мало'('little')의 보어이므로 'снег-'(snow)를 소유격으로 표시합니다.INSTRUMENTAL
격은 명사가 행동 완료의 매개체인지 여부를 나타냅니다. 러시아어로 영어 문장 'He opened the door with a key'는 'он открыл дверь ключом'이며, 여기서 '-om'은 'ключ'(key)에 붙어 구격을 나타냅니다.LOCATIVE
격은 위치를 가리키기 위한 단어 사용을 나타냅니다. 영어에는 처격이 없습니다.NOMINATIVE
격은 동사의 주어와 관련됩니다. 영어에서 문장의 주어는 격이 아닌 단어 순서를 통해 명시됩니다. 'The girl won the race' 문장에서 주어는 'the girl' 문구이며 동사 'won'의 왼쪽에 나타납니다. 러시아어에서 девушка(the/a girl)는 동사 앞 또는 뒤에 올 수 있으며('девушка выиграла гонку' 또는 'гонку выиграла девушка') 여기서 동사는 выиграла(won)입니다.OBLIQUE
격은 단어가 동사 또는 전치사의 목적어로 사용되었음을 나타냅니다.PARTITIVE
격은 단어의 '불완전성' 또는 구체적인 독자성 부족을 나타냅니다. 영어에서 부분사의 예로는 'three of my friends.'가 있습니다. 러시아어로는 'трое моих друзей'이며 여기서 'трое'는 'three of'(비교하면 'три друга'에서는 'три'이 'three'에 해당)입니다.PREPOSITIONAL
격은 전치사의 목적어를 나타냅니다.REFLEXIVE_CASE
는 동사의 목적어가 주어에 해당함을 나타냅니다. 대부분의 언어는 재귀격을 사용하지 않습니다. 이 용례는 특수한 재귀대명사를 대신 사용하여 나타내기 때문입니다('himself', 'myself' 등).RELATIVE_CASE
(중국어)는 명사와 동사/형용사를 연결하는 관계절의 보문 표시를 나타냅니다. 예: 工作 [的] 地方(work [] place :: 'place [where I] work'). 便宜 的 餐馆(inexpensive [] restaurants :: restaurants [that are] inexpensive).VOCATIVE
격은 주로 말을 걸 때 누구 또는 무엇을 부르는 데 사용되는 명사를 나타냅니다.
tense
는 시간 속에서 동사가 차지하는 위치를 기준으로 하는 동사의 문법적 시제를 나타냅니다.tense
는 동사의 시간 관계를 다루는 또 다른 구성요소인aspect
와 다릅니다. aspect는 시간 속의 위치보다는 시간의 흐름이라는 특성에 초점을 맞추기 때문입니다. 여러 언어에서 등장하는IMPERFECT
및PLUPERFECT
시제는 시제와 상의 구체적인 조합을 보다 정확하게 보여줍니다. 이 필드는 다음 값을 포함할 수 있습니다.CONDITIONAL_TENSE
는 흔히 알려진 형태론적 용어인 '조건법'의 대체 용어입니다. 아래CONDITIONAL_MOOD
를 참조하세요.FUTURE
는 미래에 진행될 행동을 나타냅니다. 영어에서는 대부분의 경우 동사구에 'will'이라는 단어를 추가함으로써 미래형을 나타냅니다.PAST
는 과거에 진행된 행동을 나타냅니다.PRESENT
는 현재 진행되는 행동을 나타냅니다.IMPERFECT
는 과거에 진행되었지만 해당 시제의 시점을 기준으로 아직 완료되지 않았던 행동을 나타냅니다. 영어에서는 대부분의 경우 'I was walking'과 같이 과거형에 동명사 형태의 동사를 추가함으로써 미완료 시제를 나타냅니다. 미완료 시제 사건은 과거에 진행되었지만 해당 과거 시점을 기준으로는 아직 완료되지 않은 것입니다.PLUPERFECT
는 과거에 진행되었으며 해당 시제를 기준으로 완료된 행동을 나타냅니다. 예를 들어 'I had walked'는 과거에 진행되었으며 과거형 시점을 기준으로 완료된 것입니다.
aspect
는 동사의 문법적 상, 즉 시간 흐름의 표현을 나타냅니다. 시간 속의 동사 위치에 초점을 맞추는tense
와 달리,aspect
는 동사의 행동이 진행되는 곳에서 시간 흐름의 특성에 초점을 맞춥니다. 이 필드는 다음 값을 포함할 수 있습니다.PERFECTIVE
상은 사건이 과거에서 완전히 끝났거나 완전히 미래에서 진행될 것이기 때문에 '완료된' 사건을 나타냅니다.IMPERFECTIVE
상은 지속적이거나 반복적이기 때문에 완료되지 않은 사건을 나타냅니다.PROGRESSIVE
상은 지속적인 사건을 나타냅니다. 대개의 경우 진행형은 좀더 일반적인 미완료형(반복도 포함함)의 특수 용법으로 취급됩니다.
mood
는 행동에 대한 태도를 나타내는 동사의 서법을 의미합니다. 이 필드는 다음 값을 포함할 수 있습니다.CONDITIONAL_MOOD
는 불확정적인 행동을 나타냅니다. 영어에서는 조건부 동사형이 없습니다. 대신 'would'와 동사 원형을 결합하여 조건부 행동을 표시합니다.IMPERATIVE
는 2인칭을 사용하는 명령이나 요청을 나타냅니다.INDICATIVE
는 사실의 기술을 나타냅니다. '현실적 서법'이라는 표현으로 더 잘 알려져 있습니다.INTERROGATIVE
는 질문을 나타냅니다.JUSSIVE
는 1인칭 또는 3인칭을 사용하는 명령이나 요청을 나타냅니다. 영어에는 명령 서법이 없습니다. 대신, 실질적인 또는 암시적인 'Let us'로 시작되는 권고가 이러한 명령 서법과 비슷합니다.SUBJUNCTIVE
는 행동과 관련된 불확실성의 정도를 나타냅니다. 이를 '비현실적' 서법이라고도 합니다('현실적' 직설법과 대비되는 개념). 영어에는 구체적인 가정법이 없습니다. 대신 'want', 'wish', 'hope' 등의 단어로 가정법의 의미를 전달합니다.
voice
는 행동과 주어/목적어 간의 관계인 동사의 문법적 태를 나타냅니다. 이 필드는 다음 값을 포함할 수 있습니다.ACTIVE
태는 주어가 행동을 수행하는 것을 나타냅니다.CAUSATIVE
태는 주어가 행동의 영향을 받는 것을 나타냅니다. 영어에서는 직접적인 사역태가 존재하지 않습니다. 대신 'Mom made me go to school'에서처럼 동사 'make'를 사용하여 표현합니다.PASSIVE
태는 주어가 행동의 영향을 받는 것을 나타냅니다. 대부분의 경우 수동태의 '행위자'는 언급되지 않거나 알 수 없습니다.
reciprocity
는 단어(일반적으로 대명사)의 상호관계를 나타냅니다. 상호관계란 대명사가 같은 문장의 다른 곳에 있는 명사구에 해당한다는 것을 의미합니다. 이 필드는 다음 값을 포함할 수 있습니다.RECIPROCAL
은 대명사가 상호적임을 나타냅니다.NON_RECIPROCAL
은 대명사가 상호적이 아님을 나타냅니다.
proper
는 명사가 고유명사의 일부인지를 나타냅니다. 많은 고유명사는 여러 개의 단어로 구성되어 있습니다. 구가 고유명사로 감지되는 경우 각 토큰도 고유명사로 감지됩니다. 예를 들어 고유명사 'Wrigley Field'에 포함된 'Wrigley'와 'Field' 모두 고유명사 속성이PROPER
로 설정됩니다. 이 필드는 다음 값을 포함할 수 있습니다.PROPER
는 토큰이 고유명사의 일부임을 나타냅니다.NOT_PROPER
는 토큰이 고유명사의 일부가 아님을 나타냅니다.
form
은 앞서 언급한 공통 형태(tense
,mood
,person
등)에 정확히 맞지 않는 추가적인 형태론적 형태를 나타냅니다. 이러한 형태 중 대부분은 고유 언어의 특성입니다. 이 필드는 다음 값을 포함할 수 있습니다.ADNOMIAL
(한국어/일본어)은 명사구를 수정하는 어미(한국어) 또는 동사(일본어)를 나타냅니다. 예: 밥을 먹는 사람 [someone who eats rice] 및 書く人 [someone who writes].AUXILIARY
(한국어)는 두 개의 인접한 주용언과 보조용언을 연결하는 어미를 나타냅니다. 예: 밥을 먹게 하다 [make (someone) to eat]COMPLEMENTIZER
(한국어)는 서로 다른 두 개의 절을 연결하는 어미를 나타냅니다. 예: 밥을 먹고 물을 마신다 [ (I) eat rice and drink water]FINAL_ENDING
(한국어/일본어)은 절이나 문장의 끝에서 절 또는 문장을 마치는 어미를 나타냅니다. 예: 밥을 먹는다 [(I) eat rice] 및 手紙を書く [write a letter]GERUND
(한국어/일본어)는 동사나 형용사를 명사로 만드는 어미를 나타냅니다. 예: (한국어) 밥 먹기 [eating rice]. 또는 동사를 다양한 보조동사와 연결하는 어미를 나타냅니다. 예: (일본어) 書きたい [want to write]REALIS
(일본어)는 접속사가 있는 조건법 및 가정법을 나타냅니다. 예: 'ば': 書けば [if (I) write].IRREALIS
(일본어)는 부정적, 수동적, 사역적 보조용언을 사용하여 동사를 연결하는 것을 나타냅니다. 예: 書かない [do not write], 書かれる [to be written], 書かせる [make (someone) write].ORDER
(일본어)는 명령법과 비슷한 명령 동사를 나타냅니다. 예: 書け! [write!]SPECIFIC
(일본어)은 위의 6개 카테고리로 다룰 수 없는 특수 형태를 나타냅니다. 이 형태의 가장 일반적인 용례는 원형에 서픽스를 추가함으로써 형용사에서 파생된 명사입니다. 예: かわいさ [cuteness]SHORT
(러시아어)는 짧은 형태의 형용사 또는 분사를 나타냅니다.LONG
(러시아어)은 위의SHORT
형태와 구분되는 긴 형태의 형용사 또는 분사를 나타냅니다.
Natural Language API는 구가 아닌 토큰별로 형태론적 정보를 제공합니다. 단어 경계를 넘어가는 형태론적 구조는 지원되지 않습니다.
종속성 트리
구문 요청 안에서는 품사와 형태론적 정보가 응답의 partOfSpeech
필드 내에 반환됩니다.
구문 분석을 위해 Natural Language API에 제공되는 텍스트 내의 각 문장에 대해 API는 해당 문장의 구문 구조를 설명하는 종속성 트리를 구성합니다. 구문 정보는 응답의 dependencyEdge
필드 내에 반환됩니다.
아래는 John F. Kennedy의 취임 연설에서 발췌한 한 문장의 종속성 트리 다이어그램입니다.
각 토큰에 대해 dependencyEdge
요소는 해당 토큰이 수식하는 다른 토큰을 식별하며(headTokenIndex
필드) 이 토큰과 헤드 토큰 사이의 구문 관계를 분석합니다(label
필드). 예를 들어 다음은 첫 번째 'your country' 구에서 토큰 'your'의 dependencyEdge
요소입니다.
"dependencyEdge": {
"headTokenIndex": 4,
"label": "POSS"
},
이 요소는 'your'가 다섯 번째 토큰(headTokenIndex
는 0부터 시작되는 오프셋을 사용함)을 수식하며 소유형 수식어임을 나타냅니다.
모든 종속성 트리는 문장의 주동사에 해당하는 ROOT
요소("label": ROOT
)를 포함합니다. 위 예시에서 ROOT
요소는 문장의 첫 번째 단어입니다("headTokenIndex": 0
). ROOT
단어 'Ask'의 headTokenIndex
는 자신의 색인입니다.
구문 분석 트리는 문장 경계를 넘어가지 않지만 Natural Language API는 전체 텍스트 내에서 0부터 시작되는 오프셋 값을 사용하여 문장과 토큰의 색인을 생성합니다.
Natural Language API는 지원되는 언어 전체에 적용되는 공통 종속성 집합을 사용하여 구문 관계의 라벨을 지정합니다. 라벨은 아래에 설명되어 있습니다. 예제 텍스트에서 'Head'와 라벨은 해당 항목이 적용되는 토큰 아래에 나타납니다.
라벨 | 설명 |
---|---|
UNKNOWN |
알 수 없는 관계 |
ABBREV |
헤드 토큰의 축약형입니다.British Broadcasting Company (BBC) Head ABBREV |
ACOMP |
(동사의 목적어와 같이) 보어 역할을 하는 형용사구입니다. 특히 이 관계는 형용사 술부가 있는 'be' 계사 구조를 포함합니다.
The book looks heavy. Head ACOMP The book is heavy. Head ACOMP She arrived sad. Head ACOMP I consider John intelligent. Head ACOMP |
ADVCL |
때를 나타내는 절, 결과, 조건절, 목적절 등 동사를 수식하는 부사절입니다.The accident happened as the night was falling. Head ADVCL If you know who did it, you should tell the teacher. ADVCL Head He talked to him in order to secure the account. Head ADVCL |
ADVPHMOD |
부사구 수식어(일본어) |
ADVMOD |
단어의 의미를 수식하는 데 사용되는 절이 아닌 부사 또는 부사구입니다.Genetically modified food. ADVMOD Head less often ADVMOD Head About 200 people came to the party. ADVMOD Head |
AMOD |
명사구의 의미를 수식하는 데 사용되는 형용사구입니다.Sam eats red meat. AMOD Head Sam took out a 3 million dollar loan. AMOD Head |
APPOS |
다른 명사구의 바로 오른쪽에 있는 명사구로, 두 번째 구는 첫 번째 구를 정의하거나 수식하는 데 사용됩니다.Sam, my brother, arrived. Head APPOS Bill (John’s cousin) Head APPOS |
ATTR |
연결동사가 앞에 붙는 명사구입니다. 종속물이 형용사가 아닌 명사구라는 점에서 'ATTR'은 'ACOMP'과 다릅니다.He is a doctor. Head ATTR She resembles her mother. Head ATTR What is your name? ATTR Head NSUBJ What breed is the dog? ATTR Head NSUBJ I consider John an intelligent person. Head ATTR |
AUX |
법 조동사 또는 'be', 'do', 'have' 형태와 같은 여러 단어 시제를 형성하는 본동사가 아닌 동사입니다. 수동태 구조에서 'be'를 보조동사로 사용하는 경우는 제외됩니다.Reagan has died. AUX Head He should leave. AUX Head |
AUXPASS |
수동태의 절에서 본동사가 아닌 동사입니다.Kennedy has been killed. AUX AUXPASS Head Kennedy was/got killed. AUXPASS Head |
CC |
접속어와 등위 접속사 간의 관계입니다. 접속어의 한 단어(일반적으로 첫 번째)가 접속사의 헤드로 간주됩니다.Bill is big and honest. Head CC They either ski or snowboard. Head CC Bill went to Florida but Jane traveled to Alaska. Head CC |
CCOMP |
내부 주어가 동사나 형용사의 목적어 역할을 하는 종속절입니다.He says that you like to swim. Head CCOMP I am certain that he did it. Head CCOMP I admire the fact that you are honest. Head CCOMP |
CONJ |
'and' 또는 'or' 같은 등위 접속사에 연결되는 두 요소 간의 관계입니다. 관계의 헤드는 첫 번째 접속어이며 다른 접속어는 'conj' 관계를 통해 헤드에 종속됩니다.Bill is big and honest. Head CONJ They either ski or snowboard. Head CONJ We have apples, pears, oranges, and bananas. DOBJ CONJ CONJ CONJ |
CSUBJ |
절 구문으로 되어 있는 절의 주어입니다. 즉, 주어 자체가 하나의 절입니다(아래의 예에서 'What she said').What she said makes sense. CSUBJ Head |
CSUBJPASS |
절 구문으로 되어 있는 수동절의 주어입니다.That she lied was suspected by everyone. CSUBJ Head |
DEP |
시스템이 두 단어 간에 좀더 정확한 종속성 관계를 파악할 수 없습니다.Then, as if to show that he could, . . . DEP Head travel agency florence kentucky Head DEP |
DET |
명사구 헤드와 한정사 간의 관계입니다.The man is here. DET Head Which book do you prefer? DET Head |
DISCOURSE |
감탄하는 표현을 제외하고는 문장의 구조와 명확하게 연결되어 있지 않은 감탄사 및 기타 담화 요소입니다. 예로는 감탄사('oh', 'uh-huh',
'Welcome'), 말을 잇는 표현('um', 'ah'), 담화 표지('well',
'like', 'actually', but not 'you know')가 있습니다.Iguazu is in Argentina :) Head DISCOURSE |
DOBJ |
동사의 ([accusative](https://en.wikipedia.org/wiki/Accusative_case)) 목적어인 명사구입니다.She gave me a raise. Head DOBJ They win the lottery. Head DOBJ |
EXPL |
용어법 명사입니다. 영어에는 'it' 및 'there'의 몇몇 용례입니다. 존재한다는 것을 나타내는 'there' 그리고 외치 변형 구조의 'it'이 여기에 해당합니다. 비어 명사 또는 용어법 명사란 명사가 술부에서 어떠한 의미론적 역할도 하지 못하는 것을 의미합니다. 비어를 사용하는 언어에서는 주제 또는 직접목적어 자리에 들어갈 수 있습니다.There is a ghost in the room. EXPL Head NSUBJ It is clear that we should decline. EXPL Head |
GOESWITH |
텍스트에서 분리된 단어의 두 부분을 연결합니다. |
IOBJ |
동사의 ([dative](https://en.wikipedia.org/wiki/Dative_case)) 간접목적어인 명사구입니다.She gave me a present. Head IOBJ DOBJ |
MARK |
'that' 또는 'whether'와 같이 유한 종속절이나 무한 종속절을 이끄는 단어입니다. 헤드는 종속절의 헤드입니다.Forces engaged in fighting after insurgents attacked. MARK Head He says that you like to swim. MARK Head |
MWE |
결합을 위한 두 관계 중 하나입니다('NN'과 함께 사용됨). 여러 기능어가 하나의 기능어처럼 작용하는 몇몇 고정된 문법적 표현에 사용됩니다. 여러 단어로 된 표현은 헤드가 맨 앞에 오는 일반 구조로 주석 처리됩니다. 그리고 해당 표현에 속하는 모든 단어가 'MWE' 라벨을 사용하여 첫 번째 단어를 수식하게 됩니다.I like dogs as well as cats. Head MWE MWE He cried because of you. Head MWE |
MWV |
여러 단어로 된 언어 표현입니다. |
NEG |
부정 단어 그리고 해당 단어가 수식하는 단어의 관계입니다.Bill is not a scientist. Head NEG Bill is no scientist. NEG Head |
NN |
헤드 명사를 수식하는 데 사용되는 명사입니다.phone book NN Head oil price futures NN NN Head |
NPADVMOD |
부사 수식어로 사용되는 명사구입니다.The director is 65 years old. NPADVMOD Head Six feet long NPADVMOD Head Shares eased a fraction. HEAD NPADVMOD The silence is itself significant. NPADVMOD Head 90% of Australians like him, the most of any country. Head NPADVMOD |
NSUBJ |
절의 주어인 명사구입니다.Clinton defeated Dole. NSUBJ Head The baby is cute NSUBJ Head |
NSUBJPASS |
수동절의 주어인 명사구입니다.Dole was defeated by Clinton. NSUBJPASS Head |
NUM |
수량을 통해 명사구의 의미를 수식하는 데 사용되는 숫자구입니다.Sam ate three sheep. NUM Head |
NUMBER |
숫자구의 일부입니다.I have four thousand sheep. NUMBER Head |
P |
절에서 구두점이 있는 부분입니다. |
PARATAXIS |
병렬 관계(parataxis, '나란히 배치'를 뜻하는 그리스어에서 파생됨)는 단어(종종 문장의 주술부) 그리고 헤드 명사와의 명시적인 등위, 종속 또는 인수와 관계없이 배치된 다른 요소 간의 관계입니다. 패러택시스는 담화에서 등위와 같습니다.Let's face it we're annoyed. Head PARATAXIS The guy, John said, left early in the morning. PARATAXIS Head |
PARTMOD |
부분 수식어 |
PCOMP |
전치사의 보어가 절이거나 전치사구(또는 간혹 부사구)일 때 사용됩니다.We have no information on whether users are at risk. Head PCOMP They heard about you missing classes. Head PCOMP |
POBJ |
전치사 또는 'here'와 'there' 부사 뒤에 오는 명사구의 헤드입니다.I sat on the chair. Head POBJ What does CPR stand for? POBJ Head |
POSS |
소유 한정사 또는 [genitive](https://en.wikipedia.org/wiki/Genitive_case) 수식어입니다.their offices POSS Head Bill’s clothes. POSS Head |
POSTNEG |
동사 뒤에 오는 부정어 부분 |
PRECOMP |
술부 보어 |
PRECONJ |
'either', 'both', 'neither' 등 접속어를 묶을 때 그 앞에 나타나는 단어입니다.Both the boys and the girls are here. PRECONJ Head |
PREDET |
명사구 한정사의 앞에서 그 의미를 수식하는 단어입니다.All the boys are here. PREDET Head |
PREF |
접두사 |
PREP |
동사, 형용사, 명사 또는 심지어 다른 전치사의 의미를 수식하는 데 사용되는 전치사구입니다.I saw a cat in a hat. Head PREP I saw a cat with a telescope. Head PREP He is responsible for meals. Head PREP |
PRONL |
동사와 어순 간의 관계(프랑스어) |
PRT |
동사 소사입니다.They shut down the station. Head PRT He would not put up with it. Head PRT |
PS |
연합 또는 속격 조사 |
QUANTMOD |
수량구 수식어 |
RCMOD |
관계절을 이끄는 명사와 동사를 연결합니다.I saw the man you love. Head RCMOD the book that you bought Head RCMOD Bell, a company which is based in LA, makes and distributes computer products. Head RCMOD |
RCMODREL |
관계절의 보문 표시(중국어) |
RDROP |
앞에 술어가 없는 생략 기호(일본어) |
REF |
관계항(힌디어) |
REMNANT |
생략 기호에 사용됩니다.John won bronze, Mary silver, and Sandy gold. Head REMNANT REMNANT |
REPARANDUM |
담화를 다듬으면서 고쳐 쓴 말더듬 부분을 나타냅니다.Go to the righ- to the left. REPARANDUM Head |
ROOT |
문장의 중심입니다. 거의 대부분의 경우 동사입니다. |
SNUM |
숫자 단위를 지정하는 접미사(일본어) |
SUFF |
접미사 |
TMOD |
시간을 지정함으로써 구성성분의 의미를 수식하는 데 사용되는 명사구 구성성분입니다. 'TMOD'는 시점 및 기간을 캡처합니다. 반복의 의미는 캡처하지 않습니다('two times'는 'NPADVMOD'가 됨).Last night, I swam in the pool. TMOD Head |
TOPIC |
주제 마커(중국어) |
VMOD |
부정형 동사가 앞에 오는 절입니다.Berries gathered on this side of the mountain are sweeter. Head VMOD He sat in the armchair reading the morning newspaper. Head VMOD I have nothing to say to them. Head VMOD |
VOCATIVE |
텍스트에서 화자가 말을 거는 상대를 표시합니다(이메일 및 뉴스그룹 게시물에서 흔히 볼 수 있음).Anna, can you bring a tent? VOCATIVE Head |
XCOMP |
자체적인 주어가 없는 종속절로, 외부 주어에 의해 주어가 결정됩니다.He says that you like to swim. Head XCOMP I am ready to leave. Head XCOMP |
SUFFIX |
이름 서픽스 |
TITLE |
이름 직함 |
AUXCAUS |
사역적 보조동사(일본어) |
AUXVV |
조동사(일본어) |
DTMOD |
연체사(명사 앞에 오는 수식어) |
FOREIGN |
외국어 |
KW |
키워드 |
LIST |
비교 가능한 항목 체인의 목록 |
NOMC |
명사화된 절 |
NOMCSUBJ |
명사화된 주어 절 |
NOMCSUBJPASS |
명사화된 수동절 |
NUMC |
숫자 수식어의 복합어(일본어) |
COP |
계사(스페인어) |
DISLOCATED |
위치가 바뀐 관계(앞쪽/주제 요소의 경우) |
ASP |
상 마커 |
GMOD |
소유격 수식어 |
GOBJ |
소유격 목적어 |
INFMOD |
부정사 수식어 |
MES |
측정 |
NCOMP |
명사의 명사적 보어 |
종속성 트리에 대한 자세한 내용은 Universal Dependency Treebank 프로젝트를 참조하세요. 또한 Universal Dependency Annotation for Multilingual Processing에는 이러한 종속성 트리를 해석하는 데 사용되는 방법론에 대한 배경 정보가 들어 있습니다.
구문 분석 응답 파싱
다음의 의사 코드는 구문 분석 응답에 대해 반복적 작업을 수행할 때 사용하는 공통 패턴을 제공합니다.
index = 0 for sentence in self.sentences: content = sentence['text']['content'] sentence_begin = sentence['text']['beginOffset'] sentence_end = sentence_begin + len(content) - 1 while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end: # This token is in this sentence index += 1