Token

텍스트의 가장 작은 문법적 구성요소를 나타냅니다.

JSON 표현
{
  "text": {
    object (TextSpan)
  },
  "partOfSpeech": {
    object (PartOfSpeech)
  },
  "dependencyEdge": {
    object (DependencyEdge)
  },
  "lemma": string
}
필드
text

object (TextSpan)

토큰 텍스트입니다.

partOfSpeech

object (PartOfSpeech)

이 토큰의 품사 태그입니다.

dependencyEdge

object (DependencyEdge)

이 토큰의 종속 항목 트리 파싱입니다.

lemma

string

토큰의 Lemma입니다.

PartOfSpeech

토큰의 품사 정보를 나타냅니다.

JSON 표현
{
  "tag": enum (Tag),
  "aspect": enum (Aspect),
  "case": enum (Case),
  "form": enum (Form),
  "gender": enum (Gender),
  "mood": enum (Mood),
  "number": enum (Number),
  "person": enum (Person),
  "proper": enum (Proper),
  "reciprocity": enum (Reciprocity),
  "tense": enum (Tense),
  "voice": enum (Voice)
}
필드
tag

enum (Tag)

품사 태그입니다.

aspect

enum (Aspect)

문법적 시제

case

enum (Case)

문법적 케이스

form

enum (Form)

문법적 형식입니다.

gender

enum (Gender)

문법적 성별입니다.

mood

enum (Mood)

문법적 서법

number

enum (Number)

문법적 수입니다.

person

enum (Person)

문법적 인칭

proper

enum (Proper)

문법적 적절성

reciprocity

enum (Reciprocity)

문법적 상호성

tense

enum (Tense)

문법 시제

voice

enum (Voice)

문법적 시제

태그

품사 태그 enum입니다.

열거형
UNKNOWN 알 수 없음
ADJ 형용사
ADP 부속어 (전치사 및 후치사)
ADV 부사
CONJ 접속사
DET 한정사
NOUN 명사 (일반 및 고유)
NUM 기수
PRON 인칭 대명사
PRT 조사 또는 기타 기능어
PUNCT 구두점
VERB 동사 (모든 시제 및 모드)
X 기타: 외국어, 오타, 약어
AFFIX 접두사

관점

이벤트 중에 시간 흐름을 표현하는 동사의 특성입니다.

열거형
ASPECT_UNKNOWN 분석된 언어에 측정기준이 적용되지 않거나 예측되지 않습니다.
PERFECTIVE 완료형
IMPERFECTIVE Imperfective
PROGRESSIVE 프로그레시브

케이스

문구, 절 또는 문장에서 명사 또는 대명사가 수행하는 문법적 기능입니다. 일부 언어에서는 형용사 및 관사와 같은 다른 품사가 명사와 일치하는 격 변형을 사용합니다.

열거형
CASE_UNKNOWN 분석된 언어로 케이스를 적용할 수 없거나 예측되지 않습니다.
ACCUSATIVE 대격
ADVERBIAL 부사
COMPLEMENTIVE 보완
DATIVE 여격
GENITIVE 소유격
INSTRUMENTAL 연주곡
LOCATIVE 위치
NOMINATIVE 주격
OBLIQUE Oblique
PARTITIVE 분수형
PREPOSITIONAL 전치사
REFLEXIVE_CASE 반사적
RELATIVE_CASE 상대적
VOCATIVE 호격

양식

언어에 따라 형식은 동사, 형용사, 부사 등의 다양한 형식을 분류할 수 있습니다. 예를 들어 동사 및 형용사의 굴절된 어미를 분류하거나 형용사 및 동사의 짧은 형식과 긴 형식을 구분할 수 있습니다.

열거형
FORM_UNKNOWN 분석된 언어에 해당 양식이 적용되지 않거나 예측되지 않습니다.
ADNOMIAL Adnomial
AUXILIARY 보조
COMPLEMENTIZER 보조 접속사
FINAL_ENDING 최종 결말
GERUND 동명사
REALIS Realis
IRREALIS 비실현형
SHORT 짧은 형식
LONG 긴 형식
ORDER 주문 양식
SPECIFIC 특정 양식

성별

관련 단어의 동작에 반영된 명사의 성별 클래스입니다.

열거형
GENDER_UNKNOWN 분석된 언어에 성별이 적용되지 않거나 예측되지 않습니다.
FEMININE 여성형
MASCULINE 남성
NEUTER 중성

기분

동사의 문법적 특징으로, 양태와 태도를 나타내는 데 사용됩니다.

열거형
MOOD_UNKNOWN 분석된 언어에 감정이 적용되지 않거나 감정이 예측되지 않습니다.
CONDITIONAL_MOOD 조건부
IMPERATIVE 명령형
INDICATIVE 직설법
INTERROGATIVE Interrogative
JUSSIVE 명령형
SUBJUNCTIVE 가정법

숫자

구분을 계산합니다.

열거형
NUMBER_UNKNOWN 분석된 언어에 해당 번호가 적용되지 않거나 예측되지 않습니다.
SINGULAR 단수형
PLURAL 복수형
DUAL 듀얼

사람

화자, 2인칭, 3인칭 등의 구분

열거형
PERSON_UNKNOWN 분석된 언어에 해당하는 사람이 없거나 예측되지 않습니다.
FIRST 처음
SECOND
THIRD 셋째
REFLEXIVE_PERSON 반사적

올바른

이 카테고리는 토큰이 고유명사의 일부인지를 보여줍니다.

열거형
PROPER_UNKNOWN 분석된 언어에 적합하지 않거나 예측되지 않습니다.
PROPER 올바른
NOT_PROPER 적절하지 않음

상호성

호칭의 상호적 특성

열거형
RECIPROCITY_UNKNOWN 분석된 언어에 호혜성이 적용되지 않거나 예측되지 않습니다.
RECIPROCAL 상호
NON_RECIPROCAL 비상호성

시제

시간 참조

열거형
TENSE_UNKNOWN 분석된 언어에 시제가 적용되지 않거나 예측되지 않습니다.
CONDITIONAL_TENSE 조건부
FUTURE 예정
PAST 이전
PRESENT 발표
IMPERFECT Imperfect
PLUPERFECT Pluperfect

음성

동사가 표현하는 액션과 인수로 식별된 참여자 간의 관계입니다.

열거형
VOICE_UNKNOWN 분석된 언어에 적용할 수 없는 음성 또는 예측되지 않은 음성입니다.
ACTIVE 활성
CAUSATIVE Causative
PASSIVE 수동

DependencyEdge

토큰의 종속 항목 파싱 트리 정보를 나타냅니다.

JSON 표현
{
  "headTokenIndex": integer,
  "label": enum (Label)
}
필드
headTokenIndex

integer

종속 항목 트리에서 이 토큰의 헤드를 나타냅니다. 이 토큰으로 이어지는 원호가 있는 토큰의 색인입니다. 색인은 API 메서드에서 반환된 토큰 배열에서 토큰의 위치입니다. 이 토큰이 루트 토큰인 경우 headTokenIndex는 자체 색인입니다.

label

enum (Label)

토큰의 파싱 라벨입니다.

라벨

토큰의 파싱 라벨 enum입니다.

열거형
UNKNOWN 알 수 없음
ABBREV 약어 수정자
ACOMP 형용사적 보어
ADVCL 부사절 수식어
ADVMOD 부사 수식어
AMOD NP의 형용사 수식자
APPOS NP의 접속형 수식어
ATTR 보조 동사에 종속된 속성
AUX 보조 (기본이 아닌) 동사
AUXPASS 수동 보조
CC 접속사
CCOMP 동사 또는 형용사의 절 보어
CONJ Conjunct
CSUBJ 주어 절
CSUBJPASS 수동절 주어
DEP 종속 항목 (확인할 수 없음)
DET 한정사
DISCOURSE 담화
DOBJ 직접 객체
EXPL 비속어
GOESWITH Goes with (잘 수정되지 않은 텍스트의 단어 일부)
IOBJ 간접 객체
MARK 마커 (종속절을 도입하는 단어)
MWE 여러 단어로 된 표현
MWV 여러 단어로 된 언어 표현
NEG 부정 수정자
NN 명사 복합 수식어
NPADVMOD 부사 수식어로 사용되는 명사구
NSUBJ 명사 주어
NSUBJPASS 수동 명사 주어
NUM 명사의 숫자 수식어
NUMBER 복합수의 요소
P 구두점
PARATAXIS 파라타시스 관계
PARTMOD 부분 수식어
PCOMP 전치사의 보어가 절임
POBJ 전치사의 목적어
POSS 소유권 수정자
POSTNEG 동사 뒤에 오는 부정어 부분
PRECOMP 술부 보어
PRECONJ 전제 조건
PREDET 선행 정관사
PREF 프리픽스
PREP 전치사 수식어
PRONL 동사와 어순 간의 관계
PRT Particle
PS 연합 또는 속격 조사
QUANTMOD 수량구 수식어
RCMOD 관계절 수식어
RCMODREL 관계절의 보문 표시
RDROP 앞에 술어가 없는 생략 기호
REF 관계항
REMNANT 잔여
REPARANDUM 수정사항
ROOT 루트
SNUM 숫자 단위를 지정하는 접미사
SUFF 접미사
TMOD 시간 수정자
TOPIC 주제 마커
VMOD 명사를 수식하는 부정형 동사가 앞에 오는 절
VOCATIVE 호격
XCOMP 열린 절 보충어
SUFFIX 이름 서픽스
TITLE 이름 직함
ADVPHMOD 부사구 수식어
AUXCAUS 사역적 보조동사
AUXVV 조동사
DTMOD 연체사(명사 앞에 오는 수식어)
FOREIGN 외국어
KW 키워드
LIST 비교 가능한 항목 체인의 목록
NOMC 명사화된 절
NOMCSUBJ 명사화된 주어 절
NOMCSUBJPASS 명사화된 수동절
NUMC 숫자 수식어의 복합어
COP 계사
DISLOCATED 위치가 바뀐 관계(앞쪽/주제 요소의 경우)
ASP 상 마커
GMOD 소유격 수식어
GOBJ 소유격 목적어
INFMOD 부정사 수식어
MES 측정
NCOMP 명사의 명사적 보어