トークン

テキストの構文の最小構成要素を表します。

JSON 表現

{
  "text": {
    object(TextSpan)
  },
  "partOfSpeech": {
    object(PartOfSpeech)
  },
  "dependencyEdge": {
    object(DependencyEdge)
  },
  "lemma": string
}
フィールド
text

object(TextSpan)

トークンのテキスト。

partOfSpeech

object(PartOfSpeech)

このトークンの品詞タグ。

dependencyEdge

object(DependencyEdge)

このトークンの依存関係ツリーの解析。

lemma

string

トークンの基本形

PartOfSpeech

トークンの品詞情報を表します。品詞は http://www.lrec-conf.org/proceedings/lrec2012/pdf/274_Paper.pdf で定義されているとおりです。

JSON 表現

{
  "tag": enum(Tag),
  "aspect": enum(Aspect),
  "case": enum(Case),
  "form": enum(Form),
  "gender": enum(Gender),
  "mood": enum(Mood),
  "number": enum(Number),
  "person": enum(Person),
  "proper": enum(Proper),
  "reciprocity": enum(Reciprocity),
  "tense": enum(Tense),
  "voice": enum(Voice)
}
フィールド
tag

enum(Tag)

品詞のタグ。

aspect

enum(Aspect)

文法上の相。

case

enum(Case)

文法上の格。

form

enum(Form)

文法上の形態。

gender

enum(Gender)

文法上の性別。

mood

enum(Mood)

文法上の法。

number

enum(Number)

文法上の数。

person

enum(Person)

文法上の人称。

proper

enum(Proper)

文法上の固有性。

reciprocity

enum(Reciprocity)

文法上の相互性。

tense

enum(Tense)

文法上の時制。

voice

enum(Voice)

文法上の態。

タグ

品詞タグの列挙型。

列挙型
UNKNOWN 不明
ADJ 形容詞
ADP 接置詞(前置詞と後置詞)
ADV 副詞
CONJ 接続詞
DET 限定詞
NOUN 名詞(普通および固有)
NUM 基数
PRON 代名詞
PRT 助詞またはその他の機能語
PUNCT 句読点
VERB 動詞(すべての時制と法)
X その他: 外来語、綴りの誤り、略語
AFFIX 接辞

Aspect

イベント中の時間の流れを表現する動詞の特性。

列挙型
ASPECT_UNKNOWN 相は、解析された言語には適用されない、または予測されません。
PERFECTIVE 完了相
IMPERFECTIVE 未完了相
PROGRESSIVE 進行相

Case

句、節、または文中の名詞や代名詞によって果たされる文法上の機能。言語によっては、形容詞や限定詞などの他の品詞は名詞に応じて格変化が行われます。

列挙型
CASE_UNKNOWN 格は、解析された言語には適用されないか、または予測されません。
ACCUSATIVE 対格
ADVERBIAL 副詞格
COMPLEMENTIVE 補格
DATIVE 与格
GENITIVE 属格
INSTRUMENTAL 具格
LOCATIVE 所格
NOMINATIVE 主格
OBLIQUE 斜格
PARTITIVE 部分格
PREPOSITIONAL 前置格
REFLEXIVE_CASE 再帰格
RELATIVE_CASE 関係格
VOCATIVE 呼格

Form

言語によっては、動詞、形容詞、副詞などを形態で分類できます。たとえば、動詞や形容詞の語尾変化を分類したり、形容詞や分詞の短い形態と長い形態を区別したりします。

列挙型
FORM_UNKNOWN 形態は、解析された言語には適用されないか、または予測されません。
ADNOMIAL 連体
AUXILIARY 補助
COMPLEMENTIZER 補文標識
FINAL_ENDING 終止
GERUND 動名詞
REALIS 事実的
IRREALIS 反事実的
SHORT 短い形態
LONG 長い形態
ORDER 命令形態
SPECIFIC 特定の形態

Gender

関連する単語の振る舞いに反映される名詞の性別クラス。

列挙型
GENDER_UNKNOWN 性別は、解析された言語には適用されないか、または予測されません。
FEMININE 女性
MASCULINE 男性
NEUTER 中性

Mood

法性や態度を示すために使用される動詞の文法的特徴。

列挙型
MOOD_UNKNOWN 法は、解析された言語には適用されないか、予測されません。
CONDITIONAL_MOOD 条件法
IMPERATIVE 命令法
INDICATIVE 直説法
INTERROGATIVE 疑問法
JUSSIVE 命令法
SUBJUNCTIVE 仮定法

Number

数の区別。

列挙型
NUMBER_UNKNOWN 数は、解析された言語には適用されないか、予測されません。
SINGULAR 単数
PLURAL 複数
DUAL 両数

Person

一人称、二人称、三人称などの区別。

列挙型
PERSON_UNKNOWN 人称は、解析された言語には適用されないか、予測されません。
FIRST 一人称
SECOND 二人称
THIRD 三人称
REFLEXIVE_PERSON 再帰格

Proper

このカテゴリは、トークンが固有名詞の一部であるかどうかを示します。

列挙型
PROPER_UNKNOWN 固有性は、解析された言語には適用されないか、予測されません。
PROPER 固有である
NOT_PROPER 固有ではない

Reciprocity

代名詞の相互性を示します。

列挙型
RECIPROCITY_UNKNOWN 相互性は、解析された言語には適用されないか、予測されません。
RECIPROCAL 相互的である
NON_RECIPROCAL 相互的でない

Tense

時制を示します。

列挙型
TENSE_UNKNOWN 時制は、解析された言語には適用されないか、予測されません。
CONDITIONAL_TENSE 条件法
FUTURE 未来
PAST 過去
PRESENT 現在
IMPERFECT 未完了
PLUPERFECT 過去完了

Voice

動詞が表現する行為と、その叙述によって特定される参加者との関係。

列挙型
VOICE_UNKNOWN 態は、解析された言語には適用されないか、または予測されません。
ACTIVE 能動態
CAUSATIVE 使役態
PASSIVE 受動態

DependencyEdge

トークンの依存関係ツリーの解析情報を表します。(依存関係ラベルの詳細については、http://www.aclweb.org/anthology/P13-2017 をご覧ください。)

JSON 表現

{
  "headTokenIndex": number,
  "label": enum(Label)
}
フィールド
headTokenIndex

number

依存関係ツリー内でのトークンの先頭を表します。これは、このトークンに向かう弓線のルートトークンのインデックスです。インデックスは、API メソッドによって返されるトークンの配列内におけるトークンの位置です。このトークンがルートトークンの場合、headTokenIndex はトークン自身のインデックスです。

label

enum(Label)

トークンの解析ラベル。

ラベル

トークンの解析ラベルの列挙型。

列挙型
UNKNOWN 不明
ABBREV 略語の修飾子
ACOMP 形容詞の補語
ADVCL 副詞節の修飾子
ADVMOD 副詞の修飾子
AMOD NP の形容詞の修飾子
APPOS NP の同格の修飾子
ATTR 連結動詞の属性従属
AUX 助動詞(非メイン動詞)
AUXPASS 受動態の助動詞
CC 等位接続詞
CCOMP 動詞または形容詞の節補語
CONJ 接合詞
CSUBJ 節主語
CSUBJPASS 受動態の節主語
DEP 依存性(決定不可)
DET 限定詞
DISCOURSE ディスコース
DOBJ 直接目的語
EXPL 虚辞
GOESWITH 付随(適切に編集されていないテキストの単語の一部)
IOBJ 間接目的語
MARK マーカー(従属節を導入する単語)
MWE 複数単語の表現
MWV 複数単語の言語表出
NEG 否定の修飾子
NN 複合名詞の修飾子
NPADVMOD 副詞の修飾子として使用される名詞句
NSUBJ 名詞相当語句の主語
NSUBJPASS 受動態における名詞相当語句の主語
NUM 名詞の数値修飾子
NUMBER 複名数の要素
P 句読点
PARATAXIS 並列関係
PARTMOD 分詞の修飾子
PCOMP 前置詞の補語が節である
POBJ 前置詞の目的語
POSS 所有の修飾子
POSTNEG 動詞の後の否定助詞
PRECOMP 叙述的な補語
PRECONJ 相関接続詞
PREDET 前限定辞
PREF 接頭辞
PREP 前置詞の修飾子
PRONL 動詞と動詞形態素の間の関係
PRT 助詞
PS 関連マーカーまたは所有マーカー
QUANTMOD 数量詞句の修飾子
RCMOD 関係節の修飾子
RCMODREL 関係節内の補文標識
RDROP 前に述語のない省略記号
REF 指示物
REMNANT 残余物
REPARANDUM 修復対象
ROOT 語根
SNUM 数字の単位を指定する接尾辞
SUFF 接尾辞
TMOD 時に関する修飾子
TOPIC トピック マーカー
VMOD 名詞を修飾する動詞の不定形で始まる節
VOCATIVE 呼格
XCOMP オープンな節補語
SUFFIX 名前の接尾辞
TITLE 名前に付く称号
ADVPHMOD 副詞句の修飾子
AUXCAUS 使役の助動詞
AUXVV 補助的な助動詞
DTMOD 連帯詞(名詞の前に置く修飾子)
FOREIGN 外来語
KW キーワード
LIST 比較可能なアイテムの一連のリスト
NOMC 名詞化した節
NOMCSUBJ 名詞化した節の主語
NOMCSUBJPASS 名詞化した節の受動態
NUMC 数字の修飾子の複合語
COP 連結詞
DISLOCATED 位置が変化した関係(先頭に置かれた / 主題化された要素に関する)
ASP 相マーカー
GMOD 属格修飾子
GOBJ 属格目的語
INFMOD 不定詞の修飾子
MES 測定
NCOMP 名詞補部