Token

表示文本的最小语法构建块。

JSON 表示法
{
  "text": {
    object (TextSpan)
  },
  "partOfSpeech": {
    object (PartOfSpeech)
  },
  "dependencyEdge": {
    object (DependencyEdge)
  },
  "lemma": string
}
字段
text

object (TextSpan)

令牌文本。

partOfSpeech

object (PartOfSpeech)

此词法单元的词性标记。

dependencyEdge

object (DependencyEdge)

此词法单元的依存关系树解析。

lemma

string

词法单元的词元

PartOfSpeech

表示词法单元的词性信息。

JSON 表示法
{
  "tag": enum (Tag),
  "aspect": enum (Aspect),
  "case": enum (Case),
  "form": enum (Form),
  "gender": enum (Gender),
  "mood": enum (Mood),
  "number": enum (Number),
  "person": enum (Person),
  "proper": enum (Proper),
  "reciprocity": enum (Reciprocity),
  "tense": enum (Tense),
  "voice": enum (Voice)
}
字段
tag

enum (Tag)

词性标记。

aspect

enum (Aspect)

语法式。

case

enum (Case)

语法格。

form

enum (Form)

语法形式。

gender

enum (Gender)

语法性别。

mood

enum (Mood)

语法语气。

number

enum (Number)

语法数量。

person

enum (Person)

语法人称。

proper

enum (Proper)

语法专有性。

reciprocity

enum (Reciprocity)

语法互指性。

tense

enum (Tense)

语法时态。

voice

enum (Voice)

语法语态。

标记

词性标记枚举。

枚举
UNKNOWN 未知
ADJ 形容词
ADP 介词(前置词和后置词)
ADV 副词
CONJ 连词
DET 限定词
NOUN 名词(普通和专有)
NUM 基数词
PRON 代词
PRT 助词或其他虚词
PUNCT 标点符号
VERB 动词(所有时态和模式)
X 其他:外来词、拼写错误的词、缩写
AFFIX 词缀

在事件中表现时间流的动词特征。

枚举
ASPECT_UNKNOWN 式不适用于分析后的语言,也无法预测。
PERFECTIVE 完成式
IMPERFECTIVE 未完成式
PROGRESSIVE 进行式

名词或代词在短语、从句或句子中所起的语法作用。在某些语言中,其他词性(如形容词和限定词)都会发生与名词一致的格变化。

枚举
CASE_UNKNOWN 格不适用于分析后的语言,也无法预测。
ACCUSATIVE 宾格
ADVERBIAL 副词格
COMPLEMENTIVE 补充格
DATIVE 与格
GENITIVE 所有格
INSTRUMENTAL 工具格
LOCATIVE 位置格
NOMINATIVE 主格
OBLIQUE 从格
PARTITIVE 部分格
PREPOSITIONAL 前置格
REFLEXIVE_CASE 反身代词
RELATIVE_CASE 关系格
VOCATIVE 呼格

形式

根据语言的不同,形式可以分为动词、形容词、副词等不同形式。例如,对动词和形容词的变形词尾进行分类,或者对形容词和分词的短形式和长形式进行区分

枚举
FORM_UNKNOWN 形式不适用于分析后的语言,也无法预测。
ADNOMIAL 名词修饰语
AUXILIARY 辅助词
COMPLEMENTIZER 补语成分
FINAL_ENDING 词尾
GERUND 动名词
REALIS 已然形
IRREALIS 未然形
SHORT 短形式
LONG 长形式
ORDER 命令形式
SPECIFIC 特殊形式

性别

关联词的行为反映的名词性别类别。

枚举
GENDER_UNKNOWN 性别不适用于分析后的语言,也无法预测。
FEMININE 阴性词
MASCULINE 阳性词
NEUTER 中性词

语气

动词的语法功能,用于表示情态和态度。

枚举
MOOD_UNKNOWN 语气不适用于分析后的语言,也无法预测。
CONDITIONAL_MOOD 条件语气
IMPERATIVE 祈使语气
INDICATIVE 陈述语气
INTERROGATIVE 疑问语气
JUSSIVE 弱祈使语气
SUBJUNCTIVE 虚拟语气

数字

数的区分。

枚举
NUMBER_UNKNOWN 数字不适用于分析后的语言,也无法预测。
SINGULAR 单数
PLURAL 复数
DUAL 双数

人称

说话人、第二人称、第三人称等之间的区别。

枚举
PERSON_UNKNOWN 人称不适用于分析后的语言,也无法预测。
FIRST 第一人称
SECOND 第二人称
THIRD 第三人称
REFLEXIVE_PERSON 反身代词

专有

此类别显示词法单元是否属于专有名称的一部分。

枚举
PROPER_UNKNOWN 专有性不适用于分析后的语言,也无法预测。
PROPER 专有
NOT_PROPER 非专有

互指性

代词的互指特征。

枚举
RECIPROCITY_UNKNOWN 互指性不适用于分析后的语言,也无法预测。
RECIPROCAL 互指
NON_RECIPROCAL 非互指

时态

时间参考。

枚举
TENSE_UNKNOWN 时态不适用于分析后的语言,也无法预测。
CONDITIONAL_TENSE 条件
FUTURE 将来时
PAST 过去时
PRESENT 现在时
IMPERFECT 未完成时
PLUPERFECT 过去完成时

语态

动词表达的动作与由其主词确定的参与者之间的关系。

枚举
VOICE_UNKNOWN 语态不适用于分析后的语言,也无法预测。
ACTIVE 主动
CAUSATIVE 使动
PASSIVE 被动

DependencyEdge

表示词法单元的依存关系解析树信息。

JSON 表示法
{
  "headTokenIndex": integer,
  "label": enum (Label)
}
字段
headTokenIndex

integer

表示依存关系树中此词法单元的头。这是词法单元的索引,它包含指向该词法单元的有向边。索引是 API 方法返回的词法单元数组中词法单元的位置。如果此令牌是根令牌,则 headTokenIndex 是它自己的索引。

label

enum (Label)

词法单元的解析标签。

标签

词法单元的解析标签枚举。

枚举
UNKNOWN 未知
ABBREV 缩写
ACOMP 形容词补语
ADVCL 状语从句修饰语
ADVMOD 状语
AMOD 名词短语的形容词修饰
APPOS 名词短语的同位词修饰
ATTR 与系动词相关的属性
AUX 助(非主)动词
AUXPASS 被动式助动词
CC 并列连接词
CCOMP 动词或形容词的从句补语
CONJ 连接性副词
CSUBJ 从主关系
CSUBJPASS 主从被动关系
DEP 依赖关系(无法确定)
DET 限定词
DISCOURSE 话语
DOBJ 直接宾语
EXPL 虚词
GOESWITH 伴随(文本中未经修改的字词的一部分)
IOBJ 间接宾语
MARK 标志词(引导从句的字词)
MWE 多字词表达
MWV 多字词口头表达
NEG 否定词修饰
NN 复合名词修饰语
NPADVMOD 用作状语的名词短语
NSUBJ 名词性主语
NSUBJPASS 被动型名词性主语
NUM 名词的数量修饰
NUMBER 复名数
P 标点符号
PARATAXIS 并列关系
PARTMOD 分词修饰语
PCOMP 介词的补语是从句
POBJ 介词宾语
POSS 所有格修饰语
POSTNEG 动词后否定助词
PRECOMP 谓词补语
PRECONJ 前置连接词
PREDET 前置限定词
PREF 前缀
PREP 介词修饰语
PRONL 动词和动语素之间的关系
PRT 小品词
PS 关联或所有格标志词
QUANTMOD 量词短语修饰语
RCMOD 关系从句修饰语
RCMODREL 关系从句中的补语化成分
RDROP 前面无谓词的省略号
REF 指代
REMNANT 补余
REPARANDUM 修正
ROOT 词根
SNUM 指定数字单位的后缀
SUFF 后缀
TMOD 时间修饰语
TOPIC 主题标志词
VMOD 以修饰名词的动词不定式开头的从句
VOCATIVE 呼格
XCOMP 开放式从句补语
SUFFIX 名称后缀
TITLE 职位名称
ADVPHMOD 副词短语修饰
AUXCAUS 使役助动词
AUXVV 助动词
DTMOD Rentaishi(名词前修饰语)
FOREIGN 外来词
KW 关键字
LIST 一系列可比项目列表
NOMC 名词性从句
NOMCSUBJ 名词性从句主语
NOMCSUBJPASS 名词性从句被动语态
NUMC 数字修饰词组合
COP 系动词
DISLOCATED 错位关系(针对前移/主题化元素)
ASP 式标记
GMOD 所有格修饰语
GOBJ 所有格宾语
INFMOD 不定式修饰语
MES 衡量
NCOMP 名词的名词性补语