索引
AutoMl
(接口)PredictionService
(接口)AnnotationPayload
(消息)AnnotationSpec
(消息)BatchPredictOperationMetadata
(消息)BatchPredictOperationMetadata.BatchPredictionOutputInfo
(消息)BatchPredictRequest
(消息)BatchPredictResult
(消息)BatchPredictionInputConfig
(消息)BatchPredictionOutputConfig
(消息)ClassificationAnnotation
(消息)ClassificationEvaluationMetrics
(消息)ClassificationEvaluationMetrics.ConfidenceMetricsEntry
(消息)ClassificationEvaluationMetrics.ConfusionMatrix
(消息)ClassificationEvaluationMetrics.ConfusionMatrix.Row
(消息)CreateDatasetRequest
(消息)CreateModelOperationMetadata
(消息)CreateModelRequest
(消息)Dataset
(消息)DeleteDatasetRequest
(消息)DeleteModelRequest
(消息)DeleteOperationMetadata
(消息)DeployModelRequest
(消息)ExamplePayload
(消息)ExportDataRequest
(消息)GcsDestination
(消息)GcsSource
(消息)GetAnnotationSpecRequest
(消息)GetDatasetRequest
(消息)GetModelEvaluationRequest
(消息)GetModelRequest
(消息)ImportDataOperationMetadata
(消息)ImportDataRequest
(消息)InputConfig
(消息)ListDatasetsRequest
(消息)ListDatasetsResponse
(消息)ListModelEvaluationsRequest
(消息)ListModelEvaluationsResponse
(消息)ListModelsRequest
(消息)ListModelsResponse
(消息)Model
(消息)Model.DeploymentState
(枚举)ModelEvaluation
(消息)OperationMetadata
(消息)OutputConfig
(消息)PredictRequest
(消息)PredictResponse
(消息)TimeSegment
(消息)UndeployModelRequest
(消息)VideoClassificationAnnotation
(消息)VideoClassificationDatasetMetadata
(消息)VideoClassificationModelMetadata
(消息)
AutoMl
AutoML Server API。
资源名称由服务器分配。服务器不会重复使用它为已删除的那些资源所创建的名称。
资源 ID 是项目的资源名称的最后一个元素。对于 projects/{project_id}/locations/{location_id}/datasets/{dataset_id}
,该项的 ID 为 {dataset_id}
。
目前,唯一受支持的 location_id
是“us-central1”。
CreateDataset | |
---|---|
创建数据集。
|
CreateModel | |
---|---|
创建模型。完成时,它会在
|
DeleteDataset | |
---|---|
删除数据集及其所有内容。完成时,它会在
|
DeleteModel | |
---|---|
删除模型。完成时,它会在
|
DeployModel | |
---|---|
部署模型。完成时,它会在
|
ExportData | |
---|---|
将数据集的数据导出到 Google Cloud Storage 存储分区。完成时,它会在
|
GetAnnotationSpec | |
---|---|
获取注释规范。
|
GetDataset | |
---|---|
获取数据集。
|
GetModel | |
---|---|
获取模型。
|
GetModelEvaluation | |
---|---|
获取模型评估。
|
ImportData | |
---|---|
将数据导入数据集。 您只能针对空数据集调用此方法。 如需了解详情,请参阅将数据项导入数据集
|
ListDatasets | |
---|---|
列出项目中的数据集。
|
ListModelEvaluations | |
---|---|
列出模型评估。
|
ListModels | |
---|---|
列出模型。
|
UndeployModel | |
---|---|
取消部署模型。完成时,它会在
|
PredictionService
AutoML Prediction API。
BatchPredict | |
---|---|
执行批量预测并返回长时间运行的操作的 ID。您可以使用
|
Predict | |
---|---|
不适用于 AutoML Video Intelligence。
|
AnnotationPayload
包含与 AutoML 相关的注释信息。
字段 | ||
---|---|---|
annotation_spec_id |
仅限输出。与此注释相关的注释规范的资源 ID。注释规范来自祖先数据集或用于训练所用模型的数据集。 |
|
display_name |
仅限输出。训练模型时 |
|
联合字段 detail 。仅限输出。有关 AutoML 解决方案特定注释的其他信息。detail 只能是下列其中一项: |
||
classification |
关于分类预测的注释详情。 |
|
video_classification |
关于视频分类的注释详情。为视频分类预测返回此项。 |
AnnotationSpec
注释的定义。
字段 | |
---|---|
name |
仅限输出。注释规范的资源名称。格式: 'projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/annotationSpecs/{annotation_spec_id}' |
display_name |
必填。要在界面中显示的注释规范的名称。名称不得超过 32 个字符,只能包含 ASCII 拉丁字母(A-Z 和 a-z)、下划线 (_) 和 ASCII 数字 (0-9)。 |
example_count |
仅限输出。注释规范标记的父级数据集中的样本数。 |
BatchPredictOperationMetadata
BatchPredict 操作详情。
字段 | |
---|---|
input_config |
仅限输出。启动此批量预测操作时提供的输入配置。 |
output_info |
仅限输出。进一步介绍此批量预测的输出的信息。 |
BatchPredictionOutputInfo
进一步介绍此批量预测的输出。补充
字段 | |
---|---|
gcs_output_directory |
创建的 Google Cloud Storage 目录的完整路径,其中写入了预测输出。 |
BatchPredictRequest
字段 | |||||||||
---|---|---|---|---|---|---|---|---|---|
name |
被请求提供批量预测的模型的名称。 必须对指定的资源
|
||||||||
input_config |
必填。批量预测的输入配置。 |
||||||||
output_config |
必填。指定应写入输出预测结果的位置。 |
||||||||
params |
可以是下列选项之一:
请参阅为视频添加注释了解详情。 |
BatchPredictResult
批量预测结果。
BatchPredictionInputConfig
BatchPredict
操作的输入配置。输入是在 Google Cloud Storage 中存储的一个或多个 CSV 文件,其中 CSV 文件采用以下格式:
GCS_FILE_PATH,TIME_SEGMENT_START,TIME_SEGMENT_END
GCS_FILE_PATH
标识大小不超过 50GB 且时长不超过 3 小时的视频的 Google Cloud Storage 路径。支持的扩展名:.MOV、.MPEG4、.MP4、.AVI。TIME_SEGMENT_START
和TIME_SEGMENT_END
必须在视频的时长范围内,并且结束时间必须晚于开始时间。
三个样本行:
gs://folder/video1.mp4,10,40
gs://folder/video1.mp4,20,60
gs://folder/vid2.mov,0,inf
请参阅为视频添加注释了解详情。
字段 | |
---|---|
gcs_source |
输入内容所在的 Google Cloud Storage 位置。 |
BatchPredictionOutputConfig
BatchPredict
操作的输出配置。
AutoML Video Intelligence 创建
中指定的目录。目录的名称是"prediction-<model-display-name>-<timestamp-of-prediction-call>",其中时间戳的格式为 gcsDestination
YYYY-MM-DDThh:mm:ss.sssZ
ISO-8601。
AutoML Video Intelligence 在新目录中创建名为 video_classification.csv 的文件,同时为所请求的每个视频分类创建一个 JSON 文件。即,输入 CSV 文件中的每一行。
video_classification.csv 文件的格式如下:
GCS_FILE_PATH,TIME_SEGMENT_START,TIME_SEGMENT_END,JSON_FILE_NAME,STATUS
GCS_FILE_PATH
、TIME_SEGMENT_START
、TIME_SEGMENT_END
与输入 CSV 文件中的相同字段匹配。JSON_FILE_NAME
是输出目录中包含视频时间段预测响应的 JSON 文件的名称。STATUS
在预测成功完成后包含“OK”;否则包含错误信息。如果STATUS
不是“OK”,则该预测的 JSON 文件可能为空或者该文件可能不存在。
STATUS
为“OK”的每个 JSON 文件都包含采用 JSON 格式的 AnnotationPayload proto 列表,其中预测了 video_classification.csv 中分配给文件的视频时间段。所有 AnnotationPayload proto 都有 video_classification
字段,并按 video_classification.type
字段排序。返回的类型由 BatchPredictRequest.params
的 classifaction_types
参数决定。
字段 | |
---|---|
gcs_destination |
输出必须写入的 Google Cloud Storage 目录位置。 |
ClassificationAnnotation
包含特定于分类的注释详细信息。
字段 | |
---|---|
score |
仅限输出。介于 0.0 和 1.0 之间的置信度估计值。值越大意味着注释为正例的置信度越高。如果用户将注释批准为负例或正例,则分数值保持不变。如果用户创建注释,则分数为 0 时表示负例,为 1 时表示正例。 |
ClassificationEvaluationMetrics
分类问题的模型评估指标。这些指标仅描述类型设为 segment_classification
的预测的质量。要了解预测类型,请参阅 BatchPredictRequest.params
。
字段 | |
---|---|
au_prc |
仅限输出。精确率/召回率曲线下的面积指标。 |
base_au_prc |
仅限输出。基于先验的精确率/召回率曲线下的面积指标。 |
confidence_metrics_entry[] |
仅限输出。每个 confidence_threshold 的指标,范围为 0.05、0.10、...、0.95、0.96、0.97、0.98、0.99。由这些指标可以得到精确率/召回率曲线。 |
confusion_matrix |
仅限输出。评估的混淆矩阵。仅针对标签数不超过 10 的 MULTICLASS 分类问题进行设置。仅针对模型级评估(而非标签级评估)进行设置。 |
annotation_spec_id[] |
仅限输出。用于此评估的注释规范 ID。 |
ConfidenceMetricsEntry
单个置信度阈值的指标。
字段 | |
---|---|
confidence_threshold |
仅限输出。用于计算指标的置信度阈值。 |
recall |
仅限输出。指定置信度阈值下的召回率。 |
precision |
仅限输出。指定置信度阈值下的精确率。 |
f1_score |
仅限输出。召回率和精确率的调和平均数。 |
recall_at1 |
仅限输出。召回率(仅考虑具有最高预测分数且不低于每个样本的置信度阈值的标签)。 |
precision_at1 |
仅限输出。精确率(仅考虑具有最高预测分数且不低于每个样本的置信度阈值的标签)。 |
f1_score_at1 |
仅限输出。 |
ConfusionMatrix
运行分类的模型的混淆矩阵。
字段 | |
---|---|
annotation_spec_id[] |
仅限输出。混淆矩阵中使用的注释规范的 ID。 |
row[] |
仅限输出。混淆矩阵中的行。行数等于 |
Row
仅限输出。混淆矩阵中的行。
字段 | |
---|---|
example_count[] |
仅限输出。混淆矩阵中特定单元的值。每行具有的值数(即,行的长度)等于 annotation_spec_id 字段的长度。 |
CreateDatasetRequest
AutoMl.CreateDataset
的请求消息。
字段 | |
---|---|
parent |
要为其创建数据集的项目的资源名称。 必须对指定的资源
|
dataset |
要创建的数据集。 |
CreateModelOperationMetadata
CreateModel 操作详情。
CreateModelRequest
AutoMl.CreateModel
的请求消息。
字段 | |
---|---|
parent |
要为其创建模型的父级项目的资源名称。 必须对指定的资源
|
model |
要创建的模型。 |
Dataset
一个工作区,用于解决单一的特定机器学习 (ML) 问题。工作区包含可以添加注释的样本。
字段 | |
---|---|
name |
仅限输出。数据集的资源名称。格式如下: |
display_name |
必填。要在界面中显示的数据集的名称。名称不得超过 32 个字符,只能包含 ASCII 拉丁字母(A-Z 和 a-z)、下划线 (_) 和 ASCII 数字 (0-9)。 |
example_count |
仅限输出。数据集中的样本数。 |
create_time |
仅限输出。创建此数据集时的时间戳。 |
video_classification_dataset_metadata |
用于视频分类的数据集的元数据。 |
DeleteDatasetRequest
AutoMl.DeleteDataset
的请求消息。
字段 | |
---|---|
name |
要删除的数据集的资源名称。 必须对指定的资源
|
DeleteModelRequest
AutoMl.DeleteModel
的请求消息。
字段 | |
---|---|
name |
要删除的模型的资源名称。 必须对指定的资源
|
DeleteOperationMetadata
执行删除任何实体的操作的详细信息。
DeployModelRequest
AutoMl.DeployModel
的请求消息。
字段 | |
---|---|
name |
要部署的模型的资源名称。 必须对指定的资源
|
ExamplePayload
用于训练或预测的样本数据。
ExportDataRequest
AutoMl.ExportData
的请求消息。
字段 | |
---|---|
name |
必填。数据集的资源名称。 必须对指定的资源
|
output_config |
必填。目标输出位置。 |
GcsDestination
必须写入输出的 Google Cloud Storage 位置。
字段 | |
---|---|
output_uri_prefix |
必填。输出目录的 Google Cloud Storage URI,长度不超过 2000 个字符。接受的形式:* 前缀路径:gs://bucket/directory。发出请求的用户必须对相应存储分区拥有写入权限。如果该目录不存在,将会创建一个。 |
GcsSource
输入内容所在的 Google Cloud Storage 位置。
字段 | |
---|---|
input_uris[] |
必填。输入文件的 Google Cloud Storage URI,长度不超过 2000 个字符。接受的形式:* 完整对象路径,例如 gs://bucket/directory/object.csv |
GetAnnotationSpecRequest
AutoMl.GetAnnotationSpec
的请求消息。
字段 | |
---|---|
name |
要检索的注释规范的资源名称。 必须对指定的资源
|
GetDatasetRequest
AutoMl.GetDataset
的请求消息。
字段 | |
---|---|
name |
要检索的数据集的资源名称。 必须对指定的资源
|
GetModelEvaluationRequest
AutoMl.GetModelEvaluation
的请求消息。
字段 | |
---|---|
name |
模型评估的资源名称。 必须对指定的资源
|
GetModelRequest
AutoMl.GetModel
的请求消息。
字段 | |
---|---|
name |
模型的资源名称。 必须对指定的资源
|
ImportDataOperationMetadata
ImportData 操作详情。
ImportDataRequest
AutoMl.ImportData
的请求消息。
字段 | |
---|---|
name |
必填。数据集名称。数据集必须是当前存在的数据集。系统会添加所有导入的注释和示例。 必须对指定的资源
|
input_config |
必填。目标输入位置及其网域特定语义(如果有)。 |
InputConfig
ImportData
操作的输入配置。
输入格式取决于正在发生导入操作的数据集所具有的 dataset_metadata。对于输入源,除非另有说明,否则应为 gcs_source
。如果多次提到具有相同内容(即使它具有不同的 GCS_FILE_PATH
)的文件,则会附加其标签、边界框等等。应始终为同一文件提供相同的 ML_USE
和 GCS_FILE_PATH
,否则无法从给定的值中确切地选择这些值。
格式以 EBNF 表示,其中逗号作为字面量,并在该注释末尾附近定义非终结符号。格式如下:
如需了解详情,请参阅准备训练数据。
CSV 文件,每行的格式为:
ML_USE,GCS_FILE_PATH
ML_USE
- 标识当前行(文件)适用的数据集。这个值可以是以下值之一:TRAIN
- 此文件中的行用于训练模型。TEST
- 此文件中的行用于在训练期间测试模型。UNASSIGNED
- 此文件中的行未分类。它们会自动划分为训练数据和测试数据。80% 用于训练,20% 用于测试。
GCS_FILE_PATH
- 标识在 Google Cloud Storage 中存储的文件,其中包含模型训练信息。
在 TRAIN
和 UNASSIGNED
CSV 文件中确定训练数据集之后,训练数据被划分为训练数据集和验证数据集。70% 用于训练,30% 用于验证。
使用 GCS_FILE_PATH
字段指定的每个 CSV 文件都采用以下格式:
GCS_FILE_PATH,LABEL,TIME_SEGMENT_START,TIME_SEGMENT_END
GCS_FILE_PATH
- 在 Google Cloud Storage 中存储的视频的路径。视频时长不得超过 1 小时。支持的扩展名:.MOV、.MPEG4、.MP4、.AVI 以及 ffmpeg 支持的任何文件格式。LABEL
- 标识视频片段对象的标签。TIME_SEGMENT_START
和TIME_SEGMENT_END
- 要添加注释的视频片段的开始和结束时间戳(以秒为单位)。这些值必须在视频的时长范围内,TIME_SEGMENT_END
必须晚于TIME_SEGMENT_START
。
视频的任意帧具有一个或多个标签,则会被视为所有其他标签的难分样本。默认情况下,没有标签的帧被视为未知(可以通过 is_exhaustively_labeled
参数进行替换)。特殊标签“-”可用于表示给定时间段是所有标签的难分样本,标有“-”的片段不能与任何其他标签的片段重叠。
样本文件:
TRAIN,gs:folder/train_videos.csv
TEST,gs:folder/test_videos.csv
UNASSIGNED,gs:folder/other_videos.csv
以下是 gcsSource
“顶级”文件标识的一个 CSV 文件的格式样本。
gs:folder/video1.avi,car,120,180.000021
gs:folder/video1.avi,bike,150,180.000023
gs:folder/video1.avi,-,180.000024,300.000999
gs:folder/vid2.avi,car,0,60.5
错误:
如果无法解析提供的任何 CSV 文件,或者如果无法处理超过特定百分比的 CSV 行,则操作失败,并且不会导入任何内容。无论总体成功还是失败,每行失败率(不超过特定计数上限)将列在 Operation.metadata.partial_failures 中。
字段 | |
---|---|
gcs_source |
输入内容所在的 Google Cloud Storage 位置。 |
ListDatasetsRequest
AutoMl.ListDatasets
的请求消息。
字段 | |
---|---|
parent |
要列出其数据集的项目的资源名称。 必须对指定的资源
|
filter |
用于过滤请求结果的表达式。
使用此过滤条件的示例:
|
page_size |
请求的页面大小。服务器返回的结果可能要比请求的少。如果未指定,服务器将选择默认大小。 |
page_token |
一个令牌,用于标识要让服务器返回的结果页面。通常取自前一次 |
ListDatasetsResponse
AutoMl.ListDatasets
的响应消息。
字段 | |
---|---|
datasets[] |
读取的数据集。 |
next_page_token |
用于检索下一页结果的令牌。传递给 |
ListModelEvaluationsRequest
AutoMl.ListModelEvaluations
的请求消息。
字段 | |
---|---|
parent |
要列出其模型评估的模型资源名称。如果 modelId 设为“-”,则将列出父位置的所有模型的模型评估。 必须对指定的资源
|
filter |
用于过滤请求结果的表达式。
使用该过滤条件的一些示例:
|
page_size |
请求的页面大小。 |
page_token |
一个令牌,用于标识要让服务器返回的结果页面。通常取自前一次 |
ListModelEvaluationsResponse
AutoMl.ListModelEvaluations
的响应消息。
字段 | |
---|---|
model_evaluation[] |
所请求页面中的模型评估列表。 |
next_page_token |
用于检索下一页结果的令牌。传递给新的 |
ListModelsRequest
AutoMl.ListModels
的请求消息。
字段 | |
---|---|
parent |
要列出其模型的项目的资源名称。 必须对指定的资源
|
filter |
用于过滤请求结果的表达式。
使用该过滤条件的一些示例:
|
page_size |
请求的页面大小。 |
page_token |
一个令牌,用于标识要让服务器返回的结果页面。通常取自前一次 |
ListModelsResponse
AutoMl.ListModels
的响应消息。
字段 | |
---|---|
model[] |
所请求页面中的模型列表。 |
next_page_token |
用于检索下一页结果的令牌。传递给 |
型号
API proto,代表所训练的机器学习模型。
字段 | |
---|---|
name |
仅限输出。模型的资源名称。格式如下: |
display_name |
必填。要在界面中显示的模型的名称。名称不得超过 32 个字符,只能包含 ASCII 拉丁字母(A-Z 和 a-z)、下划线 (_) 和 ASCII 数字 (0-9)。必须以字母开头。 |
dataset_id |
必填。用于创建模型的数据集的资源 ID。数据集必须来自相同的祖先项目和位置。 |
create_time |
仅限输出。创建此模型时的时间戳。 |
update_time |
仅限输出。上次更新此模型时的时间戳。 |
deployment_state |
仅限输出。模型的部署状态。模型只能在部署后才能服务预测请求。 |
video_classification_model_metadata |
视频分类模型的元数据。 |
DeploymentState
模型的部署状态。
枚举 | |
---|---|
DEPLOYMENT_STATE_UNSPECIFIED |
不应使用,默认情况下,未设置的枚举具有此值。 |
DEPLOYED |
模型已部署。 |
UNDEPLOYED |
模型未部署。 |
ModelEvaluation
模型的评估结果。
字段 | |
---|---|
name |
仅限输出。模型评估的资源名称。格式:
|
annotation_spec_id |
仅限输出。模型评估适用的注释规范的 ID。整体模型评估的 ID 为空。注意:目前无法从注释规范的 ID 获取其 display_name。要查看 display_name,请查看界面中的模型评估。 |
display_name |
仅限输出。训练模型时 |
create_time |
仅限输出。创建此模型评估时的时间戳。 |
evaluated_example_count |
仅限输出。用于模型评估的样本数,评估时将模型创建时的评估依据与模型创建的预测注释进行比较。对于整体 ModelEvaluation(即未设置 annotation_spec_id),这是用于评估的所有样本的总数。否则,这是根据评估依据由以下项注释的样本数: |
classification_evaluation_metrics |
分类模型的评估指标。 |
OperationMetadata
在由 AutoML API 返回的所有长时间运行操作中使用的元数据。
字段 | ||
---|---|---|
progress_percent |
仅限输出。操作进度。范围:[0, 100]。尚未使用。 |
|
partial_failures[] |
仅限输出。遇到的部分失败。例如,无法读取个别文件。该字段不应超过 20 个条目。状态详细信息字段将包含标准 GCP 错误详情。 |
|
create_time |
仅限输出。操作的创建时间。 |
|
update_time |
仅限输出。上次更新操作的时间。 |
|
联合字段 details 。仅限输出。特定操作详情。即使此字段为空,其存在也可以区分不同的操作类型。details 只能是下列其中一项: |
||
delete_details |
Delete 操作详情。 |
|
create_model_details |
CreateModel 操作详情。 |
|
import_data_details |
ImportData 操作详情。 |
|
batch_predict_details |
BatchPredict 操作详情。 |
OutputConfig
输出配置。
字段 | |
---|---|
gcs_destination |
必须写入输出的 Google Cloud Storage 位置。 |
PredictRequest
PredictionService.Predict
的请求消息。
字段 | |
---|---|
name |
要请求其提供预测的模型的名称。 必须对指定的资源
|
payload |
必填。用于执行预测的负载。负载必须与模型被训练来解决的问题类型相匹配。 |
params |
其他网域特定参数,任何字符串的长度均不得超过 25000 个字符。 |
PredictResponse
PredictionService.Predict
的响应消息。
字段 | |
---|---|
payload[] |
预测结果。 |
metadata |
网域专有的附加预测响应元数据。 |
TimeSegment
具有时间维度的样本(例如,视频)内的时间段。
字段 | |
---|---|
start_time_offset |
时间段的开始时间(含边界值),表示为自样本启动以来的时长。 |
end_time_offset |
时间段结束时间(不含边界值),表示为自样本启动以来的时长。 |
UndeployModelRequest
AutoMl.UndeployModel
的请求消息。
字段 | |
---|---|
name |
要取消部署的模型的资源名称。 必须对指定的资源
|
VideoClassificationAnnotation
包含针对视频分类的注释详细信息。
字段 | |
---|---|
type |
仅限输出。表示视频分类的类型。可能的值:
|
classification_annotation |
仅限输出。此注释的分类详情。 |
time_segment |
仅限输出。注释适用的视频时间段。 |
VideoClassificationDatasetMetadata
针对视频分类的数据集元数据。所有视频分类数据集均视为多标签。
VideoClassificationModelMetadata
针对视频分类的模型元数据。