对象跟踪可以跟踪在输入视频或视频片段中检测到的多个对象,并返回与检测到的实体相关联的标签(标记)以及该实体在帧中的位置。
对象跟踪与标签检测不同。虽然标签检测为整个帧提供标签(没有边界框),而对象跟踪则检测单个对象,并提供标签与边界框,边界框用于描述每个对象在帧中的位置。例如,如果某个视频中有一车辆通过交叉路口,可能会产生“汽车”、“卡车”、“自行车”、“轮胎”、“灯”、“窗户”等标签。每个标签包含一系列边界框,用于显示该对象在帧中的位置。 每个边界框还带有包含时区设定(时间戳)的关联时间段,用于指示相对于视频开始时的时长偏移量。 注释还包含其他实体信息,包括实体 ID,您可以在 Google Knowledge Graph Search API 中使用该实体 ID 查找有关实体的更多信息。
要发出对象跟踪请求,请调用 annotate
方法并在 features
字段中指定 OBJECT_TRACKING
。
查看 Video Intelligence API 可视化工具,了解此功能的实际应用情况。