对象跟踪与标签检测不同。虽然标签检测为整个帧提供标签(没有边界框),而对象跟踪则检测单个对象,并提供标签与边界框,边界框用于描述每个对象在帧中的位置。例如,如果某个视频中有一车辆通过交叉路口,可能会产生“汽车”、“卡车”、“自行车”、“轮胎”、“灯”、“窗户”等标签。每个标签包含一系列边界框,用于显示该对象在帧中的位置。
每个边界框还带有包含时区设定(时间戳)的关联时间段,用于指示相对于视频开始时的时长偏移量。 注释还包含其他实体信息,包括实体 ID,您可以在 Google Knowledge Graph Search API 中使用该实体 ID 查找有关实体的更多信息。