文本检测

文本检测执行光学字符识别 (OCR),以从视频或视频片段的帧中检测可见文本,并返回检测到的文本,以及有关帧级别位置的信息和视频中该文本的时间戳。

文本检测对于媒体和娱乐用例特别有用,包括在节目和电影结束时检测和提取投射列表,或检测是否有烧屏字幕。

文本检测适用于 Cloud Vision API 支持的语言

要检测视频或视频片段中的可见文本,请调用 annotate 方法并在 features 字段中指定 TEXT_DETECTION

查看 Video Intelligence API 可视化工具,了解此功能的实际应用情况。

有关请求文本检测和获取注释结果的示例,请参阅文本检测