文本检测执行光学字符识别 (OCR),以从视频或视频片段的帧中检测可见文本,并返回检测到的文本,以及有关帧级别位置的信息和视频中该文本的时间戳。
文本检测对于媒体和娱乐用例特别有用,包括在节目和电影结束时检测和提取投射列表,或检测是否有烧屏字幕。
文本检测适用于 Cloud Vision API 支持的语言。
要检测视频或视频片段中的可见文本,请调用 annotate
方法并在 features
字段中指定 TEXT_DETECTION
。
查看 Video Intelligence API 可视化工具,了解此功能的实际应用情况。
有关请求文本检测和获取注释结果的示例,请参阅文本检测。