文本检测

文本检测执行光学字符识别 (OCR)，以从视频或视频片段的帧中检测可见文本，并返回检测到的文本，以及有关帧级别位置的信息和视频中该文本的时间戳。

文本检测对于媒体和娱乐用例特别有用，包括在节目和电影结束时检测和提取投射列表，或检测是否有烧屏字幕。

文本检测适用于 Cloud Vision API 支持的语言。

要检测视频或视频片段中的可见文本，请调用 annotate 方法并在 features 字段中指定 TEXT_DETECTION。

查看 Video Intelligence API 可视化工具，了解此功能的实际应用情况。

有关请求文本检测和获取注释结果的示例，请参阅文本检测。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-10-19。