Cloud Vision API 文档
借助 Cloud Vision API,开发者可轻松将视觉检测功能集成到应用中,这些功能包括图片标记、面孔和地标检测、光学字符识别 (OCR) 以及露骨内容的标记等。
获享 $300 免费赠金开始概念验证
- 体验 Gemini 2.0 Flash Thinking
- 免费使用热门产品(包括 AI API 和 BigQuery)的每月用量
- 不会自动收费,无需承诺
继续探索 20 多种提供“始终免费”用量的产品
使用适用于常见应用场景(包括 AI API、虚拟机、数据仓库等)的 20 多种免费产品。
文档资源
相关资源
OCR 教程
您将了解如何在 Google Cloud Platform 上执行光学字符识别 (OCR)。本教程演示如何将图片文件上传到 Google Cloud Storage、使用 Google Cloud Vision API 从图片中提取文本、使用 Google Cloud Translation API 翻译文本以及将译文保存回 Cloud Storage。
在控制台中创建一个简单的 Hello, World! 函数
快速部署您的第一个函数,而不需要任何本地设置。
大数据和机器学习基础知识
本讲师指导课程为期一天,旨在向学员介绍 Google Cloud 的大数据和机器学习功能。它简要介绍 Google Cloud,深入介绍数据处理功能。
通过连接 Functions、Storage、Vision API、Pub/Sub 和 Translation API 来检测图片中的文本
使用处理图片的函数(其使用 Vision API 提取文本然后将文本传递给其他服务)来响应 Cloud Storage 更改。
使用 DLP API 和 Cloud Functions 对上传到 Cloud Storage 的数据自动分类
使用 Pub/Sub、Cloud Functions 和 Data Loss Prevention API 对上传到 Cloud Storage 的数据进行自动分类。
对单个请求中的多个图片进行注释并将输出存储在 Cloud Storage 中
使用任何 Vision 特征类型运行离线(异步)检测服务和大批量图片文件注释。
设置 OCR 请求的存储和处理位置
设置特定区域来存储和处理用于光学字符识别 (OCR) 请求的资源。
检测令人反感的图片内容并对其进行模糊处理
演示了如何使用 Google Cloud Vision API 和 ImageMagick 检测上传到 Cloud Storage 存储桶的令人反感的图片并对其进行模糊处理。
使用术语表翻译和朗读照片中的文本(高级版)
使用 Vision API、Translation API、Text-to-Speech API 检测图片中的文本、进行个性化翻译以及从文本生成合成语音。
检测图片中的文本 (OCR) 并在找到的文本四周绘制边框
使用 Vision API 识别图片中的文本,然后根据检测到的文本添加注释。
相关视频
亲自试用 Cloud Vision API
新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。