Cloud Vision API 참고 리소스
개발자는 Cloud Vision API를 사용하여 이미지 라벨링, 얼굴 및 특징 인식, 광학 문자 인식(OCR), 선정적인 콘텐츠 태그 지정과 같은 시각적 인식 기능을 애플리케이션에 손쉽게 통합할 수 있습니다.
무료 크레딧 $300로 개념 증명 시작
- Gemini 2.0 Flash Thinking 이용
- AI API 및 BigQuery를 포함하여 인기 제품 월별 무료 사용량
- 자동 청구, 약정 없음
20개가 넘는 항상 무료 제품을 계속 살펴보기
AI API, VM, 데이터 웨어하우스 등 일반적인 사용 사례에 20개가 넘는 무료 제품을 사용할 수 있습니다.
문서 리소스
관련 리소스
OCR 가이드
Google Cloud Platform에서 광학 문자 인식(OCR)을 수행하는 방법을 알아보세요. 이 가이드에서는 이미지 파일을 Google Cloud Storage에 업로드하고, Google Cloud Vision API를 사용하여 이미지에서 텍스트를 추출하고, Google Cloud Translation API를 사용하여 텍스트를 번역하고, 번역을 다시 Cloud Storage에 저장하는 방법을 설명합니다.
빅데이터 및 ML 기초
이 1일 강사 주도형 강의에서는 참가자들에게 Google Cloud의 빅데이터 및 머신러닝 기능을 소개합니다. Google Cloud 개요를 빠르게 살펴보고 데이터 처리 기능에 대해 자세히 살펴볼 수 있습니다.
Functions, 스토리지, Vision API, Pub/Sub, Translation API를 연결하여 이미지의 텍스트 감지
Vision API를 사용하여 이미지를 처리하는 함수로 Cloud Storage 변경사항에 대응하고 텍스트를 추출한 후 이를 다른 서비스로 전달할 수 있습니다.
DLP API 및 Cloud Functions를 사용하여 Cloud Storage에 업로드된 데이터 자동 분류
Pub/Sub, Cloud Functions, Data Loss Prevention API를 사용하여 Cloud Storage에 업로드된 데이터를 자동으로 분류합니다.
단일 요청으로 여러 이미지 주석 처리 및 Cloud Storage에 출력 저장
Vision 기능 유형을 사용하여 대규모 이미지 파일 배치에 대한 오프라인(비동기) 감지 서비스 및 주석을 실행합니다.
OCR 요청에 대한 스토리지 및 처리 위치 설정
광학 문자 인식(OCR) 요청에 사용되는 리소스를 저장하고 처리하기 위해 특정 리전을 설정합니다.
불쾌감을 주는 이미지 콘텐츠 감지 및 흐리게 처리
Google Cloud Vision API 및 ImageMagick을 사용해 Cloud Storage 버킷에 업로드된 불쾌감을 주는 이미지를 감지하여 흐리게 처리하는 방법을 보여줍니다.
용어집을 이용해 사진의 텍스트 번역 및 음성 변환(Advanced)
Vision API, Translation API, Text-to-Speech API를 사용하여 이미지의 텍스트를 감지하고, 번역을 개인화하고, 번역된 텍스트로부터 합성 음성을 생성합니다.
이미지(OCR)의 텍스트 감지 및 발견된 텍스트 주위에 테두리 그리기
Vision API를 사용하여 이미지에서 텍스트를 감지한 후 감지된 텍스트를 기준으로 이미지를 주석 처리합니다.
관련 동영상
Cloud Vision API 직접 사용해 보기
신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.