- HTTP 요청
- 요청 본문
- 응답 본문
- 승인 범위
- AnnotateImageRequest
- Image
- ImageSource
- AnnotateImageResponse
- FaceAnnotation
- Landmark
- 유형
- Position
- 가능성
- EntityAnnotation
- LocationInfo
- Property
- LocalizedObjectAnnotation
- TextAnnotation
- Page
- TextProperty
- DetectedLanguage
- DetectedBreak
- BreakType
- Block
- Paragraph
- Word
- Symbol
- BlockType
- SafeSearchAnnotation
- ImageProperties
- DominantColorsAnnotation
- ColorInfo
- CropHintsAnnotation
- CropHint
- WebDetection
- WebEntity
- WebImage
- WebPage
- WebLabel
- ProductSearchResults
- Result
- GroupedResult
- ImageAnnotationContext
이미지 배치에 대한 이미지 감지 및 주석을 실행합니다.
HTTP 요청
POST https://vision.googleapis.com/v1p3beta1/images:annotate
URL은 gRPC 트랜스코딩 구문을 사용합니다.
요청 본문
요청 본문에는 다음과 같은 구조의 데이터가 포함됩니다.
JSON 표현 | |
---|---|
{
"requests": [
{
object( |
필드 | |
---|---|
requests[] |
이 배치에 대한 개별 이미지 주석 요청입니다. |
응답 본문
성공한 경우 응답 본문은 다음과 같은 구조의 데이터를 포함합니다.
배치 이미지 주석 요청에 대한 응답입니다.
JSON 표현 | |
---|---|
{
"responses": [
{
object( |
필드 | |
---|---|
responses[] |
배치 내의 이미지 주석 요청에 대한 개별 응답입니다. |
승인 범위
다음 OAuth 범위 중 하나가 필요합니다.
https://www.googleapis.com/auth/cloud-platform
https://www.googleapis.com/auth/cloud-vision
자세한 내용은 인증 개요를 참조하세요.
AnnotateImageRequest
사용자가 제공한 기능으로 사용자가 제공한 이미지에 대한 Google Cloud Vision API 작업을 수행하기 위한 요청입니다.
JSON 표현 | |
---|---|
{ "image": { object( |
필드 | |
---|---|
image |
처리할 이미지입니다. |
features[] |
요청한 기능입니다. |
imageContext |
이미지와 함께 제공될 수 있는 추가 컨텍스트입니다. |
이미지
Google Cloud Vision API 작업을 수행할 클라이언트 이미지입니다.
JSON 표현 | |
---|---|
{
"content": string,
"source": {
object( |
필드 | |
---|---|
content |
바이트 스트림으로 나타낸 이미지 내용입니다. 참고: JSON 표현은 base64를 사용하지만, 프로토콜 버퍼는 모든 base64 인코딩 문자열입니다. |
source |
Google Cloud Storage 이미지 위치 또는 공개적으로 액세스 가능한 이미지 URL입니다. 이미지의 |
ImageSource
외부 이미지 소스입니다(Google Cloud Storage 또는 웹 URL 이미지 위치).
JSON 표현 | |
---|---|
{ "gcsImageUri": string, "imageUri": string } |
필드 | |
---|---|
gcsImageUri |
대신
|
imageUri |
소스 이미지의 URI입니다. 다음 중 하나일 수 있습니다.
|
AnnotateImageResponse
이미지 주석 요청에 대한 응답입니다.
JSON 표현 | |
---|---|
{ "faceAnnotations": [ { object( |
필드 | |
---|---|
faceAnnotations[] |
있는 경우 얼굴 인식이 성공적으로 완료된 것입니다. |
landmarkAnnotations[] |
있는 경우 랜드마크 인식이 성공적으로 완료된 것입니다. |
logoAnnotations[] |
있는 경우 로고 인식이 성공적으로 완료된 것입니다. |
labelAnnotations[] |
있는 경우 라벨 인식이 성공적으로 완료된 것입니다. |
localizedObjectAnnotations[] |
있는 경우 현지화된 객체 인식이 성공적으로 완료된 것입니다. 이는 신뢰도 점수를 기준으로 내림차순으로 정렬됩니다. |
textAnnotations[] |
있는 경우 텍스트(OCR) 인식이 성공적으로 완료된 것입니다. |
fullTextAnnotation |
있는 경우 텍스트(OCR) 인식 또는 문서(OCR) 텍스트 인식이 성공적으로 완료된 것입니다. 이 주석은 OCR에서 감지한 텍스트의 계층 구조를 보여줍니다. |
safeSearchAnnotation |
있는 경우 세이프서치 주석이 성공적으로 완료된 것입니다. |
imagePropertiesAnnotation |
있는 경우 이미지 속성이 성공적으로 추출된 것입니다. |
cropHintsAnnotation |
있는 경우 자르기 힌트가 성공적으로 완료된 것입니다. |
webDetection |
있는 경우 웹 감지가 성공적으로 완료된 것입니다. |
productSearchResults |
있는 경우 제품 검색이 성공적으로 완료된 것입니다. |
error |
설정한 경우 작업의 오류 메시지가 표시됩니다. |
context |
있는 경우 이미지의 출처를 파악하기 위해 컨텍스트 정보가 필요합니다. |
FaceAnnotation
얼굴 주석 객체에는 얼굴 인식 결과가 포함됩니다.
JSON 표현 | |
---|---|
{ "boundingPoly": { object( |
필드 | |
---|---|
boundingPoly |
얼굴 주변 경계의 다각형입니다. 경계 상자의 좌표는 |
fdBoundingPoly |
(얼굴 인식) 프리픽스를 사용합니다. |
landmarks[] |
감지된 얼굴 특징입니다. |
rollAngle |
롤각. 얼굴에 직각인 축에 대해 이미지 수직선을 기준으로 얼굴의 시계 방향/반시계 방향의 정도를 나타냅니다. 범위 [-180,180] |
panAngle |
요각. 이미지와 직각인 수직면을 기준으로 얼굴의 왼쪽/오른쪽 각도를 나타냅니다. 범위 [-180,180] |
tiltAngle |
피치각. 이미지의 수평면을 기준으로 얼굴을 위로 들거나 아래로 숙인 각도를 나타냅니다. 범위 [-180,180] |
detectionConfidence |
감지 신뢰도입니다. 범위 [0, 1] |
landmarkingConfidence |
얼굴 특징 신뢰도입니다. 범위 [0, 1] |
joyLikelihood |
기쁨 가능성입니다. |
sorrowLikelihood |
슬픔 가능성입니다. |
angerLikelihood |
분노 가능성입니다. |
surpriseLikelihood |
놀라움 가능성입니다. |
underExposedLikelihood |
노출 부족 가능성입니다. |
blurredLikelihood |
블러 가능성입니다. |
headwearLikelihood |
모자 가능성입니다. |
랜드마크
얼굴별 특징(예: 얼굴 이목구비)입니다.
JSON 표현 | |
---|---|
{ "type": enum( |
필드 | |
---|---|
type |
얼굴 특징 유형입니다. |
position |
얼굴 특징의 위치입니다. |
유형
얼굴 특징 유형입니다. 왼쪽과 오른쪽은 사진의 전형적인 거울 투영을 고려하지 않고 이미지를 보는 사람의 관점에서 정의됩니다. 따라서 일반적으로 LEFT_EYE
는 사람의 오른쪽 눈입니다.
열거형 | |
---|---|
UNKNOWN_LANDMARK |
알 수 없는 얼굴 특징이 감지되었습니다. 작성되어서는 안 됩니다. |
LEFT_EYE |
왼쪽 눈입니다. |
RIGHT_EYE |
오른쪽 눈입니다. |
LEFT_OF_LEFT_EYEBROW |
왼쪽 눈썹의 왼쪽입니다. |
RIGHT_OF_LEFT_EYEBROW |
왼쪽 눈썹의 오른쪽입니다. |
LEFT_OF_RIGHT_EYEBROW |
오른쪽 눈썹의 왼쪽입니다. |
RIGHT_OF_RIGHT_EYEBROW |
오른쪽 눈썹의 오른쪽입니다. |
MIDPOINT_BETWEEN_EYES |
눈 사이의 중간점입니다. |
NOSE_TIP |
코끝입니다. |
UPPER_LIP |
윗입술입니다. |
LOWER_LIP |
아랫입술입니다. |
MOUTH_LEFT |
입 왼쪽입니다. |
MOUTH_RIGHT |
입 오른쪽입니다. |
MOUTH_CENTER |
입의 중심입니다. |
NOSE_BOTTOM_RIGHT |
코의 오른쪽 맨 아래 부분입니다. |
NOSE_BOTTOM_LEFT |
코의 왼쪽 맨 아래 부분입니다. |
NOSE_BOTTOM_CENTER |
코의 맨 아래 중심입니다. |
LEFT_EYE_TOP_BOUNDARY |
왼쪽 눈의 상단 경계입니다. |
LEFT_EYE_RIGHT_CORNER |
왼쪽 눈의 오른쪽에 있는 눈머리입니다. |
LEFT_EYE_BOTTOM_BOUNDARY |
왼쪽 눈의 하단 경계입니다. |
LEFT_EYE_LEFT_CORNER |
왼쪽 눈의 왼쪽에 있는 눈꼬리입니다. |
RIGHT_EYE_TOP_BOUNDARY |
오른쪽 눈의 상단 경계입니다. |
RIGHT_EYE_RIGHT_CORNER |
오른쪽 눈의 오른쪽에 있는 눈꼬리입니다. |
RIGHT_EYE_BOTTOM_BOUNDARY |
오른쪽 눈의 하단 경계입니다. |
RIGHT_EYE_LEFT_CORNER |
오른쪽 눈의 왼쪽에 있는 눈머리입니다. |
LEFT_EYEBROW_UPPER_MIDPOINT |
왼쪽 눈썹의 상단 중간점입니다. |
RIGHT_EYEBROW_UPPER_MIDPOINT |
오른쪽 눈썹의 상단 중간점입니다. |
LEFT_EAR_TRAGION |
왼쪽 귀의 이주입니다. |
RIGHT_EAR_TRAGION |
오른쪽 귀의 이주입니다. |
LEFT_EYE_PUPIL |
왼쪽 눈동자입니다. |
RIGHT_EYE_PUPIL |
오른쪽 눈동자입니다. |
FOREHEAD_GLABELLA |
이마의 미간 부분입니다. |
CHIN_GNATHION |
아래턱의 끝점입니다. |
CHIN_LEFT_GONION |
턱 왼쪽의 하악각입니다. |
CHIN_RIGHT_GONION |
턱 오른쪽의 하악각입니다. |
위치
이미지의 3D 위치로서 주로 얼굴 인식 특징에 사용됩니다. 유효한 위치에는 X 및 Y 좌표가 둘 다 있어야 합니다. 위치 좌표는 원본 이미지와 축척이 동일합니다.
JSON 표현 | |
---|---|
{ "x": number, "y": number, "z": number } |
필드 | |
---|---|
x |
X 좌표입니다. |
y |
Y 좌표입니다. |
z |
Z 좌표 또는 깊이이며 |
가능성
여러 모델 업그레이드에서 고객에게 매우 안정적인 결과를 제공하기 위해 버킷화된 가능성의 표현입니다.
열거형 | |
---|---|
UNKNOWN |
알 수 없는 가능성입니다. |
VERY_UNLIKELY |
이미지가 지정된 카테고리에 속할 가능성이 매우 낮습니다. |
UNLIKELY |
이미지가 지정된 카테고리에 속할 가능성이 낮습니다. |
POSSIBLE |
이미지가 지정된 카테고리에 속할 가능성이 있습니다. |
LIKELY |
이미지가 지정된 카테고리에 속할 가능성이 높습니다. |
VERY_LIKELY |
이미지가 지정된 카테고리에 속할 가능성이 매우 높습니다. |
EntityAnnotation
감지된 항목 특성 세트입니다.
JSON 표현 | |
---|---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object( |
필드 | |
---|---|
mid |
불투명한 항목 ID입니다. 일부 ID는 Google Knowledge Graph Search API에서 확인할 수 있습니다. |
locale |
항목 텍스트 |
description |
|
score |
결과의 전체 지수입니다. 범위 [0, 1] |
confidence |
지원 중단됩니다. 대신 |
topicality |
이미지에 대한 ICA(이미지 콘텐츠 주석) 라벨의 관련성입니다. 예를 들어 각 이미지에 타워가 있을 확률이 동일하더라도 멀리 있는 고층 빌딩이 감지된 이미지보다는 '에펠탑'이 감지된 이미지와 '타워'의 관련성이 더 높습니다. 범위 [0, 1] |
boundingPoly |
이 항목이 속한 이미지 영역입니다. |
locations[] |
감지된 항목의 위치 정보입니다. 하나의 위치가 이미지에 나온 현장의 위치를 나타내고 다른 위치가 이미지를 찍은 장소의 위치를 나타낼 수 있으므로 여러 |
properties[] |
일부 항목에는 항목을 충족하는 점수 또는 문자열과 같이 사용자가 제공한 선택적 |
LocationInfo
감지된 항목 위치 정보입니다.
JSON 표현 | |
---|---|
{
"latLng": {
object( |
필드 | |
---|---|
latLng |
위도/경도 위치 좌표입니다. |
속성
Property
는 사용자가 제공한 이름/값 쌍으로 구성됩니다.
JSON 표현 | |
---|---|
{ "name": string, "value": string, "uint64Value": string } |
필드 | |
---|---|
name |
속성 이름입니다. |
value |
속성 값입니다. |
uint64Value |
숫자 속성의 값입니다. |
LocalizedObjectAnnotation
경계 상자를 사용해 감지된 객체 집합입니다.
JSON 표현 | |
---|---|
{
"mid": string,
"languageCode": string,
"name": string,
"score": number,
"boundingPoly": {
object( |
필드 | |
---|---|
mid |
EntityAnnotation이 중간에 정렬되어야 하는 객체 ID입니다. |
languageCode |
BCP-47 언어 코드(예: 'en-US' 또는 'sr-Latn') 자세한 내용은 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier를 참조하세요. |
name |
|
score |
결과의 점수입니다. 범위 [0, 1] |
boundingPoly |
이 객체가 속한 이미지 영역입니다. 반드시 채워야 하는 필드입니다. |
TextAnnotation
TextAnnotation에는 OCR 추출된 텍스트의 구조화된 표현이 포함됩니다. OCR 추출된 텍스트 구조의 계층 구조는 다음과 같습니다. TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. Page부터 각 구조의 구성요소는 자체 속성을 추가로 가질 수 있습니다. 속성은 감지된 언어, 줄바꿈 등을 설명합니다. 자세한 내용은 아래의 TextAnnotation.TextProperty
메시지 정의를 참조하세요.
JSON 표현 | |
---|---|
{
"pages": [
{
object( |
필드 | |
---|---|
pages[] |
OCR에서 감지한 페이지 목록입니다. |
text |
페이지에서 감지된 UTF-8 텍스트입니다. |
페이지
OCR에서 감지된 페이지
JSON 표현 | |
---|---|
{ "property": { object( |
필드 | |
---|---|
property |
페이지에서 감지된 추가 정보입니다. |
width |
페이지 너비입니다. PDF의 단위는 점입니다. 이미지(TIFF 포함)의 단위는 픽셀입니다. |
height |
페이지 높이입니다. PDF의 단위는 점입니다. 이미지(TIFF 포함)의 단위는 픽셀입니다. |
blocks[] |
이 페이지에 있는 텍스트, 이미지 등의 블록 목록입니다. |
confidence |
페이지에 대한 OCR 결과의 신뢰도입니다. 범위 [0, 1] |
TextProperty
구조적 구성요소에서 감지되는 추가 정보
JSON 표현 | |
---|---|
{ "detectedLanguages": [ { object( |
필드 | |
---|---|
detectedLanguages[] |
감지된 언어와 신뢰도 목록입니다. |
detectedBreak |
감지된 텍스트 세그먼트의 시작 또는 끝입니다. |
DetectedLanguage
구조적 구성요소의 감지된 언어
JSON 표현 | |
---|---|
{ "languageCode": string, "confidence": number } |
필드 | |
---|---|
languageCode |
BCP-47 언어 코드(예: 'en-US' 또는 'sr-Latn') 자세한 내용은 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier를 참조하세요. |
confidence |
감지된 언어의 신뢰도입니다. 범위 [0, 1] |
DetectedBreak
구조적 구성요소의 감지된 시작 또는 끝입니다.
JSON 표현 | |
---|---|
{
"type": enum( |
필드 | |
---|---|
type |
감지된 줄바꿈 유형입니다. |
isPrefix |
줄바꿈을 통해 요소가 맨 앞에 오는 경우 참입니다. |
BreakType
발견된 줄바꿈 유형을 나타내는 열거형입니다. 새 줄, 공백 등이 여기에 해당합니다.
열거형 | |
---|---|
UNKNOWN |
알 수 없는 줄바꿈 라벨 유형입니다. |
SPACE |
일반 공백입니다. |
SURE_SPACE |
확실한 공백입니다(매우 넓음). |
EOL_SURE_SPACE |
줄바꿈입니다. |
HYPHEN |
텍스트에 없는 끝행 하이픈으로, SPACE , LEADER_SPACE 또는 LINE_BREAK 와 함께 발생하지 않습니다. |
LINE_BREAK |
단락으로 끝나는 줄바꿈입니다. |
차단
페이지의 논리적 요소
JSON 표현 | |
---|---|
{ "property": { object( |
필드 | |
---|---|
property |
블록에 대해 인식된 추가 정보입니다. |
boundingBox |
블록의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예를 들면 다음과 같습니다.
꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다. |
paragraphs[] |
이 블록의 단락 목록입니다(이 블록이 텍스트 유형인 경우). |
blockType |
이 블록에서 인식된 블록 유형(텍스트, 이미지 등)입니다. |
confidence |
블록에 대한 OCR 결과의 신뢰도입니다. 범위 [0, 1] |
Paragraph
특정 순서로 단어 수를 나타내는 텍스트의 구조적 단위
JSON 표현 | |
---|---|
{ "property": { object( |
필드 | |
---|---|
property |
단락에 대해 감지된 추가 정보입니다. |
boundingBox |
단락의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다. |
words[] |
이 단락의 단어 목록입니다. |
confidence |
단락의 OCR 결과 신뢰도입니다. 범위 [0, 1] |
Word
단어 표현입니다.
JSON 표현 | |
---|---|
{ "property": { object( |
필드 | |
---|---|
property |
단어에 대해 감지된 추가 정보입니다. |
boundingBox |
단어의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다. |
symbols[] |
단어 내 기호의 목록입니다. 기호의 순서는 자연스럽게 읽는 순서를 따릅니다. |
confidence |
단어의 OCR 결과 신뢰도입니다. 범위 [0, 1] |
기호
단일 기호 표현
JSON 표현 | |
---|---|
{ "property": { object( |
필드 | |
---|---|
property |
기호에 대해 감지된 추가 정보입니다. |
boundingBox |
기호의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다. |
text |
기호의 실제 UTF-8 표현입니다. |
confidence |
기호의 OCR 결과 신뢰도입니다. 범위 [0, 1] |
BlockType
OCR에서 식별한 블록 유형(텍스트, 이미지 등)입니다.
열거형 | |
---|---|
UNKNOWN |
알 수 없는 블록 유형입니다. |
TEXT |
일반 텍스트 블록입니다. |
TABLE |
테이블 블록입니다. |
PICTURE |
이미지 블록입니다. |
RULER |
가로/세로선 상자입니다. |
BARCODE |
바코드 블록입니다. |
SafeSearchAnnotation
이미지와 관련된 특징 모음으로서, 세이프서치 카테고리(예: 성인용, 패러디, 의료, 폭력)에 대해 컴퓨터 비전 방식으로 연산됩니다.
JSON 표현 | |
---|---|
{ "adult": enum( |
필드 | |
---|---|
adult |
이미지가 성인 콘텐츠일 가능성을 나타냅니다. 성인 콘텐츠에는 과도한 노출, 포르노 이미지나 만화, 성행위 묘사 등의 요소가 포함될 수 있습니다. |
spoof |
위장 이미지일 가능성을 나타냅니다. 재미있거나 불쾌감을 주도록 이미지의 정식 버전을 수정했을 가능성입니다. |
medical |
의료 관련 이미지일 가능성을 나타냅니다. |
violence |
이미지에 폭력적인 콘텐츠가 있을 가능성을 나타냅니다. |
racy |
요청 이미지에 선정적인 콘텐츠가 있을 가능성을 나타냅니다. 선정적인 콘텐츠는 노출이 심하거나 속이 미치는 의상, 교묘하게 일부분을 가린 과도한 노출, 음란하거나 도발적인 자세 또는 민감한 신체 부위의 근접 촬영을 포함하되 이에 국한되지 않습니다. |
ImageProperties
주요 색상과 같은 이미지 속성을 저장합니다.
JSON 표현 | |
---|---|
{
"dominantColors": {
object( |
필드 | |
---|---|
dominantColors |
있는 경우 주요 색상이 성공적으로 완료된 것입니다. |
DominantColorsAnnotation
주된 색상 및 해당 색상 지수의 모음입니다.
JSON 표현 | |
---|---|
{
"colors": [
{
object( |
필드 | |
---|---|
colors[] |
지수 및 픽셀 비율이 있는 RGB 색상 값입니다. |
ColorInfo
RGB 채널, 점수, 이미지에서 색상이 차지하는 비율로 구성된 색상 정보입니다.
JSON 표현 | |
---|---|
{
"color": {
object( |
필드 | |
---|---|
color |
색상의 RGB 구성요소입니다. |
score |
이 색상에 대한 이미지별 지수입니다. [0, 1] 범위의 값입니다. |
pixelFraction |
이미지에서 색상이 차지하는 픽셀 비율입니다. [0, 1] 범위의 값입니다. |
CropHintsAnnotation
이미지를 제공할 때 새 자르기를 생성하는 데 사용되는 자르기 힌트 세트입니다.
JSON 표현 | |
---|---|
{
"cropHints": [
{
object( |
필드 | |
---|---|
cropHints[] |
자르기 힌트 결과입니다. |
CropHint
이미지를 제공할 때 새 자르기를 생성하는 데 사용되는 단일 자르기 힌트입니다.
JSON 표현 | |
---|---|
{
"boundingPoly": {
object( |
필드 | |
---|---|
boundingPoly |
잘라낼 영역의 경계 다각형입니다. 경계 상자의 좌표는 |
confidence |
이 두드러진 영역의 신뢰도입니다. 범위 [0, 1] |
importanceFraction |
이 두드러진 영역의 원본 이미지와 관련한 중요도 비율입니다. |
WebDetection
인터넷에서 가져온 이미지에 대한 관련 정보입니다.
JSON 표현 | |
---|---|
{ "webEntities": [ { object( |
필드 | |
---|---|
webEntities[] |
인터넷상의 유사한 이미지에서 추론된 항목입니다. |
fullMatchingImages[] |
인터넷에서 완전히 일치하는 이미지입니다. 크기가 조절된 쿼리 이미지의 사본을 포함할 수 있습니다. |
partialMatchingImages[] |
인터넷에서 부분적으로 일치하는 이미지입니다. 이러한 이미지는 몇 가지 핵심 특징을 공유할 만큼 충분히 유사합니다. 예를 들어, 원본 이미지와 잘라낸 이미지가 부분적으로 일치할 수 있습니다. |
pagesWithMatchingImages[] |
인터넷에서 일치하는 이미지가 포함된 웹페이지입니다. |
visuallySimilarImages[] |
시각적으로 유사한 이미지 결과입니다. |
bestGuessLabels[] |
요청 이미지의 주제와 가장 가까운 이미지입니다. 개방형 웹의 유사한 이미지에서 추론된 것입니다. |
WebEntity
인터넷의 비슷한 이미지에서 추론한 항목입니다.
JSON 표현 | |
---|---|
{ "entityId": string, "score": number, "description": string } |
필드 | |
---|---|
entityId |
불투명한 항목 ID입니다. |
score |
항목의 전체 관련성 점수입니다. 정규화되지 않으므로 서로 다른 이미지 쿼리 간에 비교할 수는 없습니다. |
description |
항목의 정식 설명입니다(영어). |
WebImage
온라인 이미지에 대한 메타데이터입니다.
JSON 표현 | |
---|---|
{ "url": string, "score": number } |
필드 | |
---|---|
url |
결과 이미지 URL입니다. |
score |
(지원 중단됨) 이미지의 전체 관련성 점수입니다. |
WebPage
웹페이지의 메타데이터입니다.
JSON 표현 | |
---|---|
{ "url": string, "score": number, "pageTitle": string, "fullMatchingImages": [ { object( |
필드 | |
---|---|
url |
결과 웹페이지 URL입니다. |
score |
(지원 중단됨) 웹페이지의 전반적인 관련성 점수입니다. |
pageTitle |
웹페이지의 제목으로서 HTML 마크업이 포함될 수 있습니다. |
fullMatchingImages[] |
페이지에서 완전히 일치하는 이미지입니다. 크기가 조절된 쿼리 이미지의 사본을 포함할 수 있습니다. |
partialMatchingImages[] |
페이지에서 부분적으로 일치하는 이미지입니다. 이러한 이미지는 몇 가지 핵심 특징을 공유할 만큼 충분히 유사합니다. 예를 들어, 원본 이미지와 잘라낸 이미지가 부분적으로 일치할 수 있습니다. |
WebLabel
웹 감지를 위한 추가 메타데이터를 제공하는 라벨입니다.
JSON 표현 | |
---|---|
{ "label": string, "languageCode": string } |
필드 | |
---|---|
label |
추가 메타데이터 라벨입니다. |
languageCode |
|
ProductSearchResults
제품 검색 요청에 대한 결과입니다.
JSON 표현 | |
---|---|
{ "indexTime": string, "results": [ { object( |
필드 | |
---|---|
indexTime |
이 결과를 제공한 색인의 타임스탬프입니다. 이 시점 이후의 변경사항은 현재 결과에 반영되지 않습니다. RFC3339 UTC 'Zulu' 형식의 타임스탬프로 정밀도는 나노초 수준입니다. 예: |
results[] |
결과 목록입니다(각 제품 일치당 하나). |
productGroupedResults[] |
쿼리 이미지에서 감지된 제품별로 그룹화된 결과 목록입니다. 각 항목은 쿼리 이미지의 하나의 경계 다각형에 해당하며 해당 리전과 일치하는 제품을 포함합니다. 모든 제품별 결과의 합집합에 중복된 제품 일치가 있을 수 있습니다. |
결과
제품에 대한 정보입니다.
JSON 표현 | |
---|---|
{
"product": {
object( |
필드 | |
---|---|
product |
제품입니다. |
score |
일치 신뢰도로, 0(신뢰도 없음)에서 1(완전 신뢰) 사이로 나타냅니다. |
image |
제품에서 쿼리와 가장 일치하는 이미지의 리소스 이름입니다. |
GroupedResult
쿼리 이미지의 단일 제품과 유사한 제품에 대한 정보입니다.
JSON 표현 | |
---|---|
{ "boundingPoly": { object( |
필드 | |
---|---|
boundingPoly |
쿼리 이미지에서 감지된 제품을 감싸는 경계 다각형입니다. |
results[] |
결과 목록입니다(각 제품 일치당 하나). |
ImageAnnotationContext
이미지가 파일(예: PDF)에서 생성된 경우 이 메시지는 이미지의 소스에 대한 정보를 제공합니다.
JSON 표현 | |
---|---|
{ "uri": string, "pageNumber": number } |
필드 | |
---|---|
uri |
이미지를 생성하는 데 사용된 파일의 URI입니다. |
pageNumber |
파일이 PDF 또는 TIFF이면 이 필드는 이미지 생성에 사용된 파일 내의 페이지 번호를 제공합니다. |