Method: images.annotate

이미지 배치에 대한 이미지 감지 및 주석을 실행합니다.

HTTP 요청

POST https://vision.googleapis.com/v1p3beta1/images:annotate

URL은 gRPC 트랜스코딩 구문을 사용합니다.

요청 본문

요청 본문에는 다음과 같은 구조의 데이터가 포함됩니다.

JSON 표현
{
  "requests": [
    {
      object(AnnotateImageRequest)
    }
  ]
}
필드
requests[]

object(AnnotateImageRequest)

이 배치에 대한 개별 이미지 주석 요청입니다.

응답 본문

성공한 경우 응답 본문은 다음과 같은 구조의 데이터를 포함합니다.

배치 이미지 주석 요청에 대한 응답입니다.

JSON 표현
{
  "responses": [
    {
      object(AnnotateImageResponse)
    }
  ]
}
필드
responses[]

object(AnnotateImageResponse)

배치 내의 이미지 주석 요청에 대한 개별 응답입니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/cloud-vision

자세한 내용은 인증 개요를 참조하세요.

AnnotateImageRequest

사용자가 제공한 기능으로 사용자가 제공한 이미지에 대한 Google Cloud Vision API 작업을 수행하기 위한 요청입니다.

JSON 표현
{
  "image": {
    object(Image)
  },
  "features": [
    {
      object(Feature)
    }
  ],
  "imageContext": {
    object(ImageContext)
  }
}
필드
image

object(Image)

처리할 이미지입니다.

features[]

object(Feature)

요청한 기능입니다.

imageContext

object(ImageContext)

이미지와 함께 제공될 수 있는 추가 컨텍스트입니다.

이미지

Google Cloud Vision API 작업을 수행할 클라이언트 이미지입니다.

JSON 표현
{
  "content": string,
  "source": {
    object(ImageSource)
  }
}
필드
content

string (bytes format)

바이트 스트림으로 나타낸 이미지 내용입니다. 참고: JSON 표현은 base64를 사용하지만, 프로토콜 버퍼는 모든 bytes 필드와 마찬가지로 순수 바이너리 표현을 사용합니다.

base64 인코딩 문자열입니다.

source

object(ImageSource)

Google Cloud Storage 이미지 위치 또는 공개적으로 액세스 가능한 이미지 URL입니다. 이미지의 contentsource가 모두 제공되면 content가 우선 적용되며 이미지 주석 요청을 수행하는 데 사용됩니다.

ImageSource

외부 이미지 소스입니다(Google Cloud Storage 또는 웹 URL 이미지 위치).

JSON 표현
{
  "gcsImageUri": string,
  "imageUri": string
}
필드
gcsImageUri

string

대신 imageUri를 사용하세요.

gs://bucket_name/object_name 형식의 Google Cloud Storage URI입니다. 객체 버전 관리는 지원되지 않습니다. 자세한 내용은 Google Cloud Storage 요청 URI를 참조하세요.

imageUri

string

소스 이미지의 URI입니다. 다음 중 하나일 수 있습니다.

  1. gs://bucket_name/object_name 형식의 Google Cloud Storage URI입니다. 객체 버전 관리는 지원되지 않습니다. 자세한 내용은 Google Cloud Storage 요청 URI를 참조하세요.

  2. 공개적으로 액세스 가능한 이미지 HTTP/HTTPS URL: HTTP/HTTPS URL에서 이미지를 가져올 때 Google은 요청 완료를 보장할 수 없습니다. 지정된 호스트가 요청을 거부하거나(예: 요청 제한 또는 DOS 예방으로 인해) Google이 악용 방지를 위해 해당 사이트에 대한 요청을 제한하는 경우 요청이 실패할 수 있습니다. 프로덕션 애플리케이션의 외부 호스팅 이미지에 의존하면 안 됩니다.

gcsImageUriimageUri가 모두 지정된 경우 imageUri가 우선 적용됩니다.

AnnotateImageResponse

이미지 주석 요청에 대한 응답입니다.

JSON 표현
{
  "faceAnnotations": [
    {
      object(FaceAnnotation)
    }
  ],
  "landmarkAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "logoAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "labelAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "localizedObjectAnnotations": [
    {
      object(LocalizedObjectAnnotation)
    }
  ],
  "textAnnotations": [
    {
      object(EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object(TextAnnotation)
  },
  "safeSearchAnnotation": {
    object(SafeSearchAnnotation)
  },
  "imagePropertiesAnnotation": {
    object(ImageProperties)
  },
  "cropHintsAnnotation": {
    object(CropHintsAnnotation)
  },
  "webDetection": {
    object(WebDetection)
  },
  "productSearchResults": {
    object(ProductSearchResults)
  },
  "error": {
    object(Status)
  },
  "context": {
    object(ImageAnnotationContext)
  }
}
필드
faceAnnotations[]

object(FaceAnnotation)

있는 경우 얼굴 인식이 성공적으로 완료된 것입니다.

landmarkAnnotations[]

object(EntityAnnotation)

있는 경우 랜드마크 인식이 성공적으로 완료된 것입니다.

logoAnnotations[]

object(EntityAnnotation)

있는 경우 로고 인식이 성공적으로 완료된 것입니다.

labelAnnotations[]

object(EntityAnnotation)

있는 경우 라벨 인식이 성공적으로 완료된 것입니다.

localizedObjectAnnotations[]

object(LocalizedObjectAnnotation)

있는 경우 현지화된 객체 인식이 성공적으로 완료된 것입니다. 이는 신뢰도 점수를 기준으로 내림차순으로 정렬됩니다.

textAnnotations[]

object(EntityAnnotation)

있는 경우 텍스트(OCR) 인식이 성공적으로 완료된 것입니다.

fullTextAnnotation

object(TextAnnotation)

있는 경우 텍스트(OCR) 인식 또는 문서(OCR) 텍스트 인식이 성공적으로 완료된 것입니다. 이 주석은 OCR에서 감지한 텍스트의 계층 구조를 보여줍니다.

safeSearchAnnotation

object(SafeSearchAnnotation)

있는 경우 세이프서치 주석이 성공적으로 완료된 것입니다.

imagePropertiesAnnotation

object(ImageProperties)

있는 경우 이미지 속성이 성공적으로 추출된 것입니다.

cropHintsAnnotation

object(CropHintsAnnotation)

있는 경우 자르기 힌트가 성공적으로 완료된 것입니다.

webDetection

object(WebDetection)

있는 경우 웹 감지가 성공적으로 완료된 것입니다.

productSearchResults

object(ProductSearchResults)

있는 경우 제품 검색이 성공적으로 완료된 것입니다.

error

object(Status)

설정한 경우 작업의 오류 메시지가 표시됩니다. error가 설정되어 있더라도 작성된 이미지 주석의 정확성이 보장됩니다.

context

object(ImageAnnotationContext)

있는 경우 이미지의 출처를 파악하기 위해 컨텍스트 정보가 필요합니다.

FaceAnnotation

얼굴 주석 객체에는 얼굴 인식 결과가 포함됩니다.

JSON 표현
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "fdBoundingPoly": {
    object(BoundingPoly)
  },
  "landmarks": [
    {
      object(Landmark)
    }
  ],
  "rollAngle": number,
  "panAngle": number,
  "tiltAngle": number,
  "detectionConfidence": number,
  "landmarkingConfidence": number,
  "joyLikelihood": enum(Likelihood),
  "sorrowLikelihood": enum(Likelihood),
  "angerLikelihood": enum(Likelihood),
  "surpriseLikelihood": enum(Likelihood),
  "underExposedLikelihood": enum(Likelihood),
  "blurredLikelihood": enum(Likelihood),
  "headwearLikelihood": enum(Likelihood)
}
필드
boundingPoly

object(BoundingPoly)

얼굴 주변 경계의 다각형입니다. 경계 상자의 좌표는 ImageParams에서 반환된 것처럼 원본 이미지의 축척입니다. 경계 상자는 인간의 기대치에 부합되게 얼굴을 '프레임' 안에 넣도록 연산되며, 랜드마커 결과를 기반으로 합니다. 주석을 달 이미지에 얼굴이 부분적으로 표시되는 경우에 한해 하나 이상의 X 또는 Y 좌표가 BoundingPoly에 생성되지 않을 수 있으며, 이 경우 다각형이 결합되지 않습니다.

fdBoundingPoly

object(BoundingPoly)

fdBoundingPoly 경계 다각형은 boundingPoly보다 얼굴에 더 밀착되며 얼굴의 피부 부분만 둘러싸서 결합한 다각형입니다. 대개 이미지에 표시되는 '피부의 양'을 감지하는 이미지 분석에서 얼굴을 제거하는 데 사용됩니다. 랜드마커 결과를 기반으로 하지 않으며, 초기 얼굴 인식만 기준으로 하므로

fd

(얼굴 인식) 프리픽스를 사용합니다.

landmarks[]

object(Landmark)

감지된 얼굴 특징입니다.

rollAngle

number

롤각. 얼굴에 직각인 축에 대해 이미지 수직선을 기준으로 얼굴의 시계 방향/반시계 방향의 정도를 나타냅니다. 범위 [-180,180]

panAngle

number

요각. 이미지와 직각인 수직면을 기준으로 얼굴의 왼쪽/오른쪽 각도를 나타냅니다. 범위 [-180,180]

tiltAngle

number

피치각. 이미지의 수평면을 기준으로 얼굴을 위로 들거나 아래로 숙인 각도를 나타냅니다. 범위 [-180,180]

detectionConfidence

number

감지 신뢰도입니다. 범위 [0, 1]

landmarkingConfidence

number

얼굴 특징 신뢰도입니다. 범위 [0, 1]

joyLikelihood

enum(Likelihood)

기쁨 가능성입니다.

sorrowLikelihood

enum(Likelihood)

슬픔 가능성입니다.

angerLikelihood

enum(Likelihood)

분노 가능성입니다.

surpriseLikelihood

enum(Likelihood)

놀라움 가능성입니다.

underExposedLikelihood

enum(Likelihood)

노출 부족 가능성입니다.

blurredLikelihood

enum(Likelihood)

블러 가능성입니다.

headwearLikelihood

enum(Likelihood)

모자 가능성입니다.

랜드마크

얼굴별 특징(예: 얼굴 이목구비)입니다.

JSON 표현
{
  "type": enum(Type),
  "position": {
    object(Position)
  }
}
필드
type

enum(Type)

얼굴 특징 유형입니다.

position

object(Position)

얼굴 특징의 위치입니다.

유형

얼굴 특징 유형입니다. 왼쪽과 오른쪽은 사진의 전형적인 거울 투영을 고려하지 않고 이미지를 보는 사람의 관점에서 정의됩니다. 따라서 일반적으로 LEFT_EYE는 사람의 오른쪽 눈입니다.

열거형
UNKNOWN_LANDMARK 알 수 없는 얼굴 특징이 감지되었습니다. 작성되어서는 안 됩니다.
LEFT_EYE 왼쪽 눈입니다.
RIGHT_EYE 오른쪽 눈입니다.
LEFT_OF_LEFT_EYEBROW 왼쪽 눈썹의 왼쪽입니다.
RIGHT_OF_LEFT_EYEBROW 왼쪽 눈썹의 오른쪽입니다.
LEFT_OF_RIGHT_EYEBROW 오른쪽 눈썹의 왼쪽입니다.
RIGHT_OF_RIGHT_EYEBROW 오른쪽 눈썹의 오른쪽입니다.
MIDPOINT_BETWEEN_EYES 눈 사이의 중간점입니다.
NOSE_TIP 코끝입니다.
UPPER_LIP 윗입술입니다.
LOWER_LIP 아랫입술입니다.
MOUTH_LEFT 입 왼쪽입니다.
MOUTH_RIGHT 입 오른쪽입니다.
MOUTH_CENTER 입의 중심입니다.
NOSE_BOTTOM_RIGHT 코의 오른쪽 맨 아래 부분입니다.
NOSE_BOTTOM_LEFT 코의 왼쪽 맨 아래 부분입니다.
NOSE_BOTTOM_CENTER 코의 맨 아래 중심입니다.
LEFT_EYE_TOP_BOUNDARY 왼쪽 눈의 상단 경계입니다.
LEFT_EYE_RIGHT_CORNER 왼쪽 눈의 오른쪽에 있는 눈머리입니다.
LEFT_EYE_BOTTOM_BOUNDARY 왼쪽 눈의 하단 경계입니다.
LEFT_EYE_LEFT_CORNER 왼쪽 눈의 왼쪽에 있는 눈꼬리입니다.
RIGHT_EYE_TOP_BOUNDARY 오른쪽 눈의 상단 경계입니다.
RIGHT_EYE_RIGHT_CORNER 오른쪽 눈의 오른쪽에 있는 눈꼬리입니다.
RIGHT_EYE_BOTTOM_BOUNDARY 오른쪽 눈의 하단 경계입니다.
RIGHT_EYE_LEFT_CORNER 오른쪽 눈의 왼쪽에 있는 눈머리입니다.
LEFT_EYEBROW_UPPER_MIDPOINT 왼쪽 눈썹의 상단 중간점입니다.
RIGHT_EYEBROW_UPPER_MIDPOINT 오른쪽 눈썹의 상단 중간점입니다.
LEFT_EAR_TRAGION 왼쪽 귀의 이주입니다.
RIGHT_EAR_TRAGION 오른쪽 귀의 이주입니다.
LEFT_EYE_PUPIL 왼쪽 눈동자입니다.
RIGHT_EYE_PUPIL 오른쪽 눈동자입니다.
FOREHEAD_GLABELLA 이마의 미간 부분입니다.
CHIN_GNATHION 아래턱의 끝점입니다.
CHIN_LEFT_GONION 턱 왼쪽의 하악각입니다.
CHIN_RIGHT_GONION 턱 오른쪽의 하악각입니다.

위치

이미지의 3D 위치로서 주로 얼굴 인식 특징에 사용됩니다. 유효한 위치에는 X 및 Y 좌표가 둘 다 있어야 합니다. 위치 좌표는 원본 이미지와 축척이 동일합니다.

JSON 표현
{
  "x": number,
  "y": number,
  "z": number
}
필드
x

number

X 좌표입니다.

y

number

Y 좌표입니다.

z

number

Z 좌표 또는 깊이이며

가능성

여러 모델 업그레이드에서 고객에게 매우 안정적인 결과를 제공하기 위해 버킷화된 가능성의 표현입니다.

열거형
UNKNOWN 알 수 없는 가능성입니다.
VERY_UNLIKELY 이미지가 지정된 카테고리에 속할 가능성이 매우 낮습니다.
UNLIKELY 이미지가 지정된 카테고리에 속할 가능성이 낮습니다.
POSSIBLE 이미지가 지정된 카테고리에 속할 가능성이 있습니다.
LIKELY 이미지가 지정된 카테고리에 속할 가능성이 높습니다.
VERY_LIKELY 이미지가 지정된 카테고리에 속할 가능성이 매우 높습니다.

EntityAnnotation

감지된 항목 특성 세트입니다.

JSON 표현
{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object(BoundingPoly)
  },
  "locations": [
    {
      object(LocationInfo)
    }
  ],
  "properties": [
    {
      object(Property)
    }
  ]
}
필드
mid

string

불투명한 항목 ID입니다. 일부 ID는 Google Knowledge Graph Search API에서 확인할 수 있습니다.

locale

string

항목 텍스트 description을 표현하는 데 사용된 언어 코드입니다.

description

string

locale 언어로 표현된 항목 텍스트 설명입니다.

score

number

결과의 전체 지수입니다. 범위 [0, 1]

confidence
(deprecated)

number

지원 중단됩니다. 대신 score를 사용하세요. 이미지에서 항목 인식의 정확도입니다. 예를 들어 '에펠탑' 항목이 인식된 이미지의 경우 이 필드는 쿼리 이미지에 타워가 있을 확률을 나타냅니다. 범위 [0, 1]

topicality

number

이미지에 대한 ICA(이미지 콘텐츠 주석) 라벨의 관련성입니다. 예를 들어 각 이미지에 타워가 있을 확률이 동일하더라도 멀리 있는 고층 빌딩이 감지된 이미지보다는 '에펠탑'이 감지된 이미지와 '타워'의 관련성이 더 높습니다. 범위 [0, 1]

boundingPoly

object(BoundingPoly)

이 항목이 속한 이미지 영역입니다. LABEL_DETECTION 특성에 대해서는 생성되지 않았습니다.

locations[]

object(LocationInfo)

감지된 항목의 위치 정보입니다. 하나의 위치가 이미지에 나온 현장의 위치를 나타내고 다른 위치가 이미지를 찍은 장소의 위치를 나타낼 수 있으므로 여러 LocationInfo 요소가 표시될 수 있습니다. 일반적으로 랜드마크의 경우 위치 정보가 표시됩니다.

properties[]

object(Property)

일부 항목에는 항목을 충족하는 점수 또는 문자열과 같이 사용자가 제공한 선택적 Property(이름/값) 필드가 포함될 수 있습니다.

LocationInfo

감지된 항목 위치 정보입니다.

JSON 표현
{
  "latLng": {
    object(LatLng)
  }
}
필드
latLng

object(LatLng)

위도/경도 위치 좌표입니다.

속성

Property는 사용자가 제공한 이름/값 쌍으로 구성됩니다.

JSON 표현
{
  "name": string,
  "value": string,
  "uint64Value": string
}
필드
name

string

속성 이름입니다.

value

string

속성 값입니다.

uint64Value

string

숫자 속성의 값입니다.

LocalizedObjectAnnotation

경계 상자를 사용해 감지된 객체 집합입니다.

JSON 표현
{
  "mid": string,
  "languageCode": string,
  "name": string,
  "score": number,
  "boundingPoly": {
    object(BoundingPoly)
  }
}
필드
mid

string

EntityAnnotation이 중간에 정렬되어야 하는 객체 ID입니다.

languageCode

string

BCP-47 언어 코드(예: 'en-US' 또는 'sr-Latn') 자세한 내용은 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier를 참조하세요.

name

string

languageCode 언어로 표현된 객체 이름입니다.

score

number

결과의 점수입니다. 범위 [0, 1]

boundingPoly

object(BoundingPoly)

이 객체가 속한 이미지 영역입니다. 반드시 채워야 하는 필드입니다.

TextAnnotation

TextAnnotation에는 OCR 추출된 텍스트의 구조화된 표현이 포함됩니다. OCR 추출된 텍스트 구조의 계층 구조는 다음과 같습니다. TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. Page부터 각 구조의 구성요소는 자체 속성을 추가로 가질 수 있습니다. 속성은 감지된 언어, 줄바꿈 등을 설명합니다. 자세한 내용은 아래의 TextAnnotation.TextProperty 메시지 정의를 참조하세요.

JSON 표현
{
  "pages": [
    {
      object(Page)
    }
  ],
  "text": string
}
필드
pages[]

object(Page)

OCR에서 감지한 페이지 목록입니다.

text

string

페이지에서 감지된 UTF-8 텍스트입니다.

페이지

OCR에서 감지된 페이지

JSON 표현
{
  "property": {
    object(TextProperty)
  },
  "width": number,
  "height": number,
  "blocks": [
    {
      object(Block)
    }
  ],
  "confidence": number
}
필드
property

object(TextProperty)

페이지에서 감지된 추가 정보입니다.

width

number

페이지 너비입니다. PDF의 단위는 점입니다. 이미지(TIFF 포함)의 단위는 픽셀입니다.

height

number

페이지 높이입니다. PDF의 단위는 점입니다. 이미지(TIFF 포함)의 단위는 픽셀입니다.

blocks[]

object(Block)

이 페이지에 있는 텍스트, 이미지 등의 블록 목록입니다.

confidence

number

페이지에 대한 OCR 결과의 신뢰도입니다. 범위 [0, 1]

TextProperty

구조적 구성요소에서 감지되는 추가 정보

JSON 표현
{
  "detectedLanguages": [
    {
      object(DetectedLanguage)
    }
  ],
  "detectedBreak": {
    object(DetectedBreak)
  }
}
필드
detectedLanguages[]

object(DetectedLanguage)

감지된 언어와 신뢰도 목록입니다.

detectedBreak

object(DetectedBreak)

감지된 텍스트 세그먼트의 시작 또는 끝입니다.

DetectedLanguage

구조적 구성요소의 감지된 언어

JSON 표현
{
  "languageCode": string,
  "confidence": number
}
필드
languageCode

string

BCP-47 언어 코드(예: 'en-US' 또는 'sr-Latn') 자세한 내용은 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier를 참조하세요.

confidence

number

감지된 언어의 신뢰도입니다. 범위 [0, 1]

DetectedBreak

구조적 구성요소의 감지된 시작 또는 끝입니다.

JSON 표현
{
  "type": enum(BreakType),
  "isPrefix": boolean
}
필드
type

enum(BreakType)

감지된 줄바꿈 유형입니다.

isPrefix

boolean

줄바꿈을 통해 요소가 맨 앞에 오는 경우 참입니다.

BreakType

발견된 줄바꿈 유형을 나타내는 열거형입니다. 새 줄, 공백 등이 여기에 해당합니다.

열거형
UNKNOWN 알 수 없는 줄바꿈 라벨 유형입니다.
SPACE 일반 공백입니다.
SURE_SPACE 확실한 공백입니다(매우 넓음).
EOL_SURE_SPACE 줄바꿈입니다.
HYPHEN 텍스트에 없는 끝행 하이픈으로, SPACE, LEADER_SPACE 또는 LINE_BREAK와 함께 발생하지 않습니다.
LINE_BREAK 단락으로 끝나는 줄바꿈입니다.

차단

페이지의 논리적 요소

JSON 표현
{
  "property": {
    object(TextProperty)
  },
  "boundingBox": {
    object(BoundingPoly)
  },
  "paragraphs": [
    {
      object(Paragraph)
    }
  ],
  "blockType": enum(BlockType),
  "confidence": number
}
필드
property

object(TextProperty)

블록에 대해 인식된 추가 정보입니다.

boundingBox

object(BoundingPoly)

블록의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예를 들면 다음과 같습니다.

  • 가로 텍스트는 다음과 같이 표시됩니다.
    0----1
    |    |
    3----2
  • 왼쪽 위 모서리를 기준으로 180도 회전하면 다음과 같이 됩니다.
    2----3
    |    |
    1----0

꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다.

paragraphs[]

object(Paragraph)

이 블록의 단락 목록입니다(이 블록이 텍스트 유형인 경우).

blockType

enum(BlockType)

이 블록에서 인식된 블록 유형(텍스트, 이미지 등)입니다.

confidence

number

블록에 대한 OCR 결과의 신뢰도입니다. 범위 [0, 1]

Paragraph

특정 순서로 단어 수를 나타내는 텍스트의 구조적 단위

JSON 표현
{
  "property": {
    object(TextProperty)
  },
  "boundingBox": {
    object(BoundingPoly)
  },
  "words": [
    {
      object(Word)
    }
  ],
  "confidence": number
}
필드
property

object(TextProperty)

단락에 대해 감지된 추가 정보입니다.

boundingBox

object(BoundingPoly)

단락의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다.

words[]

object(Word)

이 단락의 단어 목록입니다.

confidence

number

단락의 OCR 결과 신뢰도입니다. 범위 [0, 1]

Word

단어 표현입니다.

JSON 표현
{
  "property": {
    object(TextProperty)
  },
  "boundingBox": {
    object(BoundingPoly)
  },
  "symbols": [
    {
      object(Symbol)
    }
  ],
  "confidence": number
}
필드
property

object(TextProperty)

단어에 대해 감지된 추가 정보입니다.

boundingBox

object(BoundingPoly)

단어의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다.

symbols[]

object(Symbol)

단어 내 기호의 목록입니다. 기호의 순서는 자연스럽게 읽는 순서를 따릅니다.

confidence

number

단어의 OCR 결과 신뢰도입니다. 범위 [0, 1]

기호

단일 기호 표현

JSON 표현
{
  "property": {
    object(TextProperty)
  },
  "boundingBox": {
    object(BoundingPoly)
  },
  "text": string,
  "confidence": number
}
필드
property

object(TextProperty)

기호에 대해 감지된 추가 정보입니다.

boundingBox

object(BoundingPoly)

기호의 경계 상자입니다. 꼭짓점은 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서입니다. 경계 상자의 회전이 감지되면 텍스트를 '자연스러운' 방향으로 읽을 때 정의된 대로 왼쪽 위 모서리를 기준으로 회전하여 표시됩니다. 예: * 텍스트가 가로인 경우 다음과 같이 표시됩니다. 0----1 | | 3----2 * 왼쪽 위 모서리를 기준으로 180도 회전하면 2----3 | | 1----0이 되고 꼭짓점 순서는 여전히 (0, 1, 2, 3)입니다.

text

string

기호의 실제 UTF-8 표현입니다.

confidence

number

기호의 OCR 결과 신뢰도입니다. 범위 [0, 1]

BlockType

OCR에서 식별한 블록 유형(텍스트, 이미지 등)입니다.

열거형
UNKNOWN 알 수 없는 블록 유형입니다.
TEXT 일반 텍스트 블록입니다.
TABLE 테이블 블록입니다.
PICTURE 이미지 블록입니다.
RULER 가로/세로선 상자입니다.
BARCODE 바코드 블록입니다.

SafeSearchAnnotation

이미지와 관련된 특징 모음으로서, 세이프서치 카테고리(예: 성인용, 패러디, 의료, 폭력)에 대해 컴퓨터 비전 방식으로 연산됩니다.

JSON 표현
{
  "adult": enum(Likelihood),
  "spoof": enum(Likelihood),
  "medical": enum(Likelihood),
  "violence": enum(Likelihood),
  "racy": enum(Likelihood)
}
필드
adult

enum(Likelihood)

이미지가 성인 콘텐츠일 가능성을 나타냅니다. 성인 콘텐츠에는 과도한 노출, 포르노 이미지나 만화, 성행위 묘사 등의 요소가 포함될 수 있습니다.

spoof

enum(Likelihood)

위장 이미지일 가능성을 나타냅니다. 재미있거나 불쾌감을 주도록 이미지의 정식 버전을 수정했을 가능성입니다.

medical

enum(Likelihood)

의료 관련 이미지일 가능성을 나타냅니다.

violence

enum(Likelihood)

이미지에 폭력적인 콘텐츠가 있을 가능성을 나타냅니다.

racy

enum(Likelihood)

요청 이미지에 선정적인 콘텐츠가 있을 가능성을 나타냅니다. 선정적인 콘텐츠는 노출이 심하거나 속이 미치는 의상, 교묘하게 일부분을 가린 과도한 노출, 음란하거나 도발적인 자세 또는 민감한 신체 부위의 근접 촬영을 포함하되 이에 국한되지 않습니다.

ImageProperties

주요 색상과 같은 이미지 속성을 저장합니다.

JSON 표현
{
  "dominantColors": {
    object(DominantColorsAnnotation)
  }
}
필드
dominantColors

object(DominantColorsAnnotation)

있는 경우 주요 색상이 성공적으로 완료된 것입니다.

DominantColorsAnnotation

주된 색상 및 해당 색상 지수의 모음입니다.

JSON 표현
{
  "colors": [
    {
      object(ColorInfo)
    }
  ]
}
필드
colors[]

object(ColorInfo)

지수 및 픽셀 비율이 있는 RGB 색상 값입니다.

ColorInfo

RGB 채널, 점수, 이미지에서 색상이 차지하는 비율로 구성된 색상 정보입니다.

JSON 표현
{
  "color": {
    object(Color)
  },
  "score": number,
  "pixelFraction": number
}
필드
color

object(Color)

색상의 RGB 구성요소입니다.

score

number

이 색상에 대한 이미지별 지수입니다. [0, 1] 범위의 값입니다.

pixelFraction

number

이미지에서 색상이 차지하는 픽셀 비율입니다. [0, 1] 범위의 값입니다.

CropHintsAnnotation

이미지를 제공할 때 새 자르기를 생성하는 데 사용되는 자르기 힌트 세트입니다.

JSON 표현
{
  "cropHints": [
    {
      object(CropHint)
    }
  ]
}
필드
cropHints[]

object(CropHint)

자르기 힌트 결과입니다.

CropHint

이미지를 제공할 때 새 자르기를 생성하는 데 사용되는 단일 자르기 힌트입니다.

JSON 표현
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "confidence": number,
  "importanceFraction": number
}
필드
boundingPoly

object(BoundingPoly)

잘라낼 영역의 경계 다각형입니다. 경계 상자의 좌표는 ImageParams에서 반환된 것처럼 원본 이미지의 축척입니다.

confidence

number

이 두드러진 영역의 신뢰도입니다. 범위 [0, 1]

importanceFraction

number

이 두드러진 영역의 원본 이미지와 관련한 중요도 비율입니다.

WebDetection

인터넷에서 가져온 이미지에 대한 관련 정보입니다.

JSON 표현
{
  "webEntities": [
    {
      object(WebEntity)
    }
  ],
  "fullMatchingImages": [
    {
      object(WebImage)
    }
  ],
  "partialMatchingImages": [
    {
      object(WebImage)
    }
  ],
  "pagesWithMatchingImages": [
    {
      object(WebPage)
    }
  ],
  "visuallySimilarImages": [
    {
      object(WebImage)
    }
  ],
  "bestGuessLabels": [
    {
      object(WebLabel)
    }
  ]
}
필드
webEntities[]

object(WebEntity)

인터넷상의 유사한 이미지에서 추론된 항목입니다.

fullMatchingImages[]

object(WebImage)

인터넷에서 완전히 일치하는 이미지입니다. 크기가 조절된 쿼리 이미지의 사본을 포함할 수 있습니다.

partialMatchingImages[]

object(WebImage)

인터넷에서 부분적으로 일치하는 이미지입니다. 이러한 이미지는 몇 가지 핵심 특징을 공유할 만큼 충분히 유사합니다. 예를 들어, 원본 이미지와 잘라낸 이미지가 부분적으로 일치할 수 있습니다.

pagesWithMatchingImages[]

object(WebPage)

인터넷에서 일치하는 이미지가 포함된 웹페이지입니다.

visuallySimilarImages[]

object(WebImage)

시각적으로 유사한 이미지 결과입니다.

bestGuessLabels[]

object(WebLabel)

요청 이미지의 주제와 가장 가까운 이미지입니다. 개방형 웹의 유사한 이미지에서 추론된 것입니다.

WebEntity

인터넷의 비슷한 이미지에서 추론한 항목입니다.

JSON 표현
{
  "entityId": string,
  "score": number,
  "description": string
}
필드
entityId

string

불투명한 항목 ID입니다.

score

number

항목의 전체 관련성 점수입니다. 정규화되지 않으므로 서로 다른 이미지 쿼리 간에 비교할 수는 없습니다.

description

string

항목의 정식 설명입니다(영어).

WebImage

온라인 이미지에 대한 메타데이터입니다.

JSON 표현
{
  "url": string,
  "score": number
}
필드
url

string

결과 이미지 URL입니다.

score

number

(지원 중단됨) 이미지의 전체 관련성 점수입니다.

WebPage

웹페이지의 메타데이터입니다.

JSON 표현
{
  "url": string,
  "score": number,
  "pageTitle": string,
  "fullMatchingImages": [
    {
      object(WebImage)
    }
  ],
  "partialMatchingImages": [
    {
      object(WebImage)
    }
  ]
}
필드
url

string

결과 웹페이지 URL입니다.

score

number

(지원 중단됨) 웹페이지의 전반적인 관련성 점수입니다.

pageTitle

string

웹페이지의 제목으로서 HTML 마크업이 포함될 수 있습니다.

fullMatchingImages[]

object(WebImage)

페이지에서 완전히 일치하는 이미지입니다. 크기가 조절된 쿼리 이미지의 사본을 포함할 수 있습니다.

partialMatchingImages[]

object(WebImage)

페이지에서 부분적으로 일치하는 이미지입니다. 이러한 이미지는 몇 가지 핵심 특징을 공유할 만큼 충분히 유사합니다. 예를 들어, 원본 이미지와 잘라낸 이미지가 부분적으로 일치할 수 있습니다.

WebLabel

웹 감지를 위한 추가 메타데이터를 제공하는 라벨입니다.

JSON 표현
{
  "label": string,
  "languageCode": string
}
필드
label

string

추가 메타데이터 라벨입니다.

languageCode

string

label의 BCP-47 언어 코드입니다(예: 'en-US' 또는 'sr-Latn'). 자세한 내용은 http://www.unicode.org/reports/tr35/#Unicode_locale_identifier를 참조하세요.

ProductSearchResults

제품 검색 요청에 대한 결과입니다.

JSON 표현
{
  "indexTime": string,
  "results": [
    {
      object(Result)
    }
  ],
  "productGroupedResults": [
    {
      object(GroupedResult)
    }
  ]
}
필드
indexTime

string (Timestamp format)

이 결과를 제공한 색인의 타임스탬프입니다. 이 시점 이후의 변경사항은 현재 결과에 반영되지 않습니다.

RFC3339 UTC 'Zulu' 형식의 타임스탬프로 정밀도는 나노초 수준입니다. 예: "2014-10-02T15:01:23.045123456Z"

results[]

object(Result)

결과 목록입니다(각 제품 일치당 하나).

productGroupedResults[]

object(GroupedResult)

쿼리 이미지에서 감지된 제품별로 그룹화된 결과 목록입니다. 각 항목은 쿼리 이미지의 하나의 경계 다각형에 해당하며 해당 리전과 일치하는 제품을 포함합니다. 모든 제품별 결과의 합집합에 중복된 제품 일치가 있을 수 있습니다.

결과

제품에 대한 정보입니다.

JSON 표현
{
  "product": {
    object(Product)
  },
  "score": number,
  "image": string
}
필드
product

object(Product)

제품입니다.

score

number

일치 신뢰도로, 0(신뢰도 없음)에서 1(완전 신뢰) 사이로 나타냅니다.

image

string

제품에서 쿼리와 가장 일치하는 이미지의 리소스 이름입니다.

GroupedResult

쿼리 이미지의 단일 제품과 유사한 제품에 대한 정보입니다.

JSON 표현
{
  "boundingPoly": {
    object(BoundingPoly)
  },
  "results": [
    {
      object(Result)
    }
  ]
}
필드
boundingPoly

object(BoundingPoly)

쿼리 이미지에서 감지된 제품을 감싸는 경계 다각형입니다.

results[]

object(Result)

결과 목록입니다(각 제품 일치당 하나).

ImageAnnotationContext

이미지가 파일(예: PDF)에서 생성된 경우 이 메시지는 이미지의 소스에 대한 정보를 제공합니다.

JSON 표현
{
  "uri": string,
  "pageNumber": number
}
필드
uri

string

이미지를 생성하는 데 사용된 파일의 URI입니다.

pageNumber

number

파일이 PDF 또는 TIFF이면 이 필드는 이미지 생성에 사용된 파일 내의 페이지 번호를 제공합니다.