Índice
ImageAnnotator
(interface)AnnotateFileRequest
(mensagem)AnnotateFileResponse
(mensagem)AnnotateImageRequest
(mensagem)AnnotateImageResponse
(mensagem)BatchAnnotateFilesRequest
(mensagem)BatchAnnotateFilesResponse
(mensagem)BatchAnnotateImagesRequest
(mensagem)BatchAnnotateImagesResponse
(mensagem)Block
(mensagem)Block.BlockType
(enum)BoundingPoly
(mensagem)EntityAnnotation
(mensagem)Feature
(mensagem)Feature.Type
(enum)Image
(mensagem)ImageAnnotationContext
(mensagem)ImageContext
(mensagem)InputConfig
(mensagem)NormalizedVertex
(mensagem)Page
(mensagem)Paragraph
(mensagem)Property
(mensagem)Symbol
(mensagem)TextAnnotation
(mensagem)TextAnnotation.DetectedBreak
(mensagem)TextAnnotation.DetectedBreak.BreakType
(enum)TextAnnotation.DetectedLanguage
(mensagem)TextAnnotation.TextProperty
(mensagem)TextDetectionParams
(mensagem)Vertex
(mensagem)Word
(mensagem)
ImageAnnotator
Serviço que executa tarefas de detecção da Google Cloud Vision API em imagens de clientes, como detecção de rosto, ponto de referência, logotipo, marcadores e texto. O serviço ImageAnnotator retorna as entidades detectadas das imagens.
BatchAnnotateFiles |
---|
Serviço que realiza detecção e anotação de imagens para um lote de arquivos. Agora, somente "aplicativo/pdf", "imagem/tiff" e "imagem/gif" são compatíveis. Esse serviço extrairá no máximo 5 (clientes podem especificar quais cinco em frames do AnnotateFileRequest.pages) (gif) ou páginas (pdf ou tiff) de cada arquivo fornecido e realizar a detecção e anotação para cada imagem extraída.
|
BatchAnnotateImages |
---|
Executar detecção e anotação de imagem para um lote de imagens.
|
AnnotateFileRequest
Uma solicitação para anotar um único arquivo, por exemplo, um arquivo PDF, TIFF ou GIF.
Campos | |
---|---|
input_config |
Obrigatório. Informações sobre o arquivo de entrada. |
features[] |
Obrigatório. Recursos solicitados. |
image_context |
Contexto adicional que pode acompanhar as imagens no arquivo. |
pages[] |
Páginas do arquivo para realizar a anotação de imagem. As páginas começam no número 1, presume-se que a primeira página do arquivo seja a página 1. No máximo, cinco páginas são compatíveis por solicitação. As páginas podem ser negativas. A página 1 significa a primeira página. "Página 2" significa a segunda página. Página -1 significa a última página. Página -2 significa o segundo para a última página. Se o arquivo for um GIF em vez de PDF ou TIFF, a página fará referência a frames GIF. Se este campo estiver vazio, por padrão, o serviço realizará anotações de imagens nas primeiras cinco páginas do arquivo. |
AnnotateFileResponse
Resposta a uma única solicitação de anotação de arquivo. Um arquivo pode conter uma ou mais imagens, que têm as próprias respostas individualmente.
Campos | |
---|---|
input_config |
Informações sobre o arquivo para onde essa resposta é gerada. |
responses[] |
Respostas individuais às imagens encontradas no arquivo. Este campo estará vazio se o campo |
total_pages |
Este campo fornece o número total de páginas no arquivo. |
error |
Se definido, representa a mensagem de erro da solicitação com falha. O campo |
AnnotateImageRequest
Solicitação para executar tarefas da Google Cloud Vision API em uma imagem fornecida pelo usuário, com recursos solicitados pelo usuário e com informações de contexto.
Campos | |
---|---|
image |
A imagem a ser processada. |
features[] |
Recursos solicitados. |
image_context |
Contexto adicional que pode acompanhar a imagem. |
AnnotateImageResponse
Resposta a uma solicitação de anotação de imagem.
Campos | |
---|---|
text_annotations[] |
Se presente, a detecção de texto (OCR) foi concluída com sucesso. |
full_text_annotation |
Se presente, a detecção de texto (OCR) ou de texto de documentos foi concluída com sucesso. Esta anotação fornece a hierarquia estrutural para o texto detectado pelo OCR. |
error |
Se definido, representa a mensagem de erro da operação. Observe que há uma garantia de que as anotações de imagens preenchidas são corretas, mesmo quando |
context |
Se presente, as informações contextuais são necessárias para entender de onde vem essa imagem. |
BatchAnnotateFilesRequest
Uma lista de solicitações para fazer anotações em arquivos usando a API BatchAnnotateFiles.
Campos | |
---|---|
requests[] |
Obrigatório. A lista de solicitações de anotação de arquivo. Agora, oferecemos suporte apenas a um AnnotateFileRequest em BatchAnnotateFilesRequest. |
parent |
Opcional. Segmente o projeto e o local para fazer uma chamada. Formato: Se nenhum pai for especificado, uma região será escolhida automaticamente. Códigos de local compatíveis Exemplo: |
BatchAnnotateFilesResponse
Uma lista de respostas de anotações de arquivos.
Campos | |
---|---|
responses[] |
A lista de respostas de anotação de arquivo, cada resposta correspondente a cada AnnotateFileRequest em BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Várias solicitações de anotação de imagem são agrupadas em uma única chamada de serviço.
Campos | |
---|---|
requests[] |
Obrigatório. Solicitações individuais de anotação de imagem para este lote. |
parent |
Opcional. Segmente o projeto e o local para fazer uma chamada. Formato: Se nenhum pai for especificado, uma região será escolhida automaticamente. Códigos de local compatíveis Exemplo: |
BatchAnnotateImagesResponse
Resposta a uma solicitação de anotação de imagem em lote.
Campos | |
---|---|
responses[] |
Respostas individuais às solicitações de anotação de imagem no lote. |
Block
Elemento lógico na página.
Campos | |
---|---|
property |
Informações adicionais detectadas para o bloco. |
bounding_box |
A caixa delimitadora do bloco. Os vértices estão na ordem superior esquerda, superior direita, inferior direita e inferior esquerda. Quando uma rotação da caixa delimitadora é detectada, a rotação é representada ao redor do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Exemplo:
e a ordem dos vértices ainda será (0, 1, 2, 3) |
paragraphs[] |
Lista de parágrafos neste bloco, se ele for do tipo "texto". |
block_type |
Tipo de bloco detectado (texto, imagem etc.) para este bloco. |
confidence |
Confiança dos resultados do OCR no bloco. Intervalo [0, 1]. |
BlockType
Tipo de um bloco (texto, imagem etc.), conforme identificado pelo OCR.
Enums | |
---|---|
UNKNOWN |
Tipo de bloco desconhecido |
TEXT |
Bloco de texto regular |
TABLE |
Bloco de tabelas |
PICTURE |
Bloco de imagens |
RULER |
Caixa de linha horizontal/vertical |
BARCODE |
Bloco de códigos de barras |
BoundingPoly
Um polígono delimitador para a anotação de imagem detectada.
Campos | |
---|---|
vertices[] |
Os vértices do polígono delimitador. |
normalized_vertices[] |
Os vértices normalizados do polígono delimitador. |
EntityAnnotation
Conjunto de recursos detectados da entidade.
Campos | |
---|---|
mid |
Código da entidade opaca. Alguns IDs podem estar disponíveis na API Google Knowledge Graph Search. |
locale |
O código do idioma do local em que o |
description |
Descrição textual da entidade, expressa no respectivo idioma |
score |
Pontuação geral do resultado. Intervalo [0, 1]. |
confidence |
Obsoleto. Use |
topicality |
A relevância do marcador de anotação de conteúdo da imagem (ICA, na sigla em inglês) em relação à imagem. Por exemplo, a relevância de "torre" provavelmente é maior em uma imagem que contém a "Torre Eiffel" detectada do que em uma imagem com um prédio alto distante detectado, mesmo que a confiança de que há uma torre em cada imagem possa ser a mesma. Intervalo [0, 1]. |
bounding_poly |
Região da imagem à qual esta entidade pertence. Não produzido para os recursos |
properties[] |
Algumas entidades podem ter campos opcionais de |
Recurso
O tipo de detecção da API Google Cloud Vision a ser executado e o número máximo de resultados a serem retornados para esse tipo. Vários objetos Feature
podem ser especificados na lista features
.
Campos | |
---|---|
type |
O tipo de recurso. |
model |
Modelo para usar com o recurso. Valores aceitos: "builtin/stable", o padrão se não definido, e "builtin/latest". O |
Tipo
Tipo de recurso da API Google Cloud Vision que será extraído.
Enums | |
---|---|
TYPE_UNSPECIFIED |
Tipo de recurso não especificado. |
TEXT_DETECTION |
Realizar reconhecimento de caracteres/reconhecimento de caracteres ópticos (OCR, na sigla em inglês). A detecção de texto é otimizada para áreas de texto em uma imagem maior. Se a imagem for um documento, use DOCUMENT_TEXT_DETECTION . |
DOCUMENT_TEXT_DETECTION |
Executar o OCR denso do documento de texto. Tem precedência quando DOCUMENT_TEXT_DETECTION e TEXT_DETECTION estão presentes. |
Imagem
Imagem do cliente na qual executar as tarefas da Google Cloud Vision API.
Campos | |
---|---|
content |
Conteúdo da imagem, representado como um stream de bytes. Observação: assim como acontece com todos os campos No momento, esse campo só funciona para solicitações BatchAnnotateImages. |
ImageAnnotationContext
Se uma imagem foi produzida com base em um arquivo (por exemplo, um PDF), essa mensagem fornece informações sobre a origem dessa imagem.
Campos | |
---|---|
uri |
O URI do arquivo usado para produzir a imagem. |
page_number |
Se o arquivo for um PDF ou TIFF, esse campo fornecerá o número da página no arquivo usado para produzir a imagem. |
ImageContext
Contexto da imagem e/ou parâmetros específicos do recurso.
Campos | |
---|---|
language_hints[] |
Lista de idiomas a serem usados para TEXT_DETECTION. Na maioria dos casos, um valor vazio
produz os melhores resultados, já que ele possibilita a detecção automática do idioma. Para
idiomas com base no alfabeto latino, não é necessário definir |
text_detection_params |
Parâmetros para detecção de texto e de texto em documentos. |
InputConfig
O local e os metadados da entrada desejados.
Campos | |
---|---|
content |
Conteúdo do arquivo, representado como um stream de bytes. Observação: assim como acontece com todos os campos Atualmente, esse campo só funciona para solicitações BatchAnnotateFiles. |
mime_type |
O tipo do arquivo. Atualmente, apenas "application/pdf", "image/tiff" e "image/gif" são compatíveis. Caracteres curinga não são aceitos. |
NormalizedVertex
Um vértice representa um ponto 2D na imagem. OBSERVAÇÃO: as coordenadas do vértice normalizado são relativas à imagem original e variam de 0 a 1.
Campos | |
---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Página
Página detectada do OCR.
Campos | |
---|---|
property |
Informações adicionais detectadas na página. |
width |
Largura da página. Nos PDFs, a unidade é a pontuação. Para imagens (incluindo TIFFs), a unidade é pixels |
height |
Altura da página. Nos PDFs, a unidade é a pontuação. Para imagens (incluindo TIFFs), a unidade é pixels |
blocks[] |
Lista de blocos de texto, imagens, entre outros, nesta página. |
confidence |
Confiança dos resultados do OCR na página. Intervalo [0, 1]. |
Paragraph
Unidade estrutural de texto que representa uma série de palavras em determinada ordem.
Campos | |
---|---|
property |
Informações adicionais detectadas para o parágrafo. |
bounding_box |
A caixa delimitadora do parágrafo. Os vértices estão na ordem superior esquerda, superior direita, inferior direita e inferior esquerda. Quando uma rotação da caixa delimitadora é detectada, a rotação é representada ao redor do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * quando o texto for horizontal, a aparência será: 0----1 | | 3----2 * quando for girado em 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices ainda será (0, 1, 2, 3). |
words[] |
Lista de todas as palavras neste parágrafo. |
confidence |
Confiança dos resultados do OCR para o parágrafo. Intervalo [0, 1]. |
Propriedade
Uma Property
consiste em um par nome/valor fornecido pelo usuário.
Campos | |
---|---|
name |
Nome da propriedade. |
value |
Valor da propriedade. |
uint64_value |
Valor das propriedades numéricas. |
Símbolo
Uma única representação de símbolo.
Campos | |
---|---|
property |
Informações adicionais detectadas para o símbolo. |
bounding_box |
A caixa delimitadora do símbolo. Os vértices estão na ordem superior esquerda, superior direita, inferior direita e inferior esquerda. Quando uma rotação da caixa delimitadora é detectada, a rotação é representada ao redor do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * quando o texto for horizontal, a aparência será: 0----1 | | 3----2 * quando for girado em 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices ainda será (0, 1, 2, 3). |
text |
A representação UTF-8 real do símbolo. |
confidence |
Confiança dos resultados do OCR para o símbolo. Intervalo [0, 1]. |
TextAnnotation
TextAnnotation
contém uma representação estruturada do texto extraído por OCR. A hierarquia de uma estrutura de texto extraída por OCR é assim:
TextAnnotation
-> Página -> Bloco -> Parágrafo -> Palavra -> Símbolo
TextAnnotation.TextProperty
a seguir.
Campos | |
---|---|
pages[] |
Lista de páginas detectadas pelo OCR. |
text |
Texto UTF-8 detectado nas páginas. |
DetectedBreak
Início ou fim da detecção de um componente estrutural.
Campos | |
---|---|
type |
Tipo de quebra detectado. |
is_prefix |
Verdadeiro se a quebra preceder o elemento. |
BreakType
Enum para denotar o tipo de quebra encontrado. Nova linha, espaço etc.
Enums | |
---|---|
UNKNOWN |
Tipo de marcador de quebra desconhecido. |
SPACE |
Espaço regular. |
SURE_SPACE |
Espaço garantido (muito largo). |
EOL_SURE_SPACE |
Quebra de linha. |
HYPHEN |
Hífen de fim de linha que não está presente no texto. Não ocorre juntamente com SPACE , LEADER_SPACE ou LINE_BREAK . |
LINE_BREAK |
Quebra de linha que termina um parágrafo. |
DetectedLanguage
Idioma detectado para um componente estrutural.
Campos | |
---|---|
language_code |
O código de idioma BCP-47, como "pt-BR" ou "en-US". Para mais informações, consulte https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Confiança do idioma detectado. Intervalo [0, 1]. |
TextProperty
Informações adicionais detectadas sobre o componente estrutural.
Campos | |
---|---|
detected_languages[] |
Uma lista de idiomas detectados juntamente com a confiança. |
detected_break |
Início ou fim detectado de um segmento de texto. |
TextDetectionParams
Parâmetros para detecção de texto. Isso é usado para controlar os recursos TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
Campos | |
---|---|
enable_text_detection_confidence_score |
Por padrão, a API Cloud Vision só inclui a pontuação de confiança para o resultado de DOCUMENT_TEXT_DETECTION. Defina a flag como "true" para incluir também a pontuação de confiança para TEXT_DETECTION. |
advanced_ocr_options[] |
Uma lista de opções avançadas de OCR para ajustar o comportamento do OCR. |
Vertex
Um vértice representa um ponto 2D na imagem. OBSERVAÇÃO: as coordenadas do vértice estão na mesma escala que a imagem original.
Campos | |
---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Word
Uma representação de palavra.
Campos | |
---|---|
property |
Informações adicionais detectadas para a palavra. |
bounding_box |
A caixa delimitadora da palavra. Os vértices estão na ordem superior esquerda, superior direita, inferior direita e inferior esquerda. Quando uma rotação da caixa delimitadora é detectada, a rotação é representada ao redor do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * quando o texto for horizontal, a aparência será: 0----1 | | 3----2 * quando for girado em 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices ainda será (0, 1, 2, 3). |
symbols[] |
Lista de símbolos na palavra. A ordem dos símbolos segue a ordem de leitura natural. |
confidence |
Confiança dos resultados do OCR para a palavra. Intervalo [0, 1]. |