Índice
ImageAnnotator
(interface)AnnotateFileRequest
(mensagem)AnnotateFileResponse
(mensagem)AnnotateImageRequest
(mensagem)AnnotateImageResponse
(mensagem)BatchAnnotateFilesRequest
(mensagem)BatchAnnotateFilesResponse
(mensagem)BatchAnnotateImagesRequest
(mensagem)BatchAnnotateImagesResponse
(mensagem)Block
(mensagem)Block.BlockType
(enum)BoundingPoly
(mensagem)EntityAnnotation
(mensagem)Feature
(mensagem)Feature.Type
(enum)Image
(mensagem)ImageAnnotationContext
(mensagem)ImageContext
(mensagem)InputConfig
(mensagem)NormalizedVertex
(mensagem)Page
(mensagem)Paragraph
(mensagem)Property
(mensagem)Symbol
(mensagem)TextAnnotation
(mensagem)TextAnnotation.DetectedBreak
(mensagem)TextAnnotation.DetectedBreak.BreakType
(enum)TextAnnotation.DetectedLanguage
(mensagem)TextAnnotation.TextProperty
(mensagem)TextDetectionParams
(mensagem)Vertex
(mensagem)Word
(mensagem)
ImageAnnotator
Serviço que executa tarefas de deteção da Google Cloud Vision API em imagens do cliente, como deteção de caras, pontos de referência, logótipos, etiquetas e texto. O serviço ImageAnnotator devolve entidades detetadas das imagens.
BatchAnnotateFiles |
---|
Serviço que realiza a deteção e a anotação de imagens para um lote de ficheiros. Agora, apenas são suportados os tipos "application/pdf", "image/tiff" e "image/gif". Este serviço extrai, no máximo, 5 frames (GIF) ou páginas (PDF ou TIFF) de cada ficheiro fornecido e realiza a deteção e a anotação de cada imagem extraída. Os clientes podem especificar que 5 frames ou páginas querem no AnnotateFileRequest.pages.
|
BatchAnnotateImages |
---|
Executar a deteção e a anotação de imagens para um lote de imagens.
|
AnnotateFileRequest
Um pedido para anotar um único ficheiro, por exemplo, um ficheiro PDF, TIFF ou GIF.
Campos | |
---|---|
input_config |
Obrigatório. Informações sobre o ficheiro de entrada. |
features[] |
Obrigatório. Funcionalidades pedidas. |
image_context |
Contexto adicional que pode acompanhar as imagens no ficheiro. |
pages[] |
Páginas do ficheiro para fazer a anotação de imagens. As páginas começam a partir de 1. Presumimos que a primeira página do ficheiro é a página 1. São suportadas, no máximo, 5 páginas por pedido. As páginas podem ser negativas. Página 1 significa a primeira página. Página 2 significa a segunda página. A página -1 significa a última página. A página -2 significa a penúltima página. Se o ficheiro for GIF em vez de PDF ou TIFF, a página refere-se a frames GIF. Se este campo estiver vazio, por predefinição, o serviço realiza a anotação de imagens para as primeiras 5 páginas do ficheiro. |
AnnotateFileResponse
Resposta a um pedido de anotação de um único ficheiro. Um ficheiro pode conter uma ou mais imagens, que têm individualmente as suas próprias respostas.
Campos | |
---|---|
input_config |
Informações sobre o ficheiro para o qual esta resposta é gerada. |
responses[] |
Respostas individuais a imagens encontradas no ficheiro. Este campo fica vazio se o campo |
total_pages |
Este campo indica o número total de páginas no ficheiro. |
error |
Se definido, representa a mensagem de erro do pedido com falha. Neste caso, o campo |
AnnotateImageRequest
Pedido para realizar tarefas da Google Cloud Vision API numa imagem fornecida pelo utilizador, com funcionalidades pedidas pelo utilizador e com informações de contexto.
Campos | |
---|---|
image |
A imagem a ser processada. |
features[] |
Funcionalidades pedidas. |
image_context |
Contexto adicional que pode acompanhar a imagem. |
AnnotateImageResponse
Resposta a um pedido de anotação de imagem.
Campos | |
---|---|
text_annotations[] |
Se estiver presente, a deteção de texto (OCR) foi concluída com êxito. |
full_text_annotation |
Se estiver presente, a deteção de texto (OCR) ou a deteção de texto de documentos (OCR) foi concluída com êxito. Esta anotação fornece a hierarquia estrutural do texto detetado pelo OCR. |
error |
Se definido, representa a mensagem de erro da operação. Tenha em atenção que as anotações de imagens preenchidas têm a garantia de estar corretas, mesmo quando |
context |
Se estiverem presentes, são necessárias informações contextuais para compreender a origem desta imagem. |
BatchAnnotateFilesRequest
Uma lista de pedidos para anotar ficheiros através da API BatchAnnotateFiles.
Campos | |
---|---|
requests[] |
Obrigatório. A lista de pedidos de anotação de ficheiros. Atualmente, só suportamos um AnnotateFileRequest em BatchAnnotateFilesRequest. |
parent |
Opcional. Projeto e localização de destino para fazer uma chamada. Formato: Se não for especificado nenhum elemento principal, é escolhida uma região automaticamente. IDs de localização suportados: Exemplo: |
BatchAnnotateFilesResponse
Uma lista de respostas de anotações de ficheiros.
Campos | |
---|---|
responses[] |
A lista de respostas de anotação de ficheiros, cada resposta correspondente a cada AnnotateFileRequest em BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Vários pedidos de anotação de imagens são processados em lote numa única chamada de serviço.
Campos | |
---|---|
requests[] |
Obrigatório. Pedidos de anotação de imagens individuais para este lote. |
parent |
Opcional. Projeto e localização de destino para fazer uma chamada. Formato: Se não for especificado nenhum elemento principal, é escolhida uma região automaticamente. IDs de localização suportados: Exemplo: |
BatchAnnotateImagesResponse
Resposta a um pedido de anotação de imagens em lote.
Campos | |
---|---|
responses[] |
Respostas individuais a pedidos de anotação de imagens no lote. |
Bloquear
Elemento lógico na página.
Campos | |
---|---|
property |
Foram detetadas informações adicionais para o bloqueio. |
bounding_box |
A caixa limitadora do bloco. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo:
e a ordem dos vértices continua a ser (0, 1, 2, 3). |
paragraphs[] |
Lista de parágrafos neste bloco (se este bloco for do tipo texto). |
block_type |
Tipo de bloco detetado (texto, imagem, etc.) para este bloco. |
confidence |
Confiança dos resultados de OCR no bloco. Intervalo [0, 1]. |
BlockType
Tipo de um bloco (texto, imagem, etc.) conforme identificado pelo OCR.
Enumerações | |
---|---|
UNKNOWN |
Tipo de bloco desconhecido. |
TEXT |
Bloco de texto normal. |
TABLE |
Bloco de tabela. |
PICTURE |
Bloqueio de imagem. |
RULER |
Caixa de linhas horizontais/verticais. |
BARCODE |
Bloco de código de barras. |
BoundingPoly
Um polígono de limite para a anotação de imagem detetada.
Campos | |
---|---|
vertices[] |
Os vértices do polígono delimitador. |
normalized_vertices[] |
Os vértices normalizados do polígono delimitador. |
EntityAnnotation
Conjunto de funcionalidades de entidades detetadas.
Campos | |
---|---|
mid |
ID de entidade opaco. Alguns IDs podem estar disponíveis na API Google Knowledge Graph Search. |
locale |
O código de idioma da região em que o texto da entidade |
description |
Descrição textual da entidade, expressa no respetivo idioma |
score |
Pontuação geral do resultado. Intervalo [0, 1]. |
confidence |
Descontinuado. Em alternativa, use |
topicality |
A relevância da etiqueta ICA (anotação de conteúdo de imagem) para a imagem. Por exemplo, a relevância de "torre" é provavelmente superior para uma imagem que contenha a "Torre Eiffel" detetada do que para uma imagem que contenha um edifício alto distante detetado, mesmo que a confiança de que existe uma torre em cada imagem possa ser a mesma. Intervalo [0, 1]. |
bounding_poly |
Região da imagem à qual esta entidade pertence. Não produzido para funcionalidades |
properties[] |
Algumas entidades podem ter campos |
Funcionalidade
O tipo de deteção da API Google Cloud Vision a realizar e o número máximo de resultados a devolver para esse tipo. Podem ser especificados vários objetos Feature
na lista features
.
Campos | |
---|---|
type |
O tipo de funcionalidade. |
model |
Modelo a usar para a funcionalidade. Valores suportados: "builtin/stable" (a predefinição se não estiver definida) e "builtin/latest". |
Tipo
Tipo de funcionalidade da API Google Cloud Vision a ser extraída.
Enumerações | |
---|---|
TYPE_UNSPECIFIED |
Tipo de funcionalidade não especificado. |
TEXT_DETECTION |
Executar deteção de texto / reconhecimento ótico de carateres (OCR). A deteção de texto está otimizada para áreas de texto numa imagem maior. Se a imagem for um documento, use DOCUMENT_TEXT_DETECTION . |
DOCUMENT_TEXT_DETECTION |
Executar OCR de documentos de texto denso. Tem precedência quando DOCUMENT_TEXT_DETECTION e TEXT_DETECTION estão presentes. |
Imagem
Imagem do cliente para realizar tarefas da Google Cloud Vision API.
Campos | |
---|---|
content |
Conteúdo de imagem, representado como um fluxo de bytes. Nota: tal como acontece com todos os campos Atualmente, este campo só funciona para pedidos BatchAnnotateImages. Não funciona para pedidos AsyncBatchAnnotateImages. |
ImageAnnotationContext
Se uma imagem foi produzida a partir de um ficheiro (por exemplo, um PDF), esta mensagem fornece informações sobre a origem dessa imagem.
Campos | |
---|---|
uri |
O URI do ficheiro usado para produzir a imagem. |
page_number |
Se o ficheiro era um PDF ou um TIFF, este campo indica o número da página no ficheiro usado para produzir a imagem. |
ImageContext
Contexto da imagem e/ou parâmetros específicos da funcionalidade.
Campos | |
---|---|
language_hints[] |
Lista de idiomas a usar para TEXT_DETECTION. Na maioria dos casos, um valor vazio produz os melhores resultados, uma vez que permite a deteção automática do idioma. Para idiomas baseados no alfabeto latino, não é necessário definir |
text_detection_params |
Parâmetros para a deteção de texto e a deteção de texto em documentos. |
InputConfig
A localização de entrada e os metadados pretendidos.
Campos | |
---|---|
content |
Conteúdo do ficheiro, representado como uma stream de bytes. Nota: tal como acontece com todos os campos Atualmente, este campo só funciona para pedidos BatchAnnotateFiles. Não funciona para pedidos AsyncBatchAnnotateFiles. |
mime_type |
O tipo de ficheiro. Atualmente, apenas são suportados os tipos "application/pdf", "image/tiff" e "image/gif". Os carateres universais não são compatíveis. |
NormalizedVertex
Um vértice representa um ponto 2D na imagem. NOTA: as coordenadas dos vértices normalizadas são relativas à imagem original e variam entre 0 e 1.
Campos | |
---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Página
Página detetada a partir do OCR.
Campos | |
---|---|
property |
Foram detetadas informações adicionais na página. |
width |
Largura da página. Para PDFs, a unidade é pontos. Para imagens (incluindo TIFFs), a unidade é píxeis. |
height |
Altura da página. Para PDFs, a unidade é pontos. Para imagens (incluindo TIFFs), a unidade é píxeis. |
blocks[] |
Lista de blocos de texto, imagens, etc. nesta página. |
confidence |
Confiança nos resultados de OCR na página. Intervalo [0, 1]. |
Parágrafo
Unidade estrutural de texto que representa um número de palavras numa determinada ordem.
Campos | |
---|---|
property |
Foram detetadas informações adicionais para o parágrafo. |
bounding_box |
A caixa limitadora do parágrafo. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
words[] |
Lista de todas as palavras neste parágrafo. |
confidence |
Confiança dos resultados de OCR para o parágrafo. Intervalo [0, 1]. |
Propriedade
Um Property
consiste num par de nome/valor fornecido pelo utilizador.
Campos | |
---|---|
name |
Nome da propriedade. |
value |
Valor da propriedade. |
uint64_value |
Valor das propriedades numéricas. |
Símbolo
Uma representação de símbolo único.
Campos | |
---|---|
property |
Foram detetadas informações adicionais para o símbolo. |
bounding_box |
A caixa delimitadora do símbolo. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
text |
A representação UTF-8 real do símbolo. |
confidence |
Confiança dos resultados de OCR para o símbolo. Intervalo [0, 1]. |
TextAnnotation
TextAnnotation
contém uma representação estruturada do texto extraído por OCR. A hierarquia de uma estrutura de texto extraída por OCR é a seguinte:
TextAnnotation
-> Página -> Bloco -> Parágrafo -> Palavra -> Símbolo
TextAnnotation.TextProperty
que se segue.
Campos | |
---|---|
pages[] |
Lista de páginas detetadas pelo OCR. |
text |
Texto UTF-8 detetado nas páginas. |
DetectedBreak
Início ou fim de um componente estrutural detetado.
Campos | |
---|---|
type |
Tipo de quebra detetado. |
is_prefix |
Verdadeiro se a quebra preceder o elemento. |
BreakType
Enum para denotar o tipo de interrupção encontrado. Nova linha, espaço, etc.
Enumerações | |
---|---|
UNKNOWN |
Tipo de etiqueta de quebra desconhecido. |
SPACE |
Espaço normal. |
SURE_SPACE |
Espaço certo (muito largo). |
EOL_SURE_SPACE |
Quebra de moldagem de linhas. |
HYPHEN |
Hífen no final da linha que não está presente no texto; não ocorre em simultâneo com SPACE , LEADER_SPACE ou LINE_BREAK . |
LINE_BREAK |
Quebra de linha que termina um parágrafo. |
DetectedLanguage
Idioma detetado para um componente estrutural.
Campos | |
---|---|
language_code |
O código de idioma BCP-47, como "en-US" ou "sr-Latn". Para mais informações, consulte https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Confiança do idioma detetado. Intervalo [0, 1]. |
TextProperty
Foram detetadas informações adicionais no componente estrutural.
Campos | |
---|---|
detected_languages[] |
Uma lista de idiomas detetados juntamente com a confiança. |
detected_break |
Início ou fim detetado de um segmento de texto. |
TextDetectionParams
Parâmetros para deteções de texto. Isto é usado para controlar as funcionalidades TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
Campos | |
---|---|
enable_text_detection_confidence_score |
Por predefinição, a Cloud Vision API inclui apenas a pontuação de confiança para o resultado DOCUMENT_TEXT_DETECTION. Defina a flag como true para incluir também a pontuação de confiança para TEXT_DETECTION. |
advanced_ocr_options[] |
Uma lista de opções avançadas de OCR para ajustar o comportamento do OCR. |
Vertex
Um vértice representa um ponto 2D na imagem. NOTA: as coordenadas dos vértices estão na mesma escala que a imagem original.
Campos | |
---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Word
Uma representação de palavras.
Campos | |
---|---|
property |
Foram detetadas informações adicionais para a palavra. |
bounding_box |
A caixa limitadora da palavra. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
symbols[] |
Lista de símbolos na palavra. A ordem dos símbolos segue a ordem de leitura natural. |
confidence |
Confiança dos resultados de OCR para a palavra. Intervalo [0, 1]. |