Indice
ImageAnnotator
(interfaccia)AnnotateFileRequest
(messaggio)AnnotateFileResponse
(messaggio)AnnotateImageRequest
(messaggio)AnnotateImageResponse
(messaggio)BatchAnnotateFilesRequest
(messaggio)BatchAnnotateFilesResponse
(messaggio)BatchAnnotateImagesRequest
(messaggio)BatchAnnotateImagesResponse
(messaggio)Block
(messaggio)Block.BlockType
(enum)BoundingPoly
(messaggio)EntityAnnotation
(messaggio)Feature
(messaggio)Feature.Type
(enum)Image
(messaggio)ImageAnnotationContext
(messaggio)ImageContext
(messaggio)InputConfig
(messaggio)NormalizedVertex
(messaggio)Page
(messaggio)Paragraph
(messaggio)Property
(messaggio)Symbol
(messaggio)TextAnnotation
(messaggio)TextAnnotation.DetectedBreak
(messaggio)TextAnnotation.DetectedBreak.BreakType
(enum)TextAnnotation.DetectedLanguage
(messaggio)TextAnnotation.TextProperty
(messaggio)TextDetectionParams
(messaggio)Vertex
(messaggio)Word
(messaggio)
ImageAnnotator
Servizio che esegue attività di rilevamento dell'API Google Cloud Vision sulle immagini del client, ad esempio rilevamento di volti, punti di riferimento, loghi, etichette e testo. Il servizio ImageAnnotator restituisce le entità rilevate dalle immagini.
BatchAnnotateFiles |
---|
Servizio che esegue il rilevamento e l'annotazione delle immagini per un batch di file. Ora sono supportati solo "application/pdf", "image/tiff" e "image/gif". Questo servizio estrae al massimo 5 frame (GIF) o pagine (PDF o TIFF) da ogni file fornito ed esegue il rilevamento e l'annotazione per ogni immagine estratta.
|
BatchAnnotateImages |
---|
Esegui il rilevamento e l'annotazione delle immagini per un batch di immagini.
|
AnnotateFileRequest
Una richiesta di annotazione di un singolo file, ad esempio un file PDF, TIFF o GIF.
Campi | |
---|---|
input_config |
Obbligatorio. Informazioni sul file di input. |
features[] |
Obbligatorio. Funzionalità richieste. |
image_context |
Contesto aggiuntivo che potrebbe accompagnare le immagini nel file. |
pages[] |
Pagine del file per eseguire l'annotazione delle immagini. Le pagine iniziano da 1, quindi la prima pagina del file è la pagina 1. Per richiesta sono supportate al massimo 5 pagine. Le pagine possono essere negative. Pagina 1 indica la prima pagina. Pagina 2 indica la seconda pagina. La pagina -1 indica l'ultima pagina. La pagina -2 indica la penultima pagina. Se il file è GIF anziché PDF o TIFF, la pagina si riferisce ai frame GIF. Se questo campo è vuoto, per impostazione predefinita il servizio esegue l'annotazione delle immagini per le prime 5 pagine del file. |
AnnotateFileResponse
Risposta a una singola richiesta di annotazione del file. Un file può contenere una o più immagini, ognuna con le proprie risposte.
Campi | |
---|---|
input_config |
Informazioni sul file per cui viene generata questa risposta. |
responses[] |
Singole risposte alle immagini trovate all'interno del file. Questo campo sarà vuoto se il campo |
total_pages |
Questo campo indica il numero totale di pagine nel file. |
error |
Se impostato, rappresenta il messaggio di errore per la richiesta non riuscita. In questo caso, il campo |
AnnotateImageRequest
Richiesta di esecuzione di attività dell'API Google Cloud Vision su un'immagine fornita dall'utente, con le funzionalità richieste dall'utente e con informazioni contestuali.
Campi | |
---|---|
image |
L'immagine da elaborare. |
features[] |
Funzionalità richieste. |
image_context |
Contesto aggiuntivo che può accompagnare l'immagine. |
AnnotateImageResponse
Risposta a una richiesta di annotazione per l'immagine.
Campi | |
---|---|
text_annotations[] |
Se presente, il rilevamento del testo (OCR) è stato completato correttamente. |
full_text_annotation |
Se presente, il rilevamento del testo (OCR) o del testo del documento (OCR) è stato completato correttamente. Questa annotazione fornisce la gerarchia strutturale per il testo rilevato tramite OCR. |
error |
Se impostato, rappresenta il messaggio di errore per l'operazione. Tieni presente che le annotazioni delle immagini compilate sono garantite come corrette, anche quando è impostato |
context |
Se presenti, le informazioni contestuali sono necessarie per capire da dove proviene l'immagine. |
BatchAnnotateFilesRequest
Un elenco di richieste per annotare i file utilizzando l'API BatchAnnotateFiles.
Campi | |
---|---|
requests[] |
Obbligatorio. L'elenco delle richieste di annotazione dei file. Al momento supportiamo solo una richiesta AnnotateFileRequest in BatchAnnotateFilesRequest. |
parent |
Facoltativo. Progetto e posizione di destinazione per effettuare una chiamata. Formato: Se non viene specificato un progetto genitore, verrà scelta automaticamente una regione. ID località supportati: Esempio: |
BatchAnnotateFilesResponse
Un elenco di risposte alle annotazioni dei file.
Campi | |
---|---|
responses[] |
L'elenco delle risposte di annotazione dei file, ciascuna risposta corrispondente a ogni AnnotateFileRequest in BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Più richieste di annotazione di immagini vengono raggruppate in una singola chiamata di servizio.
Campi | |
---|---|
requests[] |
Obbligatorio. Singole richieste di annotazione per le immagini di questo batch. |
parent |
Facoltativo. Progetto e posizione di destinazione per effettuare una chiamata. Formato: Se non viene specificato un progetto genitore, verrà scelta automaticamente una regione. ID località supportati: Esempio: |
BatchAnnotateImagesResponse
Risposta a una richiesta di annotazione di immagini batch.
Campi | |
---|---|
responses[] |
Singole risposte alle richieste di annotazione delle immagini all'interno del batch. |
Blocca
Elemento logico della pagina.
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il blocco. |
bounding_box |
Il riquadro di delimitazione del blocco. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio:
e l'ordine dei vertici sarà ancora (0, 1, 2, 3). |
paragraphs[] |
Elenco dei paragrafi in questo blocco (se il blocco è di tipo testo). |
block_type |
Il tipo di blocco rilevato (testo, immagine e così via) per questo blocco. |
confidence |
Affidabilità dei risultati dell'OCR sul blocco. Intervallo [0, 1]. |
BlockType
Tipo di blocco (testo, immagine e così via) identificato dall'OCR.
Enum | |
---|---|
UNKNOWN |
Tipo di blocco sconosciuto. |
TEXT |
Blocco di testo normale. |
TABLE |
Blocco tabella. |
PICTURE |
Blocco immagine. |
RULER |
Casella per linee orizzontali/verticali. |
BARCODE |
Blocco del codice a barre. |
BoundingPoly
Un poligono di delimitazione per l'annotazione dell'immagine rilevata.
Campi | |
---|---|
vertices[] |
I vertici del poligono di delimitazione. |
normalized_vertices[] |
I vertici normalizzati del poligono di delimitazione. |
EntityAnnotation
Insieme di funzionalità dell'entità rilevata.
Campi | |
---|---|
mid |
ID entità opaco. Alcuni ID potrebbero essere disponibili nell'API Google Knowledge Graph Search. |
locale |
Il codice lingua delle impostazioni internazionali in cui è espressa la |
description |
Descrizione testuale dell'entità, espressa nella lingua |
score |
Punteggio complessivo del risultato. Intervallo [0, 1]. |
confidence |
Ritirato. Usa invece |
topicality |
La pertinenza dell'etichetta ICA (annotazione dei contenuti delle immagini) rispetto all'immagine. Ad esempio, la pertinenza di "torre" è probabilmente maggiore per un'immagine contenente la "Torre Eiffel" rilevata rispetto a un'immagine contenente un edificio torreggiante distante rilevato, anche se la confidenza che ci sia una torre in ogni immagine potrebbe essere la stessa. Intervallo [0, 1]. |
bounding_poly |
La regione dell'immagine a cui appartiene questa entità. Non prodotto per le funzionalità di |
properties[] |
Alcune entità potrebbero avere campi |
Funzionalità
Il tipo di rilevamento dell'API Google Cloud Vision da eseguire e il numero massimo di risultati da restituire per quel tipo. Nell'elenco features
possono essere specificati più oggetti Feature
.
Campi | |
---|---|
type |
Il tipo di funzionalità. |
model |
Modello da utilizzare per la funzionalità. Valori supportati: "builtin/stable" (il valore predefinito se non impostato) e "builtin/latest". |
Tipo
Tipo di funzionalità dell'API Google Cloud Vision da estrarre.
Enum | |
---|---|
TYPE_UNSPECIFIED |
Tipo di funzionalità non specificato. |
TEXT_DETECTION |
Esegui il rilevamento del testo / il riconoscimento ottico dei caratteri (OCR). Il rilevamento del testo è ottimizzato per aree di testo all'interno di un'immagine più grande. Se l'immagine è un documento, utilizza invece DOCUMENT_TEXT_DETECTION . |
DOCUMENT_TEXT_DETECTION |
Esegui l'OCR sui documenti di testo ad alta densità. Ha la precedenza quando sono presenti sia DOCUMENT_TEXT_DETECTION che TEXT_DETECTION . |
Immagine
Immagine del client su cui eseguire le attività dell'API Google Cloud Vision.
Campi | |
---|---|
content |
Contenuti dell'immagine, rappresentati come un flusso di byte. Nota: come per tutti i campi Al momento, questo campo funziona solo per le richieste BatchAnnotateImages. Non funziona per le richieste AsyncBatchAnnotateImages. |
ImageAnnotationContext
Se un'immagine è stata prodotta da un file (ad es. un PDF), questo messaggio fornisce informazioni sull'origine dell'immagine.
Campi | |
---|---|
uri |
L'URI del file utilizzato per produrre l'immagine. |
page_number |
Se il file era un PDF o un TIFF, questo campo indica il numero di pagina all'interno del file utilizzato per produrre l'immagine. |
ImageContext
Contesto dell'immagine e/o parametri specifici della funzionalità.
Campi | |
---|---|
language_hints[] |
Elenco delle lingue da utilizzare per TEXT_DETECTION. Nella maggior parte dei casi, un valore vuoto produce i risultati migliori, in quanto consente il rilevamento automatico della lingua. Per le lingue basate sull'alfabeto latino, non è necessario impostare |
text_detection_params |
Parametri per il rilevamento del testo e del testo del documento. |
InputConfig
La posizione di input e i metadati desiderati.
Campi | |
---|---|
content |
Contenuti del file, rappresentati come un flusso di byte. Nota: come per tutti i campi Al momento, questo campo funziona solo per le richieste BatchAnnotateFiles. Non funziona per le richieste AsyncBatchAnnotateFiles. |
mime_type |
Il tipo di file. Al momento sono supportati solo "application/pdf", "image/tiff" e "image/gif". I caratteri jolly non sono supportati. |
NormalizedVertex
Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate normalizzate dei vertici sono relative all'immagine originale e vanno da 0 a 1.
Campi | |
---|---|
x |
Coordinata X. |
y |
Coordinata Y. |
Pagina
Pagina rilevata tramite OCR.
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive sulla pagina. |
width |
Larghezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel. |
height |
Altezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel. |
blocks[] |
Elenco di blocchi di testo, immagini e così via in questa pagina. |
confidence |
Affidabilità dei risultati dell'OCR nella pagina. Intervallo [0, 1]. |
Paragrafo
Unità strutturale di testo che rappresenta un numero di parole in un determinato ordine.
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il paragrafo. |
bounding_box |
Il riquadro di delimitazione del paragrafo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
words[] |
Elenco di tutte le parole in questo paragrafo. |
confidence |
Affidabilità dei risultati dell'OCR per il paragrafo. Intervallo [0, 1]. |
Proprietà
Un Property
è costituito da una coppia nome/valore fornita dall'utente.
Campi | |
---|---|
name |
Il nome della proprietà. |
value |
Valore della proprietà. |
uint64_value |
Valore delle proprietà numeriche. |
Simbolo
Una singola rappresentazione simbolica.
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il simbolo. |
bounding_box |
Il riquadro di delimitazione del simbolo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
text |
La rappresentazione UTF-8 effettiva del simbolo. |
confidence |
Affidabilità dei risultati dell'OCR per il simbolo. Intervallo [0, 1]. |
TextAnnotation
TextAnnotation
contiene una rappresentazione strutturata del testo estratto tramite OCR. La gerarchia di una struttura di testo estratta con l'OCR è la seguente:
TextAnnotation
-> Pagina -> Blocco -> Paragrafo -> Parola -> Simbolo
TextAnnotation.TextProperty
riportata di seguito.
Campi | |
---|---|
pages[] |
Elenco delle pagine rilevate dall'OCR. |
text |
Testo UTF-8 rilevato nelle pagine. |
DetectedBreak
Rilevato l'inizio o la fine di un componente strutturale.
Campi | |
---|---|
type |
Tipo di interruzione rilevato. |
is_prefix |
True se l'interruzione precede l'elemento. |
BreakType
Enumerazione per indicare il tipo di pausa trovato. Nuova riga, spazio e così via.
Enum | |
---|---|
UNKNOWN |
Tipo di etichetta di interruzione sconosciuto. |
SPACE |
Spazio normale. |
SURE_SPACE |
Spazio sicuro (molto ampio). |
EOL_SURE_SPACE |
Interruzione del ritorno a capo automatico. |
HYPHEN |
Trattino di fine riga non presente nel testo; non si verifica contemporaneamente a SPACE , LEADER_SPACE o LINE_BREAK . |
LINE_BREAK |
Interruzione di riga che termina un paragrafo. |
DetectedLanguage
Lingua rilevata per un componente strutturale.
Campi | |
---|---|
language_code |
Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Affidabilità della lingua rilevata. Intervallo [0, 1]. |
TextProperty
Informazioni aggiuntive rilevate sul componente strutturale.
Campi | |
---|---|
detected_languages[] |
Un elenco delle lingue rilevate insieme al livello di confidenza. |
detected_break |
Rilevato l'inizio o la fine di un segmento di testo. |
TextDetectionParams
Parametri per i rilevamenti di testo. Viene utilizzato per controllare le funzionalità TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
Campi | |
---|---|
enable_text_detection_confidence_score |
Per impostazione predefinita, l'API Cloud Vision include solo il punteggio di confidenza per il risultato DOCUMENT_TEXT_DETECTION. Imposta il flag su true per includere anche il punteggio di confidenza per TEXT_DETECTION. |
advanced_ocr_options[] |
Un elenco di opzioni OCR avanzate per perfezionare il comportamento dell'OCR. |
Vertex
Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate dei vertici sono nella stessa scala dell'immagine originale.
Campi | |
---|---|
x |
Coordinata X. |
y |
Coordinata Y. |
Word
Una rappresentazione di una parola.
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per la parola. |
bounding_box |
Il riquadro di delimitazione della parola. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
symbols[] |
Elenco dei simboli nella parola. L'ordine dei simboli segue l'ordine di lettura naturale. |
confidence |
Affidabilità dei risultati dell'OCR per la parola. Intervallo [0, 1]. |