Risposta a una richiesta di annotazione per l'immagine.
Rappresentazione JSON |
---|
{ "textAnnotations": [ { object ( |
Campi | |
---|---|
textAnnotations[] |
Se presente, il rilevamento del testo (OCR) è stato completato correttamente. |
fullTextAnnotation |
Se presente, il rilevamento del testo (OCR) o del testo del documento (OCR) è stato completato correttamente. Questa annotazione fornisce la gerarchia strutturale per il testo rilevato tramite OCR. |
error |
Se impostato, rappresenta il messaggio di errore per l'operazione. Tieni presente che le annotazioni delle immagini compilate sono garantite come corrette, anche quando è impostato |
context |
Se presenti, le informazioni contestuali sono necessarie per capire da dove proviene l'immagine. |
EntityAnnotation
Insieme di funzionalità dell'entità rilevata.
Rappresentazione JSON |
---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
Campi | |
---|---|
mid |
ID entità opaco. Alcuni ID potrebbero essere disponibili nell'API Google Knowledge Graph Search. |
locale |
Il codice lingua delle impostazioni internazionali in cui è espressa la |
description |
Descrizione testuale dell'entità, espressa nella lingua |
score |
Punteggio complessivo del risultato. Intervallo [0, 1]. |
confidence |
Ritirato. Usa invece |
topicality |
La pertinenza dell'etichetta ICA (annotazione dei contenuti delle immagini) rispetto all'immagine. Ad esempio, la pertinenza di "torre" è probabilmente maggiore per un'immagine contenente la "Torre Eiffel" rilevata rispetto a un'immagine contenente un edificio torreggiante distante rilevato, anche se la confidenza che ci sia una torre in ogni immagine potrebbe essere la stessa. Intervallo [0, 1]. |
boundingPoly |
La regione dell'immagine a cui appartiene questa entità. Non prodotto per le funzionalità di |
properties[] |
Alcune entità potrebbero avere campi |
BoundingPoly
Un poligono di delimitazione per l'annotazione dell'immagine rilevata.
Rappresentazione JSON |
---|
{ "vertices": [ { object ( |
Campi | |
---|---|
vertices[] |
I vertici del poligono di delimitazione. |
normalizedVertices[] |
I vertici normalizzati del poligono di delimitazione. |
Vertex
Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate dei vertici sono nella stessa scala dell'immagine originale.
Rappresentazione JSON |
---|
{ "x": integer, "y": integer } |
Campi | |
---|---|
x |
Coordinata X. |
y |
Coordinata Y. |
NormalizedVertex
Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate normalizzate dei vertici sono relative all'immagine originale e vanno da 0 a 1.
Rappresentazione JSON |
---|
{ "x": number, "y": number } |
Campi | |
---|---|
x |
Coordinata X. |
y |
Coordinata Y. |
Proprietà
Un Property
è costituito da una coppia nome/valore fornita dall'utente.
Rappresentazione JSON |
---|
{ "name": string, "value": string, "uint64Value": string } |
Campi | |
---|---|
name |
Il nome della proprietà. |
value |
Valore della proprietà. |
uint64Value |
Valore delle proprietà numeriche. |
TextAnnotation
TextAnnotation
contiene una rappresentazione strutturata del testo estratto tramite OCR. La gerarchia di una struttura di testo estratta con l'OCR è la seguente:
TextAnnotation
-> Pagina -> Blocco -> Paragrafo -> Parola -> Simbolo
TextAnnotation.TextProperty
riportata di seguito.
Rappresentazione JSON |
---|
{
"pages": [
{
object ( |
Campi | |
---|---|
pages[] |
Elenco delle pagine rilevate dall'OCR. |
text |
Testo UTF-8 rilevato nelle pagine. |
Pagina
Pagina rilevata tramite OCR.
Rappresentazione JSON |
---|
{ "property": { object ( |
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive sulla pagina. |
width |
Larghezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel. |
height |
Altezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel. |
blocks[] |
Elenco di blocchi di testo, immagini e così via in questa pagina. |
confidence |
Affidabilità dei risultati dell'OCR nella pagina. Intervallo [0, 1]. |
TextProperty
Informazioni aggiuntive rilevate sul componente strutturale.
Rappresentazione JSON |
---|
{ "detectedLanguages": [ { object ( |
Campi | |
---|---|
detectedLanguages[] |
Un elenco delle lingue rilevate insieme al livello di confidenza. |
detectedBreak |
Rilevato l'inizio o la fine di un segmento di testo. |
DetectedLanguage
Lingua rilevata per un componente strutturale.
Rappresentazione JSON |
---|
{ "languageCode": string, "confidence": number } |
Campi | |
---|---|
languageCode |
Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Affidabilità della lingua rilevata. Intervallo [0, 1]. |
DetectedBreak
Rilevato l'inizio o la fine di un componente strutturale.
Rappresentazione JSON |
---|
{
"type": enum ( |
Campi | |
---|---|
type |
Tipo di interruzione rilevato. |
isPrefix |
True se l'interruzione precede l'elemento. |
BreakType
Enumerazione per indicare il tipo di pausa trovato. Nuova riga, spazio e così via.
Enum | |
---|---|
UNKNOWN |
Tipo di etichetta di interruzione sconosciuto. |
SPACE |
Spazio normale. |
SURE_SPACE |
Spazio sicuro (molto ampio). |
EOL_SURE_SPACE |
Interruzione del ritorno a capo automatico. |
HYPHEN |
Trattino di fine riga non presente nel testo; non si verifica contemporaneamente a SPACE , LEADER_SPACE o LINE_BREAK . |
LINE_BREAK |
Interruzione di riga che termina un paragrafo. |
Blocca
Elemento logico della pagina.
Rappresentazione JSON |
---|
{ "property": { object ( |
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il blocco. |
boundingBox |
Il riquadro di delimitazione del blocco. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio:
e l'ordine dei vertici sarà ancora (0, 1, 2, 3). |
paragraphs[] |
Elenco dei paragrafi in questo blocco (se il blocco è di tipo testo). |
blockType |
Il tipo di blocco rilevato (testo, immagine e così via) per questo blocco. |
confidence |
Affidabilità dei risultati dell'OCR sul blocco. Intervallo [0, 1]. |
Paragrafo
Unità strutturale di testo che rappresenta un numero di parole in un determinato ordine.
Rappresentazione JSON |
---|
{ "property": { object ( |
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il paragrafo. |
boundingBox |
Il riquadro di delimitazione del paragrafo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
words[] |
Elenco di tutte le parole in questo paragrafo. |
confidence |
Affidabilità dei risultati dell'OCR per il paragrafo. Intervallo [0, 1]. |
Word
Una rappresentazione di una parola.
Rappresentazione JSON |
---|
{ "property": { object ( |
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per la parola. |
boundingBox |
Il riquadro di delimitazione della parola. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
symbols[] |
Elenco dei simboli nella parola. L'ordine dei simboli segue l'ordine di lettura naturale. |
confidence |
Affidabilità dei risultati dell'OCR per la parola. Intervallo [0, 1]. |
Simbolo
Una singola rappresentazione simbolica.
Rappresentazione JSON |
---|
{ "property": { object ( |
Campi | |
---|---|
property |
Sono state rilevate informazioni aggiuntive per il simbolo. |
boundingBox |
Il riquadro di delimitazione del simbolo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3). |
text |
La rappresentazione UTF-8 effettiva del simbolo. |
confidence |
Affidabilità dei risultati dell'OCR per il simbolo. Intervallo [0, 1]. |
BlockType
Tipo di blocco (testo, immagine e così via) identificato dall'OCR.
Enum | |
---|---|
UNKNOWN |
Tipo di blocco sconosciuto. |
TEXT |
Blocco di testo normale. |
TABLE |
Blocco tabella. |
PICTURE |
Blocco immagine. |
RULER |
Casella per linee orizzontali/verticali. |
BARCODE |
Blocco del codice a barre. |
ImageAnnotationContext
Se un'immagine è stata prodotta da un file (ad es. un PDF), questo messaggio fornisce informazioni sull'origine dell'immagine.
Rappresentazione JSON |
---|
{ "uri": string, "pageNumber": integer } |
Campi | |
---|---|
uri |
L'URI del file utilizzato per produrre l'immagine. |
pageNumber |
Se il file era un PDF o un TIFF, questo campo indica il numero di pagina all'interno del file utilizzato per produrre l'immagine. |