AnnotateImageResponse

Risposta a una richiesta di annotazione per l'immagine.

Rappresentazione JSON
{
  "textAnnotations": [
    {
      object (EntityAnnotation)
    }
  ],
  "fullTextAnnotation": {
    object (TextAnnotation)
  },
  "error": {
    object (Status)
  },
  "context": {
    object (ImageAnnotationContext)
  }
}
Campi
textAnnotations[]

object (EntityAnnotation)

Se presente, il rilevamento del testo (OCR) è stato completato correttamente.

fullTextAnnotation

object (TextAnnotation)

Se presente, il rilevamento del testo (OCR) o del testo del documento (OCR) è stato completato correttamente. Questa annotazione fornisce la gerarchia strutturale per il testo rilevato tramite OCR.

error

object (Status)

Se impostato, rappresenta il messaggio di errore per l'operazione. Tieni presente che le annotazioni delle immagini compilate sono garantite come corrette, anche quando è impostato error.

context

object (ImageAnnotationContext)

Se presenti, le informazioni contestuali sono necessarie per capire da dove proviene l'immagine.

EntityAnnotation

Insieme di funzionalità dell'entità rilevata.

Rappresentazione JSON
{
  "mid": string,
  "locale": string,
  "description": string,
  "score": number,
  "confidence": number,
  "topicality": number,
  "boundingPoly": {
    object (BoundingPoly)
  },
  "properties": [
    {
      object (Property)
    }
  ]
}
Campi
mid

string

ID entità opaco. Alcuni ID potrebbero essere disponibili nell'API Google Knowledge Graph Search.

locale

string

Il codice lingua delle impostazioni internazionali in cui è espressa la description testuale dell'entità.

description

string

Descrizione testuale dell'entità, espressa nella lingua locale.

score

number

Punteggio complessivo del risultato. Intervallo [0, 1].

confidence
(deprecated)

number

Ritirato. Usa invece score. La precisione del rilevamento delle entità in un'immagine. Ad esempio, per un'immagine in cui viene rilevata l'entità "Torre Eiffel", questo campo rappresenta la certezza che nell'immagine della query sia presente una torre. Intervallo [0, 1].

topicality

number

La pertinenza dell'etichetta ICA (annotazione dei contenuti delle immagini) rispetto all'immagine. Ad esempio, la pertinenza di "torre" è probabilmente maggiore per un'immagine contenente la "Torre Eiffel" rilevata rispetto a un'immagine contenente un edificio torreggiante distante rilevato, anche se la confidenza che ci sia una torre in ogni immagine potrebbe essere la stessa. Intervallo [0, 1].

boundingPoly

object (BoundingPoly)

La regione dell'immagine a cui appartiene questa entità. Non prodotto per le funzionalità di LABEL_DETECTION.

properties[]

object (Property)

Alcune entità potrebbero avere campi Property (nome/valore) facoltativi forniti dall'utente, ad esempio un punteggio o una stringa che qualifica l'entità.

BoundingPoly

Un poligono di delimitazione per l'annotazione dell'immagine rilevata.

Rappresentazione JSON
{
  "vertices": [
    {
      object (Vertex)
    }
  ],
  "normalizedVertices": [
    {
      object (NormalizedVertex)
    }
  ]
}
Campi
vertices[]

object (Vertex)

I vertici del poligono di delimitazione.

normalizedVertices[]

object (NormalizedVertex)

I vertici normalizzati del poligono di delimitazione.

Vertex

Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate dei vertici sono nella stessa scala dell'immagine originale.

Rappresentazione JSON
{
  "x": integer,
  "y": integer
}
Campi
x

integer

Coordinata X.

y

integer

Coordinata Y.

NormalizedVertex

Un vertice rappresenta un punto 2D nell'immagine. NOTA: le coordinate normalizzate dei vertici sono relative all'immagine originale e vanno da 0 a 1.

Rappresentazione JSON
{
  "x": number,
  "y": number
}
Campi
x

number

Coordinata X.

y

number

Coordinata Y.

Proprietà

Un Property è costituito da una coppia nome/valore fornita dall'utente.

Rappresentazione JSON
{
  "name": string,
  "value": string,
  "uint64Value": string
}
Campi
name

string

Il nome della proprietà.

value

string

Valore della proprietà.

uint64Value

string

Valore delle proprietà numeriche.

TextAnnotation

TextAnnotation contiene una rappresentazione strutturata del testo estratto tramite OCR. La gerarchia di una struttura di testo estratta con l'OCR è la seguente:

TextAnnotation-> Pagina -> Blocco -> Paragrafo -> Parola -> Simbolo

Ogni componente strutturale, a partire dalla pagina, può avere proprietà che descrivono lingue, interruzioni e così via rilevate. Per ulteriori informazioni, consulta la definizione del messaggio TextAnnotation.TextProperty riportata di seguito.

Rappresentazione JSON
{
  "pages": [
    {
      object (Page)
    }
  ],
  "text": string
}
Campi
pages[]

object (Page)

Elenco delle pagine rilevate dall'OCR.

text

string

Testo UTF-8 rilevato nelle pagine.

Pagina

Pagina rilevata tramite OCR.

Rappresentazione JSON
{
  "property": {
    object (TextProperty)
  },
  "width": integer,
  "height": integer,
  "blocks": [
    {
      object (Block)
    }
  ],
  "confidence": number
}
Campi
property

object (TextProperty)

Sono state rilevate informazioni aggiuntive sulla pagina.

width

integer

Larghezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel.

height

integer

Altezza della pagina. Per i PDF, l'unità è punti. Per le immagini (inclusi i TIFF), l'unità è pixel.

blocks[]

object (Block)

Elenco di blocchi di testo, immagini e così via in questa pagina.

confidence

number

Affidabilità dei risultati dell'OCR nella pagina. Intervallo [0, 1].

TextProperty

Informazioni aggiuntive rilevate sul componente strutturale.

Rappresentazione JSON
{
  "detectedLanguages": [
    {
      object (DetectedLanguage)
    }
  ],
  "detectedBreak": {
    object (DetectedBreak)
  }
}
Campi
detectedLanguages[]

object (DetectedLanguage)

Un elenco delle lingue rilevate insieme al livello di confidenza.

detectedBreak

object (DetectedBreak)

Rilevato l'inizio o la fine di un segmento di testo.

DetectedLanguage

Lingua rilevata per un componente strutturale.

Rappresentazione JSON
{
  "languageCode": string,
  "confidence": number
}
Campi
languageCode

string

Il codice lingua BCP-47, ad esempio "en-US" o "sr-Latn". Per ulteriori informazioni, visita la pagina https://www.unicode.org/reports/tr35/#Unicode_locale_identifier.

confidence

number

Affidabilità della lingua rilevata. Intervallo [0, 1].

DetectedBreak

Rilevato l'inizio o la fine di un componente strutturale.

Rappresentazione JSON
{
  "type": enum (BreakType),
  "isPrefix": boolean
}
Campi
type

enum (BreakType)

Tipo di interruzione rilevato.

isPrefix

boolean

True se l'interruzione precede l'elemento.

BreakType

Enumerazione per indicare il tipo di pausa trovato. Nuova riga, spazio e così via.

Enum
UNKNOWN Tipo di etichetta di interruzione sconosciuto.
SPACE Spazio normale.
SURE_SPACE Spazio sicuro (molto ampio).
EOL_SURE_SPACE Interruzione del ritorno a capo automatico.
HYPHEN Trattino di fine riga non presente nel testo; non si verifica contemporaneamente a SPACE, LEADER_SPACE o LINE_BREAK.
LINE_BREAK Interruzione di riga che termina un paragrafo.

Blocca

Elemento logico della pagina.

Rappresentazione JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "paragraphs": [
    {
      object (Paragraph)
    }
  ],
  "blockType": enum (BlockType),
  "confidence": number
}
Campi
property

object (TextProperty)

Sono state rilevate informazioni aggiuntive per il blocco.

boundingBox

object (BoundingPoly)

Il riquadro di delimitazione del blocco. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio:

  • Quando il testo è orizzontale, potrebbe essere visualizzato nel seguente modo:
    0----1
    |    |
    3----2
  • quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa:
    2----3
    |    |
    1----0

e l'ordine dei vertici sarà ancora (0, 1, 2, 3).

paragraphs[]

object (Paragraph)

Elenco dei paragrafi in questo blocco (se il blocco è di tipo testo).

blockType

enum (BlockType)

Il tipo di blocco rilevato (testo, immagine e così via) per questo blocco.

confidence

number

Affidabilità dei risultati dell'OCR sul blocco. Intervallo [0, 1].

Paragrafo

Unità strutturale di testo che rappresenta un numero di parole in un determinato ordine.

Rappresentazione JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "words": [
    {
      object (Word)
    }
  ],
  "confidence": number
}
Campi
property

object (TextProperty)

Sono state rilevate informazioni aggiuntive per il paragrafo.

boundingBox

object (BoundingPoly)

Il riquadro di delimitazione del paragrafo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

words[]

object (Word)

Elenco di tutte le parole in questo paragrafo.

confidence

number

Affidabilità dei risultati dell'OCR per il paragrafo. Intervallo [0, 1].

Word

Una rappresentazione di una parola.

Rappresentazione JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "symbols": [
    {
      object (Symbol)
    }
  ],
  "confidence": number
}
Campi
property

object (TextProperty)

Sono state rilevate informazioni aggiuntive per la parola.

boundingBox

object (BoundingPoly)

Il riquadro di delimitazione della parola. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

symbols[]

object (Symbol)

Elenco dei simboli nella parola. L'ordine dei simboli segue l'ordine di lettura naturale.

confidence

number

Affidabilità dei risultati dell'OCR per la parola. Intervallo [0, 1].

Simbolo

Una singola rappresentazione simbolica.

Rappresentazione JSON
{
  "property": {
    object (TextProperty)
  },
  "boundingBox": {
    object (BoundingPoly)
  },
  "text": string,
  "confidence": number
}
Campi
property

object (TextProperty)

Sono state rilevate informazioni aggiuntive per il simbolo.

boundingBox

object (BoundingPoly)

Il riquadro di delimitazione del simbolo. I vertici sono nell'ordine in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra. Quando viene rilevata una rotazione del riquadro di delimitazione, questa viene rappresentata attorno all'angolo in alto a sinistra, come definito quando il testo viene letto nell'orientamento "naturale". Ad esempio: * quando il testo è orizzontale, potrebbe essere simile a: 0----1 | | 3----2 * quando viene ruotato di 180 gradi intorno all'angolo in alto a sinistra, diventa: 2----3 | | 1----0 e l'ordine dei vertici sarà comunque (0, 1, 2, 3).

text

string

La rappresentazione UTF-8 effettiva del simbolo.

confidence

number

Affidabilità dei risultati dell'OCR per il simbolo. Intervallo [0, 1].

BlockType

Tipo di blocco (testo, immagine e così via) identificato dall'OCR.

Enum
UNKNOWN Tipo di blocco sconosciuto.
TEXT Blocco di testo normale.
TABLE Blocco tabella.
PICTURE Blocco immagine.
RULER Casella per linee orizzontali/verticali.
BARCODE Blocco del codice a barre.

ImageAnnotationContext

Se un'immagine è stata prodotta da un file (ad es. un PDF), questo messaggio fornisce informazioni sull'origine dell'immagine.

Rappresentazione JSON
{
  "uri": string,
  "pageNumber": integer
}
Campi
uri

string

L'URI del file utilizzato per produrre l'immagine.

pageNumber

integer

Se il file era un PDF o un TIFF, questo campo indica il numero di pagina all'interno del file utilizzato per produrre l'immagine.