Riconoscimento ottico dei caratteri (OCR) per un'immagine; riconoscimento del testo e conversione in testo codificato automaticamente. Identifica ed estrae il testo UTF-8 in un'immagine.
Immagini: ottimizzate per aree di testo sparse all'interno di un'immagine più grande.
Risposta: restituisce sia un elenco di parole identificate con testo,
riquadri di delimitazione e textAnnotations, sia la gerarchia
strutturale del testo OCR rilevato (fullTextAnnotation).
Gerarchia della struttura del testo estratta:
TextAnnotation -> Pagina -> Blocca -> Paragrafo -> Parola -> Simbolo.
Ogni componente strutturale da Page in poi può avere ulteriori proprietà come lingue rilevate, interruzioni e così via.
Riconoscimento ottico dei caratteri (OCR) per un file (PDF/TIFF) o un'immagine di testo densa; riconoscimento ottico del testo e conversione in testo codificato automaticamente.
File: ottimizzata per i file di documenti (PDF/TIFF).
Immagini: ottimizzate per aree di testo compatte in un'immagine
(immagini che sono documenti) e immagini che contengono scrittura a mano libera.
Risposta: restituisce la gerarchia strutturale per il testo rilevato dall'OCR (fullTextAnnotation).
Gerarchia della struttura del testo estratta:
TextAnnotation -> Pagina -> Blocca -> Paragrafo -> Parola -> Simbolo.
Ogni componente strutturale da Page in poi può avere ulteriori proprietà come lingue rilevate, interruzioni e così via.
Fornisce annotazioni generali di etichette e riquadro di delimitazione per più oggetti riconosciuti in una singola immagine.
Per ogni oggetto rilevato vengono restituiti i seguenti elementi: una descrizione testuale, un punteggio di affidabilità e vertici normalizzati [0,1] per il poligono di delimitazione attorno all'oggetto.
Fornisce un poligono di delimitazione per l'immagine ritagliata, un punteggio di affidabilità e una frazione di importanza di questa regione importante rispetto all'immagine originale per ogni richiesta.
Puoi fornire fino a 16 valori di proporzioni (larghezza:altezza) per una singola immagine.
Fornisce una serie di contenuti web correlati a un'immagine.
Restituisce le seguenti informazioni:
Entità web: entità dedotte (etichette/descrizioni) da immagini simili sul web.
Immagini corrispondenti complete: un elenco di URL per immagini completamente corrispondenti
di qualsiasi dimensione su Internet.
Immagini corrispondenti parzialmente: un elenco di URL di immagini che condividono caratteristiche chiave, ad esempio una versione ritagliata dell'immagine originale.
Pagine con immagini corrispondenti: un elenco di pagine web (identificate in base all'URL della pagina, al titolo della pagina, all'URL dell'immagine corrispondente) con un'immagine che soddisfi le condizioni descritte sopra.
Immagini visivamente simili: un elenco di URL di immagini che condividono alcune funzionalità con l'immagine originale.
Etichetta più plausibile: la migliore ipotesi in merito all'argomento dell'immagine richiesta dedotta da immagini simili su internet.
Individua i volti con poligoni di delimitazione e identifica "punti di riferimento" specifici del volto, come occhi, orecchie, naso, bocca e così via, insieme ai valori di confidenza corrispondenti.
Restituisce le valutazioni della probabilità per le emozioni
(gioia, dolore, rabbia, sorpresa) e proprietà generali dell'immagine
(sottoesposta, sfocata, presenza di copricapo).
Le valutazioni delle probabilità sono espresse in sei valori diversi: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY o VERY_LIKELY.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2023-12-08 UTC."],[],[]]