Riconoscimento ottico dei caratteri (OCR) per un'immagine; riconoscimento del testo e conversione in testo codificato automaticamente. Identifica ed estrae il testo UTF-8 in un'immagine.
Immagini: ottimizzate per aree di testo sparso all'interno di un'immagine più grande.
Risposta: restituisce sia un elenco di parole identificate con testo, bounding box e textAnnotations, sia la gerarchia strutturale per il testo rilevato dall'OCR (fullTextAnnotation).
Gerarchia della struttura del testo estratta:
Annotazione testo -> Pagina -> Blocco -> Paragrafo -> Parola -> Simbolo.
Ogni componente strutturale di Page on può avere inoltre le proprie proprietà, come le lingue rilevate, le interruzioni e così via.
Riconoscimento ottico dei caratteri (OCR) per un file (PDF/TIFF) o un'immagine con testo ad alta densità; riconoscimento e conversione del testo ad alta densità in testo codificato automaticamente.
File: ottimizzato per i file di documenti (PDF/TIFF).
Immagini: ottimizzate per aree di testo fitte in un'immagine (immagini che sono documenti) e immagini che contengono scrittura a mano libera.
Risposta: restituisce la gerarchia strutturale per il testo rilevato dall'OCR (fullTextAnnotation).
Gerarchia della struttura del testo estratta:
Annotazione testo -> Pagina -> Blocco -> Paragrafo -> Parola -> Simbolo.
Ogni componente strutturale di Page on può avere inoltre le proprie proprietà, come le lingue rilevate, le interruzioni e così via.
Fornisce annotazioni generali di etichette e riquadro di delimitazione per più oggetti
riconosciuti in una singola immagine.
Per ogni oggetto rilevato vengono restituiti i seguenti elementi: una descrizione text, un punteggio di affidabilità e vertici normalizzati [0,1] per il poligono di delimitazione attorno all'oggetto.
Fornisce un poligono di delimitazione per l'immagine ritagliata, un punteggio di confidenza
e una frazione di importanza di questa regione saliente rispetto all'immagine
originale per ogni richiesta.
Puoi fornire fino a 16 valori del rapporto immagine (larghezza:altezza) per una singola immagine.
Fornisce una serie di contenuti web correlati a un'immagine.
Restituisce le seguenti informazioni:
Entità web: entità dedotte (etichette/descrizioni) da
immagini simili sul web.
Immagini con corrispondenza completa: un elenco di URL di immagini con corrispondenza completa
di qualsiasi dimensione su internet.
Immagini con corrispondenza parziale: un elenco di URL di immagini che condividono elementi chiave, ad esempio una versione ritagliata dell'immagine originale.
Pagine con immagini corrispondenti: un elenco di pagine web (identificate dall'URL pagina, dal titolo pagina e dall'URL immagine corrispondente) con un'immagine che soddisfa le condizioni descritte sopra.
Immagini visivamente simili: un elenco di URL di immagini che condividono alcune caratteristiche con l'immagine originale.
Etichetta di stima migliore: una stima migliore dell'argomento dell'immagine richiesta dedotta da immagini simili su internet.
Individua i volti con poligoni di delimitazione e identifica "punti di riferimento" facciali specifici come occhi, orecchie, naso, bocca e così via, insieme ai relativi valori di affidabilità.
Restituisce valutazioni di probabilità per le emozioni
(gioia, tristezza, rabbia, sorpresa) e proprietà generali delle immagini
(sottoesposte, sfocate, presenza di copricapo).
Le valutazioni delle probabilità sono espresse
come 6 valori diversi: UNKNOWN, VERY_UNLIKELY,
UNLIKELY, POSSIBLE, LIKELY o
VERY_LIKELY.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2024-12-21 UTC."],[],[]]