Questa pagina è stata tradotta dall'API Cloud Translation.

Elenco delle funzionalità

L'API Vision attualmente ti consente di utilizzare le seguenti funzionalità:

Tutti i tipi di funzionalità
Rilevamento del testo	Riconoscimento ottico dei caratteri (OCR) per un'immagine; riconoscimento del testo e conversione in testo codificato automaticamente. Identifica ed estrae il testo UTF-8 in un'immagine. Immagini: ottimizzate per aree di testo sparse all'interno di un'immagine più grande. Risposta: restituisce sia un elenco di parole identificate con testo, riquadri di selezione e `textAnnotations`, sia la gerarchia strutturale per il testo rilevato dall'OCR (`fullTextAnnotation`). Gerarchia della struttura del testo estratto: TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. Ogni componente strutturale di Page on può avere ulteriori proprietà, come lingue rilevate, interruzioni e così via. Lingue supportate: funziona con le lingue attualmente supportate, mappate e sperimentali. Valore enum della funzionalità: `TEXT_DETECTION`.
Rilevamento del testo del documento (testo denso / scrittura a mano libera)	Riconoscimento ottico dei caratteri (OCR) per un file (PDF/TIFF) o un'immagine di testo ad alta densità; riconoscimento del testo ad alta densità e conversione in testo codificato automaticamente. File: ottimizzato per i file di documenti (PDF/TIFF). Immagini: ottimizzate per aree di testo *dense* in un'immagine (immagini che sono documenti) e immagini che contengono scrittura a mano libera. Risposta: restituisce la gerarchia strutturale per il testo rilevato tramite OCR (`fullTextAnnotation`). Gerarchia della struttura del testo estratto: TextAnnotation -> Page -> Block -> Paragraph -> Word -> Symbol. Ogni componente strutturale di Page on può avere ulteriori proprietà, come lingue rilevate, interruzioni e così via. Lingue supportate: funziona con le lingue attualmente supportate, mappate e sperimentali. Valore enum della funzionalità: `DOCUMENT_TEXT_DETECTION`. Ha la precedenza quando vengono richiesti sia `DOCUMENT_TEXT_DETECTION` che `TEXT_DETECTION`. Se rilevi testo in documenti scansionati, prova Document AI per il riconoscimento ottico dei caratteri, l'analisi strutturata dei moduli e l'estrazione delle entità. Puoi utilizzare Document AI Toolbox per convertire l'output dal formato Document AI al formato Cloud Vision.
Rilevamento di punti di riferimento ¹	Fornisce il nome del punto di riferimento, un punteggio di confidenza e un riquadro di delimitazione nell'immagine per il punto di riferimento. Fornisce le coordinate dell'entità rilevata.
Rilevamento dei loghi ²	Fornisce una descrizione testuale dell'entità identificata, un punteggio di confidenza e un poligono di delimitazione per il logo nel file.
Rilevamento delle etichette ³	Fornisce etichette generalizzate per un'immagine. Per ogni etichetta restituisce una descrizione testuale, un punteggio di affidabilità e un indice di attualità.
Proprietà immagini ⁴	Restituisce i colori dominanti in un'immagine. Ogni colore è rappresentato nello spazio colore RGBA, ha un punteggio di confidenza e mostra la frazione di pixel occupati dal colore [0, 1].
Localizzazione degli oggetti ⁵	Fornisce annotazioni generali di etichette e riquadro di delimitazione per più oggetti riconosciuti in una singola immagine. Per ogni oggetto rilevato vengono restituiti i seguenti elementi: una descrizione testuale, un punteggio di confidenza e vertici normalizzati [0,1] per il poligono di delimitazione intorno all'oggetto. Hai bisogno di un rilevamento di oggetti personalizzato? Con AutoML Vision Object Detection puoi creare un modello di machine learning personalizzato per il tuo caso d'uso specifico di rilevamento di oggetti nelle immagini.
Rilevamento suggerimenti di ritaglio ⁶	Fornisce un poligono di delimitazione per l'immagine ritagliata, un punteggio di confidenza e una frazione di importanza di questa regione saliente rispetto all'immagine originale per ogni richiesta. Puoi fornire fino a 16 valori di proporzioni dell'immagine (larghezza:altezza) per una singola immagine.
Entità e pagine web ⁷	Fornisce una serie di contenuti web correlati a un'immagine. Restituisce le seguenti informazioni: Entità web: entità dedotte (etichette/descrizioni) da immagini simili sul web. Immagini con corrispondenza esatta: un elenco di URL per immagini con corrispondenza esatta di qualsiasi dimensione su internet. Immagini con corrispondenza parziale: un elenco di URL di immagini che condividono caratteristiche dei punti chiave, ad esempio una versione ritagliata dell'immagine originale. Pagine con immagini corrispondenti: un elenco di pagine web (identificate da URL pagina, titolo della pagina, URL immagine corrispondente) con un'immagine che soddisfa le condizioni descritte sopra. Immagini visivamente simili: un elenco di URL di immagini che condividono alcune caratteristiche con l'immagine originale. Etichetta della migliore ipotesi: la migliore ipotesi sull'argomento dell'immagine richiesta dedotta da immagini simili su internet.
Rilevamento di contenuti espliciti (SafeSearch)	Fornisce valutazioni di probabilità per le seguenti categorie di contenuti espliciti: `adult`, `spoof`, `medical`, `violence` e `racy`. Le valutazioni di probabilità sono espresse come 6 valori diversi: `UNKNOWN`, `VERY_UNLIKELY`, `UNLIKELY`, `POSSIBLE`, `LIKELY` o `VERY_LIKELY`.
Rilevamento facciale	Individua i volti con poligoni di delimitazione e identifica punti di riferimento facciali specifici, come occhi, orecchie, naso, bocca e così via, insieme ai valori di confidenza corrispondenti. Restituisce valutazioni della probabilità di reso per l'emozione (gioia, tristezza, rabbia, sorpresa) e le proprietà generali dell'immagine (sottoesposta, sfocata, presenza di copricapo). Le valutazioni di probabilità sono espresse come 6 valori diversi: `UNKNOWN`, `VERY_UNLIKELY`, `UNLIKELY`, `POSSIBLE`, `LIKELY` o `VERY_LIKELY`. Specific individual Facial Recognition is not supported.

^{1.
Attribuzione immagine:
Nikolay Vorobyev su
Unsplash (annotazioni aggiunte).
↩}

^{2.
Riconoscimento immagine:
Robert Scoble
(CC BY 2.0, annotazione aggiunta).
↩}

^{3.
Crediti immagine:
Alex Knight su Unsplash.
↩}

^{4.
Crediti immagine:
Jeremy Bishop su Unsplash.
↩}

^{5.
Credito immagine:
Bogdan Dada su Unsplash
(annotazioni aggiunte).
↩}

^{6.
Attribuzione dell'immagine:

Yasmin Dangor su Unsplash (immagine originale e ritagliata mostrata).
↩}

^{7.
Crediti immagine:
Quinten de Graaf su
Unsplash.
↩}