Cette page a été traduite par l'API Cloud Translation.
Switch to English

Liste des fonctionnalités

L'API Cloud Vision vous permet actuellement d'utiliser les fonctionnalités suivantes :

Tous les types de fonctionnalités

Détection de visages 1

image montrant deux visages avec et sans annotations
  • Elle identifie les visages à l'aide de polygones de délimitation et identifie des "marques" de visage spécifiques comme des yeux, des oreilles, du nez, de la bouche, etc., ainsi que leurs valeurs de confiance correspondantes.
  • Renvoie les notes de probabilité pour l'émotion (joie, tristesse, colère, surprise) et les propriétés générales de l'image (sous-exposées, floues, lunettes ou casquette).
  • Les notes de probabilité sont exprimées sous la forme de six valeurs différentes: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY ou VERY_LIKELY.

Détection de points de repère 2

image de la Cathédrale Saint-Basile-le-Bienheureux
  • Affiche le nom du point de repère, un score de confiance et un cadre de délimitation du point de repère sur l'image.
  • Indique les coordonnées de l'entité détectée.

Détection de logos 3

logo annoté
  • Affiche une description textuelle de l'entité identifiée, un score de confiance et un polygone de délimitation du logo dans le fichier.

Détection de thèmes 4

image d'une rue de Shanghai
  • Fournit des thèmes généralisés pour une image.
  • Pour chaque étiquette, vous obtenez une description textuelle, un score de confiance et une note de pertinence du thème.

Détection de texte

Image d'un panneau de signalisation
  • Reconnaissance optique des caractères (OCR) pour une image la reconnaissance de texte et la conversion en texte codé par machine. Identifie et extrait le texte UTF-8 dans une image.
  • Images: optimisé pour les zones de texte épars dans une image plus grande.
  • Réponse: affiche une liste de mots correspondant à du texte, à des cadres de délimitation et à textAnnotations, ainsi qu'à la hiérarchie structurelle du texte détecté avec la reconnaissance optique des caractères (fullTextAnnotation).
    • Hiérarchie de la structure du texte extrait :
      • TextAnnotation -> Page -> Bloc -> Paragraphe -> Mot -> Symbole.
      • Chaque composant structurel à partir de la page peut avoir ses propres propriétés, telles que les langues détectées, les sauts, etc.
  • Langues acceptées: fonctionne avec les langues acceptées, mappées et expérimentales.
  • Valeur d'énumération de la fonctionnalité : TEXT_DETECTION.

Détection de documents texte (texte dense / écriture manuscrite)

Image dense avec annotations
Image manuscrite
  • Reconnaissance optique de caractères (OCR) pour un fichier (PDF/TIFF) ou une image de texte dense. la reconnaissance de texte dense et la conversion en texte codé par machine.
  • Fichiers : optimisé pour les fichiers de document (PDF/TIFF).
  • Images: optimisé pour les zones de texte dense dans une image (images correspondant à des documents) et les images contenant du texte manuscrit.
  • Réponse: affiche la hiérarchie structurelle du texte détecté avec la reconnaissance optique des caractères (fullTextAnnotation).
    • Hiérarchie de la structure du texte extrait :
      • TextAnnotation -> Page -> Bloc -> Paragraphe -> Mot -> Symbole.
      • Chaque composant structurel à partir de la page peut avoir ses propres propriétés, telles que les langues détectées, les sauts, etc.
  • Langues acceptées: fonctionne avec les langues acceptées, mappées et expérimentales.
  • Valeur d'énumération de la fonctionnalité : DOCUMENT_TEXT_DETECTION.
    • Prioritaire lorsque DOCUMENT_TEXT_DETECTION et TEXT_DETECTION sont demandés.

Propriétés des images 5

image de Bali avec des propriétés
  • Renvoie les couleurs dominantes d'une image.
  • Chaque couleur est représentée dans l'espace colorimétrique RVB et présente un score de confiance et affiche la fraction des pixels occupés par la couleur [0, 1].

Localisation d'objets 6

image avec cadres de délimitation
  • Fournit des annotations générales et des cadres de délimitation pour plusieurs objets reconnus dans une seule image.
  • Pour chaque objet détecté, les éléments suivants sont renvoyés: une description textuelle, un score de confiance et des sommets normalisés [0,1] pour le polygone de délimitation autour de l'objet.

Détection des suggestions de recadrage 7

image avec version recadrée
  • Elle fournit un polygone de délimitation pour l'image recadrée, un score de confiance et une fraction d'importance de cette région saillante pour l'image d'origine pour chaque requête.
  • Vous pouvez fournir jusqu'à 16 valeurs de ratio d'image (largeur:hauteur) pour une seule image.

Entités et pages Web 8

image avec tableau d'entités Web
  • Fournit une série de contenus Web associés à une image.
  • Renvoie les informations suivantes :
    • Entités Web: entités inférées (libellés/descriptions) à partir d'images similaires sur le Web.
    • Images à correspondance complète: liste des URL d'images parfaitement correspondantes de toute taille sur Internet.
    • Images à correspondance partielle: liste des URL des images qui partagent des caractéristiques de points clés, telles qu'une version recadrée de l'image d'origine.
    • Pages avec des images correspondantes: liste de pages Web (identifiées par l'URL de la page, titre de la page, URL de l'image correspondante) avec une image conforme aux conditions décrites ci-dessus.
    • Images similaires: liste des URL des images qui partagent certains éléments avec l'image d'origine.
    • Thème le plus probable: hypothèse la plus probable du sujet de l'image demandée, déduit à partir d'images similaires sur Internet.

Détection de contenu explicite (SafeSearch)

  • Fournit des scores de probabilité pour les catégories de contenu explicite suivantes: adult, spoof, medical, violence et racy.
  • Les notes de probabilité sont exprimées sous la forme de six valeurs différentes: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY ou VERY_LIKELY.

1. Crédit image : Himanshu Singh Gurjar sur Unsplash (annotations ajoutées).

2. Crédit image : Nikolay Vorobyev sur Unsplash (annotations ajoutées).

3. Crédit image : Robert Scoble (CC BY 2.0, annotation ajoutée).

4. Crédit image : Alex Knight sur Unsplash.

5. Crédit image : Jeremy Bishop sur Unsplash.

6. Crédit image : Bogdan Dada sur Unsplash (annotations ajoutées).

7. Crédit image : Yasmin Dangor sur Unsplash (image d'origine et image recadrée affichées).

8. Crédit image : Quinten de Graaf sur Unsplash.