Détecter des libellés

L'API Vision peut détecter et extraire des informations sur les entités d'une image, dans un large groupe de catégories.

Les libellés peuvent identifier des objets, des lieux, des activités, des espèces animales, des produits, etc.

Les libellés ne sont renvoyés qu'en anglais. L'API Cloud Translation peut traduire les thèmes en anglais dans plusieurs autres langues.

Par exemple, l'image ci-dessus peut correspondre à la liste de libellés suivante :

Description Score
Ferris wheel (grande roue) 0,84832066
Amusement park (parc d'attractions) 0,8101249
Night (nuit) 0,8036025
Outdoor recreation (loisirs de plein air) 0,68825835
Fair (acceptable) 0,6566326

Exemples de code

Pour des exemples dans plusieurs langages de programmation, reportez-vous aux exemples suivants :

Requêtes de détection de libellés

Configurer votre authentification et votre projet GCP

Détecter des thèmes

PowerShell

Pour exécuter une requête de détection de thèmes à l'aide de Windows PowerShell, envoyez une requête POST au point de terminaison https://vision.googleapis.com/v1/images:annotate et spécifiez LABEL_DETECTION comme valeur de features.type, comme indiqué dans l'exemple suivant :

$cred = gcloud auth application-default print-access-token
$headers = @{ Authorization = "Bearer $cred" }

Invoke-WebRequest `
  -Method Post `
  -Headers $headers `
  -ContentType: "application/json; charset=utf-8" `
  -Body "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" `
  -Uri "https://vision.googleapis.com/v1/images:annotate" | Select-Object -Expand Content

Les images peuvent être transmises de trois manières différentes : en tant que chaîne codée en base64, en tant qu'URI Google Cloud Storage, ou en tant qu'URL HTTPS ou HTTP accessible au public. Consultez la section Envoyer des requêtes pour plus d'informations.

Pour en savoir plus sur la configuration du corps de la requête, consultez la documentation de référence sur AnnotateImageRequest.

Commande curl

Pour exécuter une requête de détection de libellés à l'aide de curl à partir de l'outil de ligne de commande Linux ou MacOS, envoyez une requête POST au point de terminaison https://vision.googleapis.com/v1/images:annotate et spécifiez LABEL_DETECTION comme valeur de features.type, comme indiqué dans l'exemple suivant :

curl -X POST \
     -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     --data "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" "https://vision.googleapis.com/v1/images:annotate"

Les images peuvent être transmises de trois manières différentes : en tant que chaîne codée en base64, en tant qu'URI Google Cloud Storage, ou en tant qu'URL HTTPS ou HTTP accessible au public. Consultez la section Envoyer des requêtes pour plus d'informations.

Pour en savoir plus sur la configuration du corps de la requête, consultez la documentation de référence sur AnnotateImageRequest.

COMMANDE GCLOUD

Pour détecter les thèmes d'une image, exécutez la commande gcloud ml vision detect-labels comme indiqué dans l'exemple suivant :

gcloud ml vision detect-labels https://cloud.google.com/vision/docs/images/ferris-wheel.jpg

Réponses de la détection de libellés

Si la requête aboutit, le serveur renvoie un code d'état HTTP 200 OK ainsi que la réponse au format JSON.

Une réponse LABEL_DETECTION comprend les libellés détectés, leur score et un ID de libellé opaque :

{
  "responses": [
    {
      "labelAnnotations": [
        {
          "mid": "/m/017rgb",
          "description": "ferris wheel",
          "score": 0.84832066
        },
        {
          "mid": "/m/010jjr",
          "description": "amusement park",
          "score": 0.8101249
        },
        {
          "mid": "/m/01d74z",
          "description": "night",
          "score": 0.8036025
        },
        {
          "mid": "/m/05b0n7k",
          "description": "outdoor recreation",
          "score": 0.68825835
        },
        {
          "mid": "/m/02jf28",
          "description": "fair",
          "score": 0.6566326
        }
      ]
    }
  ]
}

Où :

  • mid, s'il est présent, contient un identifiant généré automatiquement correspondant à l'entrée de l'entité sur Google Knowledge Graph. Notez que les valeurs mid sont indépendantes de la langue, de sorte que vous pouvez les utiliser pour lier des entités de différentes langues. Pour inspecter ces valeurs mid, consultez la documentation de l'API Google Knowledge Graph.

  • description est la description du libellé.

  • score est le score de confiance. Il varie de 0 (niveau de confiance nul) à 1 (niveau de confiance très élevé).

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…

Cloud Vision API Documentation
Besoin d'aide ? Consultez notre page d'assistance.