L'API Cloud Vision peut détecter et extraire des informations sur les entités d'une image, dans un large groupe de catégories.
Les libellés permettent d'identifier d'une manière générale des objets, des lieux, des activités, des espèces animales, des produits, etc. Si vous avez besoin de libellés personnalisés ciblés, Cloud AutoML Vision vous permet d'entraîner un modèle de machine learning personnalisé pour classifier des images.
Les libellés ne sont renvoyés qu'en anglais. L'API Cloud Translation peut traduire les libellés en anglais dans plusieurs autres langues.
Par exemple, l'image ci-dessus peut correspondre à la liste de libellés suivante :
Description | Note |
---|---|
Rue | 0.872 |
Instantané | 0.852 |
Ville | 0.848 |
Nuit | 0.804 |
Allée | 0.713 |
Requêtes de détection de libellés
Configurer votre authentification et votre projet Google Cloud
Détecter les libellés dans une image locale
L'API Vision permet de détecter des caractéristiques dans un fichier image local.
Pour les requêtes REST, envoyez le contenu du fichier image en tant que chaîne encodée en base64 dans le corps de votre requête.
Pour les requêtes gcloud
et les bibliothèques clientes, spécifiez le chemin d'accès à une image locale dans votre requête.
REST
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- BASE64_ENCODED_IMAGE : représentation en base64 (chaîne ASCII) de vos données d'image binaires. Cette chaîne doit ressembler à la chaîne suivante :
/9j/4QAYRXhpZgAA...9tAVx/zDQDlGxn//2Q==
- RESULTS_INT : (facultatif) valeur entière des résultats à renvoyer. Si vous omettez le champ
"maxResults"
et sa valeur, l'API renvoie la valeur par défaut de 10 résultats. Ce champ ne s'applique pas aux types de fonctionnalités suivants :TEXT_DETECTION
,DOCUMENT_TEXT_DETECTION
ouCROP_HINTS
. - PROJECT_ID : ID de votre projet Google Cloud.
Méthode HTTP et URL :
POST https://vision.googleapis.com/v1/images:annotate
Corps JSON de la requête :
{ "requests": [ { "image": { "content": "BASE64_ENCODED_IMAGE" }, "features": [ { "maxResults": RESULTS_INT, "type": "LABEL_DETECTION" } ] } ] }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://vision.googleapis.com/v1/images:annotate"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://vision.googleapis.com/v1/images:annotate" | Select-Object -Expand Content
Si la requête aboutit, le serveur affiche un code d'état HTTP 200 OK
et la réponse au format JSON.
Une réponse LABEL_DETECTION
inclut les libellés détectés, leur score, leur thématique et un ID de libellé opaque, où :
mid
, s'il est présent, contient un identifiant généré automatiquement correspondant à l'entrée de l'entité sur Google Knowledge Graph. Notez que les valeursmid
restent uniques dans les différentes langues. Vous pouvez donc les utiliser pour associer des entités dans différentes langues. Pour inspecter ces valeurs mid, consultez la documentation de l'API Google Knowledge Graph.description
: description du libellé.score
: score de confiance, qui varie de 0 (niveau de confiance nul) à 1 (niveau de confiance très élevé).topicality
: pertinence du libellé ICA (Image Content Annotation) par rapport à l'image. Cette valeur permet de mesurer l'importance d'un libellé par rapport au contexte global d'une page.
{ "responses": [ { "labelAnnotations": [ { "mid": "/m/01c8br", "description": " Street", "score": 0,87294734, "topicity": 0,87294734 }, { "mid": "/m/06pg22", "description": "Snapshot", "score": 0.85209, "topicity": 0,85209 }, { "mid": "/m/0dx1j", "description": "Town", "score": 0.848104, "topicity": 0,848104 }, { "mid": "/m/01d74z", "description" ": "Nuit", "score": 0.08408716, "topicity": 0,80.0408716 }, { "mid": "/m/01lwf0", " description": "Alley", "score": 0.713332, "topicity": 0.713332 } ] } ] }
Go
Avant d'essayer cet exemple, suivez les instructions de configuration pour Go décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Go.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Avant d'essayer cet exemple, suivez les instructions de configuration pour Java du guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Java.
Node.js
Avant d'essayer cet exemple, suivez les instructions de configuration pour Node.js décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Node.js.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Avant d'essayer cet exemple, suivez les instructions de configuration pour Python décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Python.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Langages supplémentaires
C# : Veuillez suivre les Instructions de configuration de C# sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour .NET.
PHP : Veuillez suivre les Instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour PHP.
Ruby : Veuillez suivre les Instructions de configuration de Ruby sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour Ruby.
Détecter les libellés dans une image distante
L'API Vision permet de détecter des caractéristiques dans un fichier image distant situé dans Cloud Storage ou sur le Web. Pour envoyer une requête de fichier distant, spécifiez l'URL Web ou l'URI Cloud Storage du fichier dans le corps de la requête.
REST
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- CLOUD_STORAGE_IMAGE_URI : chemin d'accès à un fichier image valide dans un bucket Cloud Storage. Il faut au minimum disposer des droits en lecture sur le fichier.
Exemple :
gs://cloud-samples-data/vision/label/setagaya.jpeg
- RESULTS_INT : (facultatif) valeur entière des résultats à renvoyer. Si vous omettez le champ
"maxResults"
et sa valeur, l'API renvoie la valeur par défaut de 10 résultats. Ce champ ne s'applique pas aux types de fonctionnalités suivants :TEXT_DETECTION
,DOCUMENT_TEXT_DETECTION
ouCROP_HINTS
. - PROJECT_ID : ID de votre projet Google Cloud.
Méthode HTTP et URL :
POST https://vision.googleapis.com/v1/images:annotate
Corps JSON de la requête :
{ "requests": [ { "image": { "source": { "gcsImageUri": "CLOUD_STORAGE_IMAGE_URI" } }, "features": [ { "maxResults": RESULTS_INT, "type": "LABEL_DETECTION" }, ] } ] }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://vision.googleapis.com/v1/images:annotate"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://vision.googleapis.com/v1/images:annotate" | Select-Object -Expand Content
Si la requête aboutit, le serveur affiche un code d'état HTTP 200 OK
et la réponse au format JSON.
Une réponse LABEL_DETECTION
inclut les libellés détectés, leur score, leur thématique et un ID de libellé opaque, où :
mid
, s'il est présent, contient un identifiant généré automatiquement correspondant à l'entrée de l'entité sur Google Knowledge Graph. Notez que les valeursmid
restent uniques dans les différentes langues. Vous pouvez donc les utiliser pour associer des entités dans différentes langues. Pour inspecter ces valeurs mid, consultez la documentation de l'API Google Knowledge Graph.description
: description du libellé.score
: score de confiance, qui varie de 0 (niveau de confiance nul) à 1 (niveau de confiance très élevé).topicality
: pertinence du libellé ICA (Image Content Annotation) par rapport à l'image. Cette valeur permet de mesurer l'importance d'un libellé par rapport au contexte global d'une page.
{ "responses": [ { "labelAnnotations": [ { "mid": "/m/01c8br", "description": " Street", "score": 0,87294734, "topicity": 0,87294734 }, { "mid": "/m/06pg22", "description": "Snapshot", "score": 0.85209, "topicity": 0,85209 }, { "mid": "/m/0dx1j", "description": "Town", "score": 0.848104, "topicity": 0,848104 }, { "mid": "/m/01d74z", "description" ": "Nuit", "score": 0.08408716, "topicity": 0,80.0408716 }, { "mid": "/m/01lwf0", " description": "Alley", "score": 0.713332, "topicity": 0.713332 } ] } ] }
Go
Avant d'essayer cet exemple, suivez les instructions de configuration pour Go décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Go.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Avant d'essayer cet exemple, suivez les instructions de configuration pour Java du guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Java.
Node.js
Avant d'essayer cet exemple, suivez les instructions de configuration pour Node.js décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Node.js.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Avant d'essayer cet exemple, suivez les instructions de configuration pour Python décrites dans le guide de démarrage rapide de Vision à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Cloud Vision en langage Python.
Pour vous authentifier auprès de Vision, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
gcloud
Pour détecter les libellés dans une image, utilisez la commande gcloud ml vision detect-labels
comme indiqué dans l'exemple suivant :
gcloud ml vision detect-labels gs://cloud-samples-data/vision/label/setagaya.jpeg
Langages supplémentaires
C# : Veuillez suivre les Instructions de configuration de C# sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour .NET.
PHP : Veuillez suivre les Instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour PHP.
Ruby : Veuillez suivre les Instructions de configuration de Ruby sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Vision pour Ruby.
Essayer
Essayez la détection des libellés ci-dessous. Vous pouvez utiliser l'image déjà spécifiée gs://cloud-samples-data/vision/label/setagaya.jpeg
ou spécifier votre propre image à la place. Pour envoyer la requête, cliquez sur Exécuter.
Corps de la requête :
{ "requests": [ { "features": [ { "maxResults": 5, "type": "LABEL_DETECTION" } ], "image": { "source": { "imageUri": "gs://cloud-samples-data/vision/label/setagaya.jpeg" } } } ] }