Detecta etiquetas

La API de Vision puede detectar y extraer información sobre las entidades en una imagen en un amplio grupo de categorías.

Las etiquetas pueden identificar objetos, ubicaciones, actividades, especies de animales, productos y mucho más.

Las etiquetas se muestran solo en inglés. La API de Cloud Translation puede traducir etiquetas en inglés en muchos otros idiomas.

Por ejemplo, la imagen anterior puede mostrar la siguiente lista de etiquetas:

Descripción Puntuación
rueda de la fortuna 0.84832066
parque de atracciones 0.8101249
noche 0.8036025
recreación al aire libre 0.68825835
feria 0.6566326

Muestras de código

Para obtener muestras en varios lenguajes de programación, consulta:

Solicitudes de detección de etiquetas

Configura tu proyecto de GCP y la autenticación

Detecta etiquetas

PowerShell

Para realizar una solicitud de detección de etiquetas con Windows PowerShell, envía una solicitud de POST al extremo https://vision.googleapis.com/v1/images:annotate y especifica LABEL_DETECTION como el valor de features.type, como se muestra en el siguiente ejemplo:

$cred = gcloud auth application-default print-access-token
$headers = @{ Authorization = "Bearer $cred" }

Invoke-WebRequest `
  -Method Post `
  -Headers $headers `
  -ContentType: "application/json; charset=utf-8" `
  -Body "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" `
  -Uri "https://vision.googleapis.com/v1/images:annotate" | Select-Object -Expand Content

Las imágenes se pueden pasar en una de tres maneras: como una string codificada en base64; como un URI de Google Cloud Storage o como una URL HTTP o HTTPS de acceso público. Consulta Realiza solicitudes para obtener más información.

Consulta la documentación de referencia de AnnotateImageRequest para obtener más información sobre cómo configurar el cuerpo de la solicitud.

Comando curl

Para realizar una solicitud de detección de etiquetas con curl desde la línea de comandos Linux o MacOS, envía una solicitud POST al extremo https://vision.googleapis.com/v1/images:annotate y especifica LABEL_DETECTION como el valor de features.type, como se muestra en el siguiente ejemplo:

curl -X POST \
     -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     --data "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" "https://vision.googleapis.com/v1/images:annotate"

Las imágenes se pueden pasar en una de tres maneras: como una string codificada en base64; como un URI de Google Cloud Storage o como una URL HTTP o HTTPS de acceso público. Consulta Realiza solicitudes para obtener más información.

Consulta la documentación de referencia de AnnotateImageRequest para obtener más información sobre cómo configurar el cuerpo de la solicitud.

COMANDO DE GCLOUD

Para detectar etiquetas en una imagen, usa el comando gcloud ml vision detect-labels como se muestra en el siguiente ejemplo:

gcloud ml vision detect-labels https://cloud.google.com/vision/docs/images/ferris-wheel.jpg

Respuestas de detección de etiquetas

Si la solicitud tiene éxito, el servidor muestra un código de estado HTTP 200 OK y la respuesta en formato JSON.

Una respuesta LABEL_DETECTION incluye las etiquetas detectadas, su puntuación y un ID de etiqueta opaco:

{
  "responses": [
    {
      "labelAnnotations": [
        {
          "mid": "/m/017rgb",
          "description": "ferris wheel",
          "score": 0.84832066
        },
        {
          "mid": "/m/010jjr",
          "description": "amusement park",
          "score": 0.8101249
        },
        {
          "mid": "/m/01d74z",
          "description": "night",
          "score": 0.8036025
        },
        {
          "mid": "/m/05b0n7k",
          "description": "outdoor recreation",
          "score": 0.68825835
        },
        {
          "mid": "/m/02jf28",
          "description": "fair",
          "score": 0.6566326
        }
      ]
    }
  ]
}

Donde:

  • mid, si está presente, contiene un identificador generado por una máquina (MID) que corresponde a la entrada Grafo de conocimiento de Google de la entidad. Ten en cuenta que los valores de mid siguen siendo únicos según el idioma, por lo que puedes usarlos para vincular entidades de distintos idiomas. Para inspeccionar los valores de MID, consulta la documentación de la API de Grafo de conocimiento de Google.

  • description es la descripción de la etiqueta.

  • score es la puntuación de confianza que va de 0 (sin confianza) a 1 (confianza muy alta).

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Documentación de la API de Cloud Vision
Si necesitas ayuda, visita nuestra página de asistencia.