Guía de inicio rápido: Usa la línea de comandos

En esta página, se muestra cómo enviar tres solicitudes de anotación y detección de características a la API de Vision mediante la interfaz de REST y el comando curl.

La API de Vision permite la integración sencilla de las tecnologías de reconocimiento de la visión de Google en las aplicaciones de desarrollador. Puedes enviar los datos de imagen y los tipos de características deseados a la API de Vision, que luego muestra una respuesta correspondiente en función de los atributos de imagen que te interesan. Para obtener más información sobre los tipos de características que se ofrecen, consulta la Lista de todas las características de la API de Vision.

Antes de comenzar

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. En la página de selección de proyectos de Cloud Console, selecciona o crea un proyecto de Cloud.

    Ir a la página Selector de proyectos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. Habilita las Vision API.

    Habilita la API

  5. Configura la autenticación
    1. En Cloud Console, ve a la página Crear una clave de cuenta de servicio.

      Ir a la página Crear clave de la cuenta de servicio
    2. En la lista Cuenta de servicio, selecciona Cuenta de servicio nueva.
    3. Ingresa un nombre en el campo Nombre de cuenta de servicio.
    4. En la lista Función, selecciona Proyecto > Propietario.

    5. Haz clic en Crear. Se descargará un archivo JSON que contiene tus claves a tu computadora.
  6. Configura la variable de entorno GOOGLE_APPLICATION_CREDENTIALS en la ruta del archivo JSON que contiene la clave de tu cuenta de servicio. Esta variable solo se aplica a la sesión actual de shell. Por lo tanto, si abres una sesión nueva, deberás volver a configurar la variable.

  7. Instala e inicializa el SDK de Cloud.

Crea una solicitud de anotación de imagen

Después de completar los pasos de la sección Antes de comenzar, puedes usar la API de Vision para anotar un archivo de imagen.

En este ejemplo, se usa curl para enviar una solicitud a la API de Vision mediante la siguiente imagen:

URI de Cloud Storage

gs://cloud-samples-data/vision/using_curl/shanghai.jpeg

URL HTTPS:

https://console.cloud.google.com/storage/browser/cloud-samples-data/vision/using_curl/shanghai.jpeg

Imagen de una calle en Shanghái
Crédito de la imagen: Steve Long en Unsplash.

Crea el JSON de la solicitud

En el siguiente archivo request.json, se muestra cómo solicitar tres características de images:annotate y limitar los resultados en la respuesta.

Crea el archivo de solicitud JSON con el siguiente texto y guárdalo como un archivo de texto sin formato request.json en tu directorio de trabajo:

request.json

{
  "requests": [
    {
      "image": {
        "source": {
          "imageUri": "gs://cloud-samples-data/vision/using_curl/shanghai.jpeg"
        }
      },
      "features": [
        {
          "type": "LABEL_DETECTION",
          "maxResults": 3
        },
        {
          "type": "OBJECT_LOCALIZATION",
          "maxResults": 1
        },
        {
          "type": "TEXT_DETECTION",
          "maxResults": 1,
          "model": "builtin/latest"
        }
      ]
    }
  ]
}

Envía la solicitud

Puedes usar curl y el contenido del cuerpo de request.json para enviar la solicitud a la API de Vision. Ingresa lo siguiente en la línea de comandos:

curl -X POST \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" \
https://vision.googleapis.com/v1/images:annotate -d @request.json

Interpreta la respuesta

Deberías ver una respuesta JSON similar a la que se muestra a continuación.

En el cuerpo JSON de la solicitud se especificó maxResults para cada tipo de anotación. Por lo tanto, en la respuesta JSON verás lo que se muestra a continuación:

Resultados de detección de etiquetas

  1. descripción: “Personas” (People), puntaje: 0.950
  2. descripción: “Calle” (Street), puntaje: 0.891
  3. descripción: “Modo de transporte” (Mode of transport), puntaje: 0.890
Imagen de una calle en Shanghái
Crédito de la imagen: Steve Long en Unsplash (anotaciones agregadas).

Resultados de detección de texto

  • texto: 牛牛面馆\n
  • vértices: (x: 159, y: 212), (x: 947, y: 212), (x: 947, y: 354), (x: 159, y: 354)
Imagen de una calle en Shanghái
Crédito de la imagen: Steve Long en Unsplash (anotaciones agregadas).

Resultados de detección de objetos

  • nombre: “Persona” (Person), puntaje: 0.944
  • vértices normalizados: (x: 0.260, y: 0.468), (x: 0.407, y: 0.468), (x: 0.407, y: 0.895), (x: 0.260, y: 0.895)
Imagen de una calle en Shanghái
Crédito de la imagen: Steve Long en Unsplash (anotaciones agregadas).

¡Felicitaciones! Enviaste tu primera solicitud a la API de Vision.

Próximos pasos