Detectar rótulos

A Vision API detecta e extrai informações de diversas categorias sobre entidades dentro de uma imagem utilizando um amplo grupo de categorias.

Os marcadores identificam objetos, locais, atividades, espécies de animais, produtos e muito mais.

Eles são retornados apenas em inglês. Com a API Cloud Translation, é possível traduzir esses rótulos para vários idiomas.

Por exemplo, a imagem acima pode retornar a seguinte lista de rótulos:

Descrição Pontuação
roda-gigante 0,84832066
parque de diversões 0,8101249
noite 0,8036025
recreação ao ar livre 0,68825835
evento 0,6566326

Amostras de código

Para ver exemplos em diversas linguagens de programação, consulte:

Solicitações de detecção de marcadores

Configurar seu projeto e autenticação do GCP

Detectar rótulos

PowerShell

Para fazer uma solicitação de detecção de rótulo usando o Windows Powershell, faça uma solicitação POST para o endpoint https://vision.googleapis.com/v1/images:annotate e especifique LABEL_DETECTION como valor de features.type, conforme mostrado no exemplo a seguir:

$cred = gcloud auth application-default print-access-token
$headers = @{ Authorization = "Bearer $cred" }

Invoke-WebRequest `
  -Method Post `
  -Headers $headers `
  -ContentType: "application/json; charset=utf-8" `
  -Body "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" `
  -Uri "https://vision.googleapis.com/v1/images:annotate" | Select-Object -Expand Content

É possível transmitir as imagens de uma destas três maneiras: como uma string codificada em base64, como URI do Google Cloud Storage ou como URL HTTPS ou HTTP com acesso público. Consulte Como fazer solicitações para saber mais informações.

Para mais informações sobre como configurar o corpo da solicitação, consulte a documentação de referência de AnnotateImageRequest.

Comando curl

Para fazer uma solicitação de detecção de rótulo usando o curl na linha de comando do Linux ou MacOS, faça uma solicitação POST para o ponto de extremidade https://vision.googleapis.com/v1/images:annotate e especifique LABEL_DETECTION como o valor de features.type, conforme mostrado no exemplo a seguir:

curl -X POST \
     -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     --data "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'https://cloud.google.com/vision/docs/images/ferris-wheel.jpg'
            }
          },
          'features': [
            {
              'type': 'LABEL_DETECTION'
            }
          ]
        }
      ]
    }" "https://vision.googleapis.com/v1/images:annotate"

É possível transmitir as imagens de uma destas três maneiras: como uma string codificada em Base64, como URI do Google Cloud Storage ou como URL HTTPS ou HTTP com acesso público. Consulte Como fazer solicitações para saber mais.

Para mais informações sobre como configurar o corpo da solicitação, consulte a documentação de referência de AnnotateImageRequest.

COMANDO GCLOUD

Para detectar rótulos em uma imagem, use o comando gcloud ml vision detect-labels conforme exemplo a seguir:

gcloud ml vision detect-labels https://cloud.google.com/vision/docs/images/ferris-wheel.jpg

Respostas da detecção de rótulos

Quando a solicitação é bem-sucedida, o servidor retorna um código de status HTTP 200 OK e a resposta no formato JSON.

Uma resposta de LABEL_DETECTION inclui os marcadores detectados, a pontuação deles e uma ID opaca de marcador:

{
  "responses": [
    {
      "labelAnnotations": [
        {
          "mid": "/m/017rgb",
          "description": "ferris wheel",
          "score": 0.84832066
        },
        {
          "mid": "/m/010jjr",
          "description": "amusement park",
          "score": 0.8101249
        },
        {
          "mid": "/m/01d74z",
          "description": "night",
          "score": 0.8036025
        },
        {
          "mid": "/m/05b0n7k",
          "description": "outdoor recreation",
          "score": 0.68825835
        },
        {
          "mid": "/m/02jf28",
          "description": "fair",
          "score": 0.6566326
        }
      ]
    }
  ]
}

Em que:

  • mid, se presente, contém um identificador gerado por máquina (MID, na sigla em inglês) correspondente à entrada do Mapa de informações do Google da entidade. Os valores de mid permanecem exclusivos em diversos idiomas. É possível usá-los para vincular entidades de diferentes idiomas. Para inspecionar os valores do MID, consulte a documentação da API Google Knowledge Graph;

  • description é a descrição do rótulo;

  • score é a pontuação de confiança, que varia de 0 (nenhuma confiança) a 1 (muito alta).

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação da API Cloud Vision
Precisa de ajuda? Acesse nossa página de suporte.