Esta página foi traduzida pela API Cloud Translation.
Switch to English

Lista de recursos

Atualmente, a API Vision permite que você use os seguintes recursos:

Todos os tipos de atributos

Detecção facial 1

imagem com duas faces com e sem anotações
  • Localiza rostos com polígonos delimitadores e identifica "pontos de terra" específicos, como olhos, ouvidos, nariz, boca etc., junto com os valores correspondentes para a confiança.
  • Retorna classificações de probabilidade de emoção (ajoa, tristeza, raiva, surpresa) e propriedades gerais de imagem (expostas, desfocadas, ter lenços).
  • As classificações de probabilidades são expressas como seis valores diferentes: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY ou VERY_LIKELY.

Detecção de pontos de referência 2

Imagem de Catedral de São Basílio
  • Fornece o nome do ponto de referência, um índice de confiança e uma caixa delimitadora na imagem do ponto de referência.
  • Fornece coordenadas da entidade detectada.

Detecção de logotipos 3

logotipo anotado
  • Fornece uma descrição textual da entidade identificada, um índice de confiança e um polígono delimitador para o logotipo no arquivo.

Detecção de rótulos 4

Imagem de uma rua de Xangai
  • Fornece rótulos generalizados para uma imagem.
  • Para cada rótulo, são retornados uma descrição textual, um índice de confiança e uma classificação de utilidade.

Detecção de texto

Imagem de sinal de trânsito
  • reconhecimento óptico de caracteres (OCR, na sigla em inglês) de uma imagem; reconhecimento de texto e conversão para texto codificado por máquina. Identifica e extrai o texto UTF-8 em uma imagem.
  • Imagens: otimizadas para áreas esparsas de texto em uma imagem maior.
  • Resposta: retorna uma lista de palavras identificadas com texto, caixas delimitadoras e textAnnotations, bem como a hierarquia estrutural do texto detectado pelo OCR (fullTextAnnotation).
    • Hierarquia da estrutura de texto extraída:
      • TextAnnotation -> Página -> Bloco -> Parágrafo -> Palavra -> Símbolo.
      • Depois de "Página", cada componente estrutural pode ter propriedades próprias, como idiomas detectados, quebras de linha etc.
  • Idiomas compatíveis: funciona atualmente com idiomas compatíveis, mapeados e experimentais.
  • Valor de enumeração do atributo: TEXT_DETECTION.

Detecção de texto em documentos (texto escrito / escrita à mão)

Imagem densa com anotações
imagem de escrita à mão
  • reconhecimento ótico de caracteres (OCR, na sigla em inglês) de um arquivo (PDF/TIFF) ou de imagem de texto densa; reconhecimento de texto denso e conversão para texto codificado por máquina.
  • Arquivos: otimizado para arquivos de documentos (PDF/TIFF).
  • Imagens: otimizadas para áreas de textodensas em uma imagem (imagens que são documentos) e imagens que contêm texto escrito à mão.
  • Resposta: retorna a hierarquia estrutural do texto detectado pelo OCR (fullTextAnnotation).
    • Hierarquia da estrutura de texto extraída:
      • TextAnnotation -> Página -> Bloco -> Parágrafo -> Palavra -> Símbolo.
      • Depois de "Página", cada componente estrutural pode ter propriedades próprias, como idiomas detectados, quebras de linha etc.
  • Idiomas compatíveis: funciona atualmente com idiomas compatíveis, mapeados e experimentais.
  • Valor de enumeração do atributo: DOCUMENT_TEXT_DETECTION.
    • Tem precedência quando DOCUMENT_TEXT_DETECTION e TEXT_DETECTION são solicitados.

Propriedades de imagem 5

Imagem de Bali com propriedades
  • Retorna as cores predominantes em uma imagem.
  • Cada cor é representada no espaço de cores RGBA, tem uma pontuação de confiança e exibe a fração de pixels ocupadas pela cor [0, 1].

Localização de objetos 6

imagem com caixas delimitadoras
  • Fornece anotações gerais de rótulos e caixas delimitadoras para vários objetos reconhecidos em uma única imagem.
  • Para cada objeto detectado, os seguintes elementos são retornados: uma descrição textual, um índice de confiança e vértices normalizados [0,1] para o polígono delimitador ao redor do objeto.

Detecção de dicas de corte 7

imagem com versão cortada
  • Fornece um polígono delimitador para a imagem cortada, uma pontuação de confiança e uma fração de importância dessa região saliente em relação à imagem original de cada solicitação.
  • É possível fornecer até 16 valores de proporção de imagem (largura:altura) para uma única imagem.

Páginas e entidades da Web 8

imagem com tabela de entidades da Web
  • Fornece uma série de conteúdos da Web relacionados a uma imagem.
  • Retorna as seguintes informações:
    • Entidades da Web: entidades inferidas (rótulos/descrições) de imagens semelhantes na Web
    • Imagens de correspondência completa: uma lista de URLs para imagens totalmente correspondentes de qualquer tamanho na Internet
    • Imagens de correspondência parcial: uma lista de URLs para imagens que compartilham recursos de chave-valor, como uma versão cortada da imagem original.
    • Páginas com imagens correspondentes: uma lista de páginas da Web (identificadas pelo URL da página, título da página, URL correspondente) com uma imagem que atenda às condições descritas acima.
    • Imagens visualmente semelhantes: uma lista de URLs para imagens que compartilham alguns recursos com a imagem original
    • Melhor rótulo de sugestões: um palpite sobre o assunto da imagem solicitada inferida de imagens semelhantes na Internet

Detecção explícita de conteúdo (SafeSearch)

  • Fornece classificações de probabilidade para as seguintes categorias de conteúdo explícito: adult, spoof, medical, violence e racy.
  • As classificações de probabilidades são expressas como seis valores diferentes: UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY ou VERY_LIKELY.

1. Crédito da imagem: Himanshu Singh Gurjar em Unsplash (anotações adicionadas) (links em inglês).

2. Crédito da imagem: Nikolay Vorobyev em Unsplash (anotações adicionadas) (links em inglês).

3. Crédito da imagem: Robert Scoble (CC BY 2.0, anotação adicionada) (links em inglês).

4. Crédito da imagem: Alex Knight em Unsplash. (links em inglês)

5. Crédito da imagem: Jeremy Bishop em Unsplash. (links em inglês)

6. Crédito da imagem: Bogdan Dada em Unsplash (anotações adicionadas) (links em inglês).

7. Crédito da imagem: Yasmin Dangor em Unsplash (imagem original e cortada exibida) (links em inglês).

8. Crédito da imagem: Quinten de Graaf no Unsplash (links em inglês).