Suporte a idiomas OCR

O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.

Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.

Com o lançamento de imagens OCR GA de escrita à mão com idiomas baseados no alfabeto latino, não é necessário usar a configuração languageHints ao usar DOCUMENT_TEXT_DETECTION.

As dicas são especificadas no ImageContext de uma solicitação, como uma lista de languageHints em uma solicitação TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar no formato idioma-região, em que a primeira parte é o idioma principal e a segunda, que é opcional, refere-se à região de um dialeto específico, geralmente um identificador de país. Por exemplo, podemos representar o chinês nas variações simplificado, que é o idioma falado na China (zh-CN), ou tradicional, falado em Taiwan (zh-TW).

Você encontra abaixo a lista de idiomas com os códigos languageHint associados compatíveis com TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Nome do idioma Código languageHints Observações
Africâner af
Árabe ar
Assamês as
Azerbaijano az
Bielorrusso be
Bengalês bn
Búlgaro bg
Catalão ca
Chinês zh* Novo: também compatível com DOCUMENT_TEXT_DETECTION.
Croata hr
Tcheco cs
Dinamarquês da
Holandês nl
Inglês en
Estoniano et
Filipino fil ou tl
Finlandês fi
Francês fr
Alemão de
Grego el Novo: também compatível com DOCUMENT_TEXT_DETECTION.
Hebraico he ou iw Novo: "iw" também compatível com DOCUMENT_TEXT_DETECTION.
Hindi hi
Húngaro hu
Islandês is
Indonésio id
Italiano it
Japonês ja Novo: também compatível com DOCUMENT_TEXT_DETECTION.
Cazaque kk
Coreano ko Novo: também compatível com DOCUMENT_TEXT_DETECTION.
Quirguiz ky
Letão lv
Lituano lt
Macedônio mk
Marati mr
Mongol mn
Nepalês ne
Norueguês no
Pachto ps
Persa fa
Polonês pl
Português pt
Romeno ro
Russo ru
Sânscrito sa
Sérvio sr
Eslovaco sk
Esloveno sl
Espanhol es
Sueco sv
Tâmil ta
Tailandês th Novo: também compatível com DOCUMENT_TEXT_DETECTION.
Turco tr
Ucraniano uk
Urdu ur
Usbeque uz
Vietnamita vi

* O chinês simplificado zh-CN e o tradicional zh-TW são aceitos quando é especificado o código languageHints de zh. Use qualquer um desses códigos no reconhecimento de textos em chinês.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação da API Cloud Vision
Precisa de ajuda? Acesse nossa página de suporte.