Suporte a idiomas OCR

O recurso de reconhecimento de texto da API Cloud Vision é capaz de detectar uma grande variedade de idiomas, além de detectar vários idiomas dentro de uma única imagem.

Não é preciso fornecer uma dica de idioma para o serviço. No entanto, isso poderá ser feito se houver dificuldade para detectar o idioma usado na imagem.

Com o lançamento do OCR de escrita à mão em disponibilidade geral, as imagens com manuscritos não precisam mais da sinalização languageHints ao usar DOCUMENT_TEXT_DETECTION.

As dicas de idioma opcionais são especificadas no ImageContext de uma solicitação como uma lista de languageHints para uma solicitação TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.

Cada parâmetro de código de idioma normalmente consiste em um identificador BCP-47. Esse parâmetro pode estar no formato idioma-região, em que a primeira parte é o idioma principal e a segunda, que é opcional, refere-se à região, geralmente um identificador de país, de um dialeto específico. Por exemplo, podemos representar o chinês nas variações simplificado, conforme escrito na China (zh-Hans), ou tradicional, conforme escrito em Taiwan (zh-Hant).

Há três níveis de suporte a idiomas no recurso de reconhecimento de texto:

  1. Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
  2. Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
  3. Os idiomas mapeados são aqueles compatíveis com o mapeamento para outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo, "en-GB" é compatível, mas não é tratado de forma diferente de "en" para fins de reconhecimento de texto. Fazemos um esforço para retornar o código de idioma mapeado correto no campo "Localidade da entidade". No entanto, os idiomas mapeados têm mais chance de serem confundidos com idiomas semelhantes do que idiomas com compatibilidade total ou experimental.

A lista de idiomas (com códigos languageHint associados) compatíveis com TEXT_DETECTION e DOCUMENT_TEXT_DETECTION é mostrada abaixo.

Se a dica de idioma for deixada em branco, tentaremos detectar automaticamente o idioma mais apropriado. O endpoint TEXT_DETECTION detectará automaticamente apenas um subconjunto de idiomas compatíveis, enquanto o endpoint DOCUMENT_TEXT_DETECTION detectará automaticamente o conjunto completo de idiomas compatíveis.

Idiomas compatíveis

Os idiomas a seguir são priorizados e avaliados regularmente.

Para filtrar por recursos, digite ou selecione diretamente o idioma escolhido no menu suspenso:

Idiomas experimentais

Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.

Idiomas mapeados

Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.