Compatibilité avec les langues de reconnaissance optique des caractères

La fonctionnalité de reconnaissance de texte de l'API Cloud Vision peut détecter une grande variété de langues et plusieurs langues au sein d'une même image.

Il n'est pas nécessaire de fournir un indicateur de langue au service, mais vous pouvez le faire si ce dernier ne parvient pas à détecter la langue utilisée dans votre image.

Avec le lancement de l'écriture manuscrite (OCR) en phase de disponibilité générale, il n'est pas nécessaire de définir l'option languageHints pour les images en cas d'utilisation de DOCUMENT_TEXT_DETECTION.

Les indicateurs de langue facultatifs sont spécifiés dans le champ ImageContext d'une requête en tant que liste de languageHints pour les requêtes TEXT_DETECTION et DOCUMENT_TEXT_DETECTION.

Chaque paramètre de code de langue se compose d'un identifiant BCP 47. Ce paramètre peut se présenter sous la forme langue-région, langue faisant référence à la langue principale et région (facultatif) renvoyant à la zone géographique (généralement désignée par l'identificateur d'un pays) où est parlé le dialecte en question. Par exemple, le chinois peut être représenté par le chinois simplifié tel qu'il est écrit en République populaire de Chine (zh-Hans) ou en chinois traditionnel tel qu'il est écrit à Taïwan (zh-Hant).

La fonctionnalité de reconnaissance de texte prend en charge trois niveaux :

  1. Les langues acceptées sont celles que nous priorisons et évaluons régulièrement par rapport aux performances.
  2. Les langues expérimentales sont celles qui sont en phase de développement actif, mais pas évaluées régulièrement.
  3. Les langues mappées sont celles qui sont compatibles avec un autre code de langue ou un outil de reconnaissance de caractères général. Par exemple, "en-GB" est pris en charge, mais n'est pas traité différemment de "en" dans le cadre de la reconnaissance de texte. Nous nous efforçons de renvoyer le code de langue mappé correct dans le champ des paramètres régionaux d'entité, mais les langues mappées sont davantage susceptibles d'être prises pour une langue similaire que les langues entièrement ou expérimentalement prises en charge.

La liste des langues (avec les codes languageHint associés) prises en charge par TEXT_DETECTION et DOCUMENT_TEXT_DETECTION est indiquée ci-dessous.

Si l'indicateur de langue n'est pas renseigné, nous essaierons de détecter automatiquement la langue la plus appropriée. Le point de terminaison TEXT_DETECTION détecte automatiquement un sous-ensemble de langues acceptées, tandis que le point de terminaison DOCUMENT_TEXT_DETECTION détecte automatiquement l'ensemble des langues acceptées.

Langages acceptés

Les langues suivantes sont classées par ordre de priorité et régulièrement évaluées.

Pour filtrer par fonctionnalité, saisissez ou sélectionnez directement la langue souhaitée dans le menu déroulant :

Langues expérimentales

Les langues suivantes sont en phase de développement actif et n'ont pas encore été évaluées régulièrement.

Langues mappées

Les langues suivantes sont mappées à un autre code de langue ou mappées à un outil de reconnaissance de caractères général.