OCR 언어 지원

Cloud Vision API의 텍스트 인식 기능으로 더욱 폭넓은 언어를 감지하고, 단일 이미지에서 여러 언어를 감지할 수 있습니다.

서비스에 언어 힌트를 반드시 제공할 필요는 없지만, 서비스에서 이미지에 사용된 언어를 감지하는 데 문제가 있는 경우 언어 힌트를 제공할 수 있습니다.

필기 입력 OCR GA의 출시로 인해 필기 입력이 포함된 이미지는 DOCUMENT_TEXT_DETECTION 사용 시 더 이상 languageHints 플래그 설정이 필요하지 않습니다.

선택적 언어 힌트는 요청의 ImageContext 내에 TEXT_DETECTIONDOCUMENT_TEXT_DETECTION 요청의 languageHints 목록으로 지정됩니다.

각 언어 코드 매개변수는 일반적으로 BCP-47 식별자로 구성됩니다. 이 매개변수는 언어-리전 형식일 수 있습니다. 여기서 언어는 기본 언어를 나타내고, 선택사항인 리전은 특정 방언의 리전(일반적으로 국가 식별자)을 나타냅니다. 예를 들어 중국어는 중화인민공화국에서 쓰는 중국어 간체(zh-Hans) 또는 타이완에서 쓰는 중국어 번체(zh-Hant)로 표기할 수 있습니다.

텍스트 인식 기능에는 다음 세 가지 수준의 언어 지원이 있습니다.

  1. 지원 언어는 Google이 우선순위를 두고 정기적으로 성능을 평가하는 언어입니다.
  2. 실험용 언어는 개발을 진행 중이지만 정기적 평가는 수행되지 않는 언어입니다.
  3. 매핑 언어는 다른 언어 코드나 일반 문자 인식기에 매핑하여 지원되는 언어입니다. 예를 들어 'en-GB'는 지원되지만 텍스트를 인식할 목적으로 'en'과 다르게 처리되지는 않습니다. 항목 언어 필드에 정확하게 매핑된 언어 코드를 반환하기 위해 최선을 다하고 있으나, 매핑된 언어는 완전히 지원되거나 실험용으로 지원되는 언어보다 유사한 언어로 잘못 식별될 가능성이 높습니다.

TEXT_DETECTIONDOCUMENT_TEXT_DETECTION에서 지원되는 언어 목록(연결된 languageHint 코드 포함)은 아래에 나와 있습니다.

언어 힌트를 비워두면 가장 적절한 언어가 자동으로 감지됩니다. TEXT_DETECTION 엔드포인트는 지원되는 언어의 하위 집합만 자동 감지하고, DOCUMENT_TEXT_DETECTION 엔드포인트는 지원되는 모든 언어를 자동으로 감지합니다.

지원 언어

다음 언어에 우선순위를 두고 정기적으로 평가합니다.

기능별로 필터링하려면 드롭다운 메뉴에서 원하는 언어를 입력하거나 직접 선택합니다.

언어 언어(한국식 이름) languageHints 코드 스크립트 참고
Afrikaans 아프리칸스어 af Latn
shqip 알바니아어 sq Latn
العربية 아랍어 ar Arab 현대 표준
Հայ 아르메니아어 hy Armn
беларуская 벨라루스어 be Cyrl
বাংলা 벵골어 bn Beng
български 불가리아어 bg Cyrl
Català 카탈로니아어 ca Latn
普通话 중국어 zh Hans/Hant
Hrvatski 크로아티아어 hr Latn
Čeština 체코어 cs Latn
Dansk 덴마크어 da Latn
Nederlands 네덜란드어 nl Latn
English 영어 en Latn 미국
Eesti keel 에스토니아어 et Latn
Filipino 필리핀어 fil Latn
Suomi 핀란드어 fi Latn
Français 프랑스어 fr Latn 유럽
Deutsch 독일어 de Latn
Ελληνικά 그리스어 el Grek
ગુજરાતી 구자라트어 gu Gujr
עברית 히브리어 iw Hebr
हिन्दी 힌디어 hi Deva
Magyar 헝가리어 hu Latn
Íslenska 아이슬란드어 is Latn
Bahasa Indonesia 인도네시아어 id Latn
Italiano 이탈리아어 it Latn
日本語 일본어 ja Jpan
ಕನ್ನಡ 칸나다어 kn Knda
ភាសាខ្មែរ 크메르어 km Khmr
한국어 한국어 ko Kore
ລາວ 라오어 lo Laoo
Latviešu 라트비아어 lv Latn
Lietuvių 리투아니아어 lt Latn
Македонски 마케도니아어 mk Cyrl
Bahasa Melayu 말레이어 ms Latn
മലയാളം 말라얄람어 ml Mlym
मराठी 마라타어 mr Deva
नेपाली 네팔어 ne Deva
Norsk 노르웨이어 no Latn 보크몰어
فارسی 페르시아어 fa Arab
Polski 폴란드어 pl Latn
Português 포르투갈어 pt Latn 브라질
ਪੰਜਾਬੀ 펀자브어 pa Guru 구르무키
Română 루마니아어 ro Latn
Русский 러시아어 ru Cyrl
Русский (старая орфография) 러시아어 ru-PETR1708 Cyrl 옛 철자법
Српски 세르비아어 sr Cyrl
Српски (латиница) 세르비아어 sr-Latn Latn
Slovenčina 슬로바키아어 sk Latn
Slovenščina 슬로베니아어 sl Latn
Español 스페인어 es Latn 유럽
Svenska 스웨덴어 sv Latn
Tagalog 타갈로그어 tl Latn
தமிழ் 타밀어 ta Taml
తెలుగు 텔루구어 te Telu
ไทย 태국어 th Thai
Türkçe 터키어 tr Latn
Українська 우크라이나어 uk Cyrl
Tiếng Việt 베트남어 vi Latn
Yiddish 이디시어 yi Hebr

실험용 언어

다음 언어는 개발을 진행 중이지만 정기적으로 평가되지는 않습니다.

언어 언어(한국식 이름) languageHints 코드 스크립트 참고
አማርኛ 암하라어 am Ethi
Αρχαία ελληνικά 고대 그리스어 grc Grek
অসমীয়া 아삼어 as Beng
Azərbaycan 아제르바이잔어 az Latn
Azərbaycan (qədim yazı) 아제르바이잔어 az-Cyrl Cyrl 옛 철자법
Euskara 바스크어 eu Latn
Bosanski 보스니아어 bs Latn
မြန်မာ 버마어 my Mymr
Cebuano 세부아노어 ceb Latn
ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ 체로키어 chr Cher
dhivehi, dhivehi-bas 디베히어 dv Thaa
རྫོང་ཁ 종카어 dz Tibt
Esperanto 에스페란토어 eo Latn
Galego 갈리시아어 gl Latn
ქართული 그루지야어 ka Geor
Kreyòl Ayisyen 아이티 크리올어 ht Latn
Gaeilge 아일랜드어 ga Latn
Jawa 자바어 jv Latn
Қазақ 카자흐어 kk Cyrl
Kirghiz 키르기스어 ky Cyrl
Latine 라틴어 la Latn
Malti 몰타어 mt Latn
Монгол 몽고어 mn Cyrl
ଓଡ଼ିଆ 오리야어 or Orya
پښتو 파슈토어 ps Arab
संस्कृतम् 산스크리트 sa Deva
සිංහල 신할라어 si Sinh
Swahili 스와힐리어 sw Latn
leššānā Suryāyā 시리아어 syr Syriac
བོད་སྐད་ 티베트어 bo Tibt
ትግርኛ 티기냐 ti Ethi
اردو 우르두어 ur Arab
oʻzbekcha 우즈베크어 uz Latn 라틴어
oʻzbekcha 우즈베크어 uz-Cyrl Cyrl 옛 철자법
Cymraeg 웨일즈어 cy Latn
IsiZulu 줄루어 zu Latn

매핑 언어

다음 언어는 다른 언어 코드 또는 일반 문자 인식기에 매핑됩니다.

언어 언어(한국식 이름) languageHints 코드 스크립트 참고
بهسا اچيه 아체어 ace Latn 라틴어 모델
Lwo 아촐리어 ach Latn 라틴어 모델
Dangme 아당메어 ada Latn 라틴어 모델
Akan 아칸어 ak Latn 라틴어 모델
Anicinâbemowin 알곤킨어 alg Latn 라틴어 모델
Mapudungu 아라우칸어/마푸체어 arn Latn 라틴어 모델
Asturianu 아스투리아스어 ast Latn 라틴어 모델
Dene 아타바스카어 ath Latn 라틴어 모델
Aymar aru 아이마라어 ay Latn 라틴어 모델
Bhāṣa Bali 발리어 ban Latn 라틴어 모델
Bamanankan 밤바라어 bm Latn 라틴어 모델
Narrow Bantu 반투어 bnt Latn 라틴어 모델
башҡорт теле 바슈키르어 ba Cyrl 키릴 문자 모델
Toba–Batak 바타크 btk Latn 라틴어 모델
Chibemba 벰바어 bem Latn 라틴어 모델
Bikol Naga 비콜어 bik Latn 라틴어 모델
Bichelamar 비슬라마어 bi Latn 라틴어 모델
Brezhoneg 브르타뉴어 br Latn 라틴어 모델
нохчийн мотт / noxçiyn mott 체첸어 ce Cyrl 키릴 문자 모델
汉语 중국어(북경어, 간체) zh-Hans Hans 중국어 모델
漢語 중국어(북경어, 번체) zh-Hant Hant 중국어 모델
普通話 중국어(북경어, 홍콩) zh-Hant-HK Hant 중국어 모델
Chahta' 촉토어 cho Latn 라틴어 모델
Чӑвашла 추바시어 cv Cyrl 키릴 문자 모델
Cree–Montagnais–Naskapi 크리어 cr Latn 라틴어 모델
Mvskoke 크릭어 mus Latn 라틴어 모델
qırımtatar tili, къырымтатар тили 크림 타타르어 crh Latn 키릴 문자 모델
Dakhótiyapi, Dakȟótiyapi 다코타어 dak Latn 라틴어 모델
Douala 두알라어 dua Latn 라틴어 모델
Ikɔ Efik 에피크어 efi Latn 라틴어 모델
English (British) 영어(영국) en-GB Latn 라틴어 모델
Èʋegbe 에웨어 ee Latn 라틴어 모델
føroyskt mál 페로어 fo Latn 라틴어 모델
Na Vosa Vakaviti 피지어 fj Latn 라틴어 모델
fɔ̀ngbè 폰어 fon Latn 라틴어 모델
Français canadien 프랑스어(캐나다) fr-CA Latn 라틴어 모델
Fulani, Fulah, Peul 풀라어 ff Latn 라틴어 모델
Ga gaa Latn 라틴어 모델
Luganda 간다어 lg Latn 라틴어 모델
Basa Gayo 가요어 gay Latn 라틴어 모델
Kiribati 길버트어 gil Latn 라틴어 모델
Gothic 고딕 문자 got Latn 라틴어 모델
Guaraní 과라니어 gn Latn 라틴어 모델
Harshen/Halshen Hausa هَرْشَن هَوْسَ 하우사어 ha Latn 라틴어 모델
ʻŌlelo Hawaiʻi 하와이어 haw Latn 라틴어 모델
Otjiherero 헤레로어 hz Latn 라틴어 모델
Ilonggo 힐리가이논어 hil Latn 라틴어 모델
Jaku Iban 이반어 iba Latn 라틴어 모델
Asụsụ Igbo 이보어 ig Latn 라틴어 모델
Ilokano 일로카노어 ilo Latn 라틴어 모델
Taqbaylit 커바일어 kab Latn 라틴어 모델
Jingpho 카친어 kac Latn 라틴어 모델
Kalaallisut 그린란드어 kl Latn 라틴어 모델
Kikamba 캄바어 kam Latn 라틴어 모델
Kanuri 카누리어 kr Latn 라틴어 모델
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى 카라칼팍어 kaa Cyrl/Latn 키릴 문자 모델
Ka Ktien Khasi 카시어 kha Latn 라틴어 모델
Gĩkũyũ 키쿠유어 ki Latn 라틴어 모델
Kinyarwanda 키냐르완다어 rw Latn 라틴어 모델
коми кыв 코미어 kv Cyrl 키릴 문자 모델
Kikongo 콩고어 kg Latn 라틴어 모델
Kosraean 코스라에어 kos Latn 라틴어 모델
Oshikwanyama 콰냐마어 kj Latn 라틴어 모델
Ngala 링갈라어 ln Latn 라틴어 모델
Plattdütsch, Plattdeutsch, Nedersaksisch 저지 독일어 nds Latn 라틴어 모델
siLozi 로지어 loz Latn 라틴어 모델
Kiluba 루바 카탕가어 lu Latn 라틴어 모델
Dholuo 루오어 luo Latn 라틴어 모델
Madhura, Basa Mathura, بَهاسَ مَدورا 마두라어 mad Latn 라틴어 모델
Malagasy 말라가시어 mg Latn 라틴어 모델
Mandinka, لغة مندنكا 만딩고어 man Latn 라틴어 모델
Gaelg, Gailck 맹크스어 gv Latn 라틴어 모델
Te reo Māori 마오리어 mi Latn 라틴어 모델
Ebon 마셜어 mh Latn 라틴어 모델
Mɛnde yia 멘데어 men Latn 라틴어 모델
Middle English 중세 영어 enm Latn 라틴어 모델
Mittelhochdeutsch 중세 고지 독일어 gmh Latn 라틴어 모델
Baso Minangkabau, باسو مينڠكاباو 미낭카바우어 min Latn 라틴어 모델
Kanienʼkéha 모호크어 moh Latn 라틴어 모델
Nkundu 몽고어 lol Latn 라틴어 모델
Nāhuatl 나와틀어 nah Latn 라틴어 모델
Diné bizaad 나바호어 nv Latn 라틴어 모델
Ndonga 은동가어 ng Latn 라틴어 모델
ko e vagahau Niuē 니우에어 niu Latn 라틴어 모델
Zimbabwe Ndebele 북 은데벨레어 nd Latn 라틴어 모델
Sesotho sa Leboa 북부소토어 nso Latn 라틴어 모델
Chichewa, Chinyanja 니안자어 ny Latn 라틴어 모델
Runyankore 은콜레어 nyn Latn 라틴어 모델
Chitonga 니아사 통가어 tog Latn 라틴어 모델
Appolo 은제마어 nzi Latn 라틴어 모델
Occitan, lenga d'òc, provençal 오크어 oc Latn 라틴어 모델
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ 오지브와어 oj Latn 라틴어 모델
Ænglisc, Englisc, Anglisc 고대 영어 ang Latn 라틴어 모델
Franceis, François, Romanz 고대 프랑스어 fro Latn 라틴어 모델
Diutisk, Althochdeutsch 고대 고지 독일어 goh Latn 라틴어 모델
Dǫnsk tunga 고대 노르드어 non Latn 라틴어 모델
Occitan ancian 고대 프로방스어 pro Latn 라틴어 모델
ирон ӕвзаг 오세트어 os Cyrl 키릴 문자 모델
Kapampangan 팜팡가어 pam Latn 라틴어 모델
Salitan Pangasinan 팡가시난어 pag Latn 라틴어 모델
Papiamentu 파피아멘토어 pap Latn 라틴어 모델
Português (Portugal) 포르투갈어(유럽) pt-PT Latn 라틴어 모델
Kechua / Runa Simi 케추아어 qu Latn 라틴어 모델
Rumantsch 로만시어 rm Latn 라틴어 모델
Romani čhib 로마니어 rom Latn 라틴어 모델
Ikirundi 룬디어 rn Latn 라틴어 모델
Sakha 사하어 sah Cyrl 키릴 문자 모델
Gagana faʻa Sāmoa 사모아어 sm Latn 라틴어 모델
yângâ tî sängö 상고어 sg Latn 라틴어 모델
(Braid) Scots, Lallans, Doric 스코트어 sco Latn 라틴어 모델
Gàidhlig 스코틀랜드 게일어 gd Latn 라틴어 모델
chiShona 쇼나어 sn Latn 라틴어 모델
Songhay 송가이어 son Latn 라틴어 모델
Sesotho 소토어 (남부) st Latn 라틴어 모델
Español (Latinoamérica) 스페인어(라틴) es-419 Latn 라틴어 모델
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 순다어 su Latn 라틴어 모델
siSwati 스와티어 ss Latn 라틴어 모델
Reo Tahiti 타히티어 ty Latn 라틴어 모델
тоҷикӣ 타지크어 tg Cyrl 키릴 문자 모델
татар теле 타타르어 tt Cyrl/Latn 키릴 문자 모델
KʌThemnɛ 템네어 tem Latn 라틴어 모델
lea faka-Tonga 통가어 to Latn 라틴어 모델
Xitsonga 총가어 ts Latn 라틴어 모델
Setswana 츠와나어 tn Latn 라틴어 모델
Türkmençe 투르크멘어 tk Latn 키릴 문자 모델
удмурт кыл 우드무르트어 udm Cyrl 키릴 문자 모델
Tshivenḓa 벤다어 ve Latn 라틴어 모델
Vod 보트어 vot Cyrl/Latn 키릴 문자 모델
Frysk 서프리지아어 fy Latn 라틴어 모델
Wolof 월로프어 wo Latn 라틴어 모델
isiXhosa 코사어 xh Latn 라틴어 모델
Èdè Yorùbá 요루바어 yo Latn 라틴어 모델
Diidxazá 사포텍/사포텍족 zap Latn 라틴어 모델

필기 스크립트

다음 스크립트는 필기 인식을 지원합니다. 위의 언어 테이블에서 각 스크립트를 사용하는 언어를 확인합니다.

스크립트 이름 지원 수준
Beng 벵골어 실험용
Cyrl 키릴어 실험용
Deva 데봐나가리 실험용
Grek 그리스어 실험용
Hani 중국어 실험용
Jpan 일본어 지원됨
Kore 한국어 지원됨
Latn 라틴어 지원됨
vi 베트남어 실험용