偵測圖片中的文字

光學字元辨識 (OCR)

Vision API 可偵測及擷取圖片中的文字。有兩項註解功能支援光學字元辨識 (OCR):

  • TEXT_DETECTION 會偵測並從任何圖片中擷取文字。舉例來說,相片可能含有路牌或交通號誌。JSON 包含整個擷取的字串、個別字詞,以及這些字詞的周框。

    路標圖片

  • DOCUMENT_TEXT_DETECTION 也會從圖片中擷取文字,但回覆內容經過最佳化,適用於密集文字和文件。JSON 包含網頁、區塊、段落、字詞和換行資訊。

    含有註解的密集圖片

    進一步瞭解如何DOCUMENT_TEXT_DETECTION從檔案 (PDF/TIFF) 擷取手寫內容文字

歡迎試用

如果您未曾使用過 Google Cloud,歡迎建立帳戶,親自體驗實際使用 Cloud Vision 的成效。新客戶可以獲得價值 $300 美元的免費抵免額,可用於執行、測試及部署工作負載。

免費試用 Cloud Vision

文字偵測要求

設定 Google Cloud 專案和驗證