使用 Google Cloud 控制台將語音轉錄為文字

本快速入門導覽課程將介紹 Cloud Speech-to-Text 控制台。在本快速入門導覽中,您將建立及修正轉錄稿,並瞭解如何在自己的應用程式中,透過 Speech-to-Text API 使用這項設定。

如要瞭解如何使用 REST API (而非控制台) 傳送要求及接收回應,請參閱「開始前」頁面。

事前準備

如要開始使用 Speech-to-Text 控制台,請先在 Google Cloud Platform 控制台中啟用 API。下列步驟將逐步說明如何執行下列動作:

  • 在專案中啟用 Speech-to-Text。
  • 確認已啟用 Speech-to-Text 的計費功能。

設定您的 Google Cloud 專案

  1. 登入 Google Cloud 主控台

  2. 前往專案選取器頁面

    您可以選擇現有專案或建立新專案。如要進一步瞭解如何建立專案,請參閱 Google Cloud Platform 說明文件

  3. 如果您建立新專案,系統會提示您將帳單帳戶連結至該專案。如果您使用現有專案,請確認已啟用帳單服務。

    瞭解如何確認專案已啟用計費功能

  4. 選取專案並連結至帳單帳戶後,即可啟用 Speech-to-Text API。前往頁面頂端的「搜尋產品和資源」列,然後輸入「語音」

  5. 從結果清單中選取「Cloud Speech-to-Text API」

  6. 如要試用 Speech-to-Text,但不想將其連結至專案,請選擇「TRY THIS API」選項。如要啟用 Speech-to-Text API,以便在專案中使用,請按一下「啟用」

必要的角色

如要取得建立轉錄稿所需的權限,請要求管理員為您授予專案的儲存空間管理員 (roles/storage.admin) 身分與存取權管理角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

這個預先定義的角色具備建立轉錄稿所需的權限。如要查看確切的必要權限,請展開「必要權限」部分:

所需權限

如要建立轉錄稿,必須具備下列權限:

  • storage.buckets.get
  • storage.buckets.list
  • storage.buckets.update
  • 在專案或 bucket 層級:
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.update

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

建立轉錄稿

使用 Google Cloud 控制台建立轉錄內容。

音訊設定

  1. 開啟 Speech-to-Text 總覽

    Speech-to-Text 總覽頁面的螢幕截圖。

  2. 按一下「建立轉錄稿」

    • 如果您是第一次使用控制台,系統會要求您選擇要將設定和轉錄稿儲存在 Cloud Storage 的哪個位置。
      「語音轉文字」的「建立轉錄稿」頁面螢幕截圖。
  3. 在「建立轉錄稿」頁面中,上傳來源音訊檔案。 您可以選擇已儲存在 Cloud Storage 中的檔案,或是將新檔案上傳至指定的 Cloud Storage 目的地。

  4. 選取上傳音訊檔案的編碼類型

  5. 指定取樣率

  6. 按一下「繼續」。系統會將你帶往「語音轉錄選項」

語音轉錄選項

  1. 選取來源音訊的語言代碼。這是錄音中使用的語言。

  2. 選擇要用於檔案的轉錄模型。 系統會預先選取「預設」選項,一般來說不需要變更,但如果根據音訊類型選擇相符的模式,準確度可能會更高。請注意,模型費用會有所不同。

    「語音轉文字」的「建立轉錄稿」頁面螢幕截圖。

  3. 按一下「繼續」。系統會將您帶往「模型適應」

模型調整 (選用)

如果來源音訊包含罕見字詞、專有名詞或專有詞彙,且辨識結果有誤,模型調整功能可派上用場。

  1. 勾選「開啟模型調整功能」

  2. 選擇「一次性調整項資源」

  3. 新增相關片語,並為這些片語指定加成值

    「語音轉文字」的「建立轉錄稿」頁面螢幕截圖。

  4. 按一下左欄中的「提交」,即可建立轉錄稿。

查看轉錄稿

視音訊檔案大小而定,轉錄稿可能需要數分鐘到數小時才能產生。轉錄稿建立完成後,即可開始審查。依時間戳記排序表格,即可輕鬆找到最近的轉錄稿。

  1. 按一下要查看的轉錄稿名稱

    語音轉錄清單頁面的螢幕截圖。
  2. 比較轉錄文字與音訊檔案

    語音轉錄清單頁面的螢幕截圖。
  3. 如要變更,請按一下「重複使用設定」。 系統會帶您前往「建立轉錄稿」流程,並預先選取相同選項,方便您變更部分內容、建立新的轉錄稿,以及比較結果。

後續步驟