評估模型

使用 Cloud Speech-to-Text 控制台的基準化功能,評估 Speech-to-Text V2 API 中使用的任何轉錄模型準確度。

Cloud Speech-to-Text 控制台提供預先訓練和 Custom Speech-to-Text 模型的視覺化基準測試。您可以比較多個轉錄模型的字詞錯誤率 (WER) 評估指標,檢查辨識品質,進而決定哪個模型最適合您的應用程式。

事前準備

請確認您已註冊 Google Cloud 帳戶、建立專案、訓練自訂語音模型,並透過端點部署模型。

建立基本事實資料集

如要建立自訂基準化資料集,請收集音訊樣本,準確反映轉錄模型在實際工作環境中會遇到的流量類型。這些音訊檔案的總長度應至少為 30 分鐘,且不得超過 10 小時。如要組裝資料集,請執行下列操作:

  1. 在所選的 Cloud Storage 值區中建立目錄,以儲存資料集的音訊和文字檔。
  2. 為資料集中的每個音訊檔案建立合理準確的轉錄稿。請為每個音訊檔案 (例如 example_audio_1.wav) 建立對應的基準真相文字檔案 (example_audio_1.txt)。這項服務會使用 Cloud Storage bucket 中的音訊和文字配對,組建資料集。

將模型基準化

使用自訂語音轉文字模型和基準資料集評估模型準確度,然後按照「評估及提升準確度」指南操作。