ML.TRANSCRIBE 関数

このドキュメントでは、オブジェクト テーブルから音声ファイルを文字変換できる ML.TRANSCRIBE 関数について説明します。

構文

ML.TRANSCRIBE(
  MODEL `project_id.dataset.model_name`,
  TABLE `project_id.dataset.object_table`,
  [RECOGNITION_CONFIG => ( JSON 'recognition_config')]
)

引数

ML.TRANSCRIBE は次の引数を取ります。

  • project_id: プロジェクト ID。

  • dataset: モデルを含む BigQuery データセット。

  • model: REMOTE_SERVICE_TYPECLOUD_AI_SPEECH_TO_TEXT_V2リモートモデルの名前。

  • object_table: 音声ファイルの URI を含むオブジェクト テーブルの名前。

    オブジェクト テーブルの音声ファイルはサポートされているタイプである必要があります。サポートされていないタイプの音声ファイルが含まれる行に対しては、エラーが返されます。

  • recognition_config: JSON 形式の RecognitionConfig リソースを含む STRING 値。

    SPEECH_RECOGNIZER オプションを使用してリモートモデルに認識機能を指定した場合は、必要に応じて recognition_config 値を指定して、指定された認識機能のデフォルト構成をオーバーライドできます。

    SPEECH_RECOGNIZER オプションを使用してリモートモデルに認識機能を指定していない場合は、この引数は必須です。

出力

ML.TRANSCRIBE は、次の列を返します。

  • transcripts: 音声ファイルの処理を行った文字起こしを含む STRING 値。
  • ml_transcribe_result: Document AI API からのドキュメント プロセッサの結果が含まれる JSON 値。
  • ml_transcribe_result_status: 対応する行の API レスポンス ステータスを含む STRING 値。オペレーションが成功した場合、この値は空になります。
  • オブジェクト テーブルの列。

割り当て

Cloud AI サービスの関数の割り当てと上限をご覧ください。

ロケーション

ML.TRANSCRIBE は、関数が参照するリモートモデルと同じリージョンで実行する必要があります。次のロケーションでのみ、Speech-to-Text に基づくモデルを作成できます。

  • asia-northeast1
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west1
  • europe-west2
  • europe-west3
  • europe-west4
  • northamerica-northeast1
  • us
  • us-central1
  • us-east1
  • us-east4
  • us-west1

制限事項

この関数は、1 分を超える音声ファイルを処理することはできません。そのようなファイルを含む行では、エラーが返されます。

次の例では、audio テーブルによって表される音声ファイルを文字変換します。

モデルを作成する:

# Create model
CREATE OR REPLACE MODEL
`myproject.mydataset.transcribe_model`
REMOTE WITH CONNECTION `myproject.myregion.myconnection`
OPTIONS (remote_service_type = 'CLOUD_AI_SPEECH_TO_TEXT_V2',
speech_recognizer = 'projects/project_number/locations/recognizer_location/recognizer/recognizer_id');

認識機能のデフォルト構成をオーバーライドせずに、音声ファイルを音声文字変換します。

SELECT *
FROM ML.TRANSCRIBE(
  MODEL `myproject.mydataset.transcribe_model`,
  TABLE `myproject.mydataset.audio`
);

音声ファイルの文字変換を行い、認識機能のデフォルト構成をオーバーライドします。

SELECT *
FROM ML.TRANSCRIBE(
  MODEL `myproject.mydataset.transcribe_model`,
  TABLE `myproject.mydataset.audio`,
  recognition_config => ( JSON '{"language_codes": ["en-US" ],"model": "telephony","auto_decoding_config": {}}')
);

次のような結果になります。

transcripts ml_transcripte_result ml_transcripte_status uri ...
OK Google、Netflix からストレンジャー・シングスをテレビにストリーミングして。さて、Netflix のストレンジャー・シングスがテレビのスマートホームで放映されていて... {"metadata":{"total_billed_duration":{"seconds":56}},"results":[{"alternatives":[{"confidence":0.738729,"transcript"... gs://mybucket/audio_files

次のステップ