ML.TRANSCRIBE 関数
このドキュメントでは、オブジェクト テーブルから音声ファイルを文字変換できる ML.TRANSCRIBE
関数について説明します。
構文
ML.TRANSCRIBE( MODEL `project_id.dataset.model_name`, TABLE `project_id.dataset.object_table`, [RECOGNITION_CONFIG => ( JSON 'recognition_config')] )
引数
ML.TRANSCRIBE
は次の引数を取ります。
project_id
: プロジェクト ID。dataset
: モデルを含む BigQuery データセット。model
:REMOTE_SERVICE_TYPE
がCLOUD_AI_SPEECH_TO_TEXT_V2
のリモートモデルの名前。object_table
: 音声ファイルの URI を含むオブジェクト テーブルの名前。オブジェクト テーブルの音声ファイルはサポートされているタイプである必要があります。サポートされていないタイプの音声ファイルが含まれる行に対しては、エラーが返されます。
recognition_config
: JSON 形式のRecognitionConfig
リソースを含むSTRING
値。SPEECH_RECOGNIZER
オプションを使用してリモートモデルに認識機能を指定した場合は、必要に応じてrecognition_config
値を指定して、指定された認識機能のデフォルト構成をオーバーライドできます。SPEECH_RECOGNIZER
オプションを使用してリモートモデルに認識機能を指定していない場合は、この引数は必須です。
出力
ML.TRANSCRIBE
は、次の列を返します。
transcripts
: 音声ファイルの処理を行った文字起こしを含むSTRING
値。ml_transcribe_result
: Document AI API からのドキュメント プロセッサの結果が含まれるJSON
値。ml_transcribe_result_status
: 対応する行の API レスポンス ステータスを含むSTRING
値。オペレーションが成功した場合、この値は空になります。- オブジェクト テーブルの列。
割り当て
Cloud AI サービスの関数の割り当てと上限をご覧ください。
ロケーション
ML.TRANSCRIBE
は、関数が参照するリモートモデルと同じリージョンで実行する必要があります。次のロケーションでのみ、Speech-to-Text に基づくモデルを作成できます。
asia-northeast1
asia-south1
asia-southeast1
australia-southeast1
eu
europe-west1
europe-west2
europe-west3
europe-west4
northamerica-northeast1
us
us-central1
us-east1
us-east4
us-west1
制限事項
この関数は、1 分を超える音声ファイルを処理することはできません。そのようなファイルを含む行では、エラーが返されます。
例
次の例では、audio
テーブルによって表される音声ファイルを文字変換します。
モデルを作成する:
# Create model CREATE OR REPLACE MODEL `myproject.mydataset.transcribe_model` REMOTE WITH CONNECTION `myproject.myregion.myconnection` OPTIONS (remote_service_type = 'CLOUD_AI_SPEECH_TO_TEXT_V2', speech_recognizer = 'projects/project_number/locations/recognizer_location/recognizer/recognizer_id');
認識機能のデフォルト構成をオーバーライドせずに、音声ファイルを音声文字変換します。
SELECT * FROM ML.TRANSCRIBE( MODEL `myproject.mydataset.transcribe_model`, TABLE `myproject.mydataset.audio` );
音声ファイルの文字変換を行い、認識機能のデフォルト構成をオーバーライドします。
SELECT * FROM ML.TRANSCRIBE( MODEL `myproject.mydataset.transcribe_model`, TABLE `myproject.mydataset.audio`, recognition_config => ( JSON '{"language_codes": ["en-US" ],"model": "telephony","auto_decoding_config": {}}') );
次のような結果になります。
transcripts | ml_transcripte_result | ml_transcripte_status | uri | ... |
---|---|---|---|---|
OK Google、Netflix からストレンジャー・シングスをテレビにストリーミングして。さて、Netflix のストレンジャー・シングスがテレビのスマートホームで放映されていて... | {"metadata":{"total_billed_duration":{"seconds":56}},"results":[{"alternatives":[{"confidence":0.738729,"transcript"... | gs://mybucket/audio_files |
次のステップ
ML.TRANSCRIBE
関数を使用してオブジェクト テーブルの音声ファイルを文字変換する手順を確認する。- BigQuery データの分析に使用できるその他の関数を含むモデル推定の詳細については、モデル推定の概要をご覧ください。
- 各モデルタイプでサポートされている SQL ステートメントと関数については、各モデルのエンドツーエンドのユーザー ジャーニーをご覧ください。