La funzione ML.TRANSCRIBE
Questo documento descrive la funzione ML.TRANSCRIBE
, che consente di
trascrivere file audio da una
tabella degli oggetti.
Sintassi
ML.TRANSCRIBE( MODEL `project_id.dataset.model_name`, TABLE `project_id.dataset.object_table`, [RECOGNITION_CONFIG => ( JSON 'recognition_config')] )
Argomenti
ML.TRANSCRIBE
accetta i seguenti argomenti:
project_id
: l'ID del tuo progetto.dataset
: il set di dati BigQuery che contiene il modello.model
: il nome di un modello remoto con un valoreREMOTE_SERVICE_TYPE
diCLOUD_AI_SPEECH_TO_TEXT_V2
.object_table
: il nome della tabella dell'oggetto che contiene gli URI dei file audio.I file audio nella tabella degli oggetti devono essere di un tipo supportato. Viene restituito un errore per qualsiasi riga contenente file audio di tipo non supportato.
recognition_config
: un valoreSTRING
che contiene una risorsaRecognitionConfig
in formato JSON.Se è stato specificato un riconoscimento per il modello remoto utilizzando l'opzione
SPEECH_RECOGNIZER
, puoi facoltativamente specificare un valorerecognition_config
per sostituire la configurazione predefinita del riconoscimento specificato.Questo argomento è obbligatorio se non è stato specificato alcun riconoscimento per il modello remoto utilizzando l'opzione
SPEECH_RECOGNIZER
.
Output
ML.TRANSCRIBE
restituisce le seguenti colonne:
transcripts
: un valoreSTRING
che contiene le trascrizioni dell'elaborazione dei file audio.ml_transcribe_result
: un valoreJSON
che contiene il risultato dell'elaboratore di documenti dell'API Document AI.ml_transcribe_result_status
: un valoreSTRING
contenente lo stato della risposta API per la riga corrispondente. Questo valore è vuoto se l'operazione è riuscita.- Le colonne della tabella degli oggetti.
Quote
Consulta Quote e limiti delle funzioni di servizio Cloud AI.
Località
ML.TRANSCRIBE
deve essere eseguito nella stessa regione del modello remoto a cui fa riferimento la funzione. Puoi creare modelli basati su Speech-to-Text solo nelle seguenti località:
asia-northeast1
asia-south1
asia-southeast1
australia-southeast1
eu
europe-west1
europe-west2
europe-west3
europe-west4
northamerica-northeast1
us
us-central1
us-east1
us-east4
us-west1
Limitazioni
La funzione non può elaborare file audio di durata superiore a 1 minuto. Qualsiasi riga contenente questo file restituisce un errore.
Esempio
L'esempio seguente trascrive i file audio rappresentati dalla tabella audio
:
Crea il modello:
# Create model CREATE OR REPLACE MODEL `myproject.mydataset.transcribe_model` REMOTE WITH CONNECTION `myproject.myregion.myconnection` OPTIONS (remote_service_type = 'CLOUD_AI_SPEECH_TO_TEXT_V2', speech_recognizer = 'projects/project_number/locations/recognizer_location/recognizer/recognizer_id');
Trascrivi i file audio senza eseguire l'override della configurazione predefinita del riconoscimento:
SELECT * FROM ML.TRANSCRIBE( MODEL `myproject.mydataset.transcribe_model`, TABLE `myproject.mydataset.audio` );
Trascrivi i file audio e sostituisci la configurazione predefinita del riconoscimento:
SELECT * FROM ML.TRANSCRIBE( MODEL `myproject.mydataset.transcribe_model`, TABLE `myproject.mydataset.audio`, recognition_config => ( JSON '{"language_codes": ["en-US" ],"model": "telephony","auto_decoding_config": {}}') );
Il risultato è simile al seguente:
transcripts | ml_transcribe_result | ml_transcribe_status | uri | ... |
---|---|---|---|---|
Hey Google riproduci in streaming cose strane da Netflix alla TV. Ok, cose strane da Netflix che riproduco sulla TV smart home ed è solo... | {"metadata":{"total_billed_duration":{"seconds":56}},"results":[{"alternatives":[{"confidence":0.738729,"transcript"... | gs://mybucket/audio_files |
Passaggi successivi
- Ottieni istruzioni dettagliate su come trascrivere file audio da una tabella di oggetti utilizzando la funzione
ML.TRANSCRIBE
. - Per saperne di più sull'inferenza del modello, comprese le altre funzioni che puoi utilizzare per analizzare i dati di BigQuery, consulta Panoramica dell'inferenza del modello.
- Per informazioni sulle istruzioni e le funzioni SQL supportate per ogni tipo di modello, consulta Percorso dell'utente end-to-end per ogni modello.