Abilitazione del filtro per il linguaggio volgare

In questa pagina viene descritto come utilizzare Speech-to-Text per rilevare automaticamente parole volgari nei dati audio e censurarle nella trascrizione.

Puoi attivare il filtro per il linguaggio volgare impostando profanityFilter=true nella RecognitionFeatures. Se questa opzione è abilitata, Speech-to-Text tenterà di rilevare parole volgari e restituirà solo la prima lettera seguita da asterischi nella trascrizione (ad esempio, f***). Se questo campo viene impostato su false o se non viene configurato, Speech-to-Text non tenterà di filtrare il linguaggio volgare.

Il seguente esempio mostra come attivare il filtro del linguaggio volgare per riconoscere l'audio archiviato in un bucket Cloud Storage.

Python

Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.

Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.

from google.cloud import speech

def sync_recognize_with_profanity_filter_gcs(gcs_uri: str) -> speech.RecognizeResponse:
    client = speech.SpeechClient()

    audio = {"uri": gcs_uri}

    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.FLAC,
        sample_rate_hertz=16000,
        language_code="en-US",
        profanity_filter=True,
    )

    response = client.recognize(config=config, audio=audio)

    for result in response.results:
        alternative = result.alternatives[0]
        print(f"Transcript: {alternative.transcript}")

    return response.results