Ativar o filtro de linguagem obscena

Esta página descreve como usar o Speech-to-Text para detectar automaticamente palavras obscenas nos seus dados de áudio e censurá-las na transcrição.

Para ativar o filtro de linguagem obscena, defina profanityFilter=true no RecognitionFeatures. Se ativada, a Speech-to-Text tentará detectar palavras obscenas e retornará apenas a primeira letra seguida por asteriscos na transcrição (por exemplo, f***). Se este campo estiver definido como false ou não for definido, a Speech-to-Text não tentará filtrar as profanações.

Veja na amostra a seguir como ativar o filtro de linguagem obscena para reconhecer o áudio armazenado em um bucket do Cloud Storage.

Python

Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.

Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

from google.cloud import speech

def sync_recognize_with_profanity_filter_gcs(gcs_uri: str) -> speech.RecognizeResponse:
    client = speech.SpeechClient()

    audio = {"uri": gcs_uri}

    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.FLAC,
        sample_rate_hertz=16000,
        language_code="en-US",
        profanity_filter=True,
    )

    response = client.recognize(config=config, audio=audio)

    for result in response.results:
        alternative = result.alternatives[0]
        print(f"Transcript: {alternative.transcript}")

    return response.results