Ativar o filtro de linguagem obscena

Esta página descreve como usar o Speech-to-Text para detectar automaticamente palavras obscenas nos seus dados de áudio e censurá-las na transcrição.

Para ativar o filtro de linguagem obscena, defina profanityFilter=true no RecognitionFeatures. Se ativada, a Speech-to-Text tentará detectar palavras obscenas e retornará apenas a primeira letra seguida por asteriscos na transcrição (por exemplo, f***). Se este campo estiver definido como false ou não for definido, a Speech-to-Text não tentará filtrar as profanações.

Veja na amostra a seguir como ativar o filtro de linguagem obscena para reconhecer o áudio armazenado em um bucket do Cloud Storage.

Python

Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.

Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

from google.cloud import speech
from google.cloud.speech import RecognizeResponse


def sync_recognize_with_profanity_filter_gcs(audio_uri: str) -> RecognizeResponse:
    """Recognizes speech from an audio file in Cloud Storage and filters out profane language.
    Args:
        audio_uri (str): The Cloud Storage URI of the input audio, e.g., gs://[BUCKET]/[FILE]
    Returns:
        cloud_speech.RecognizeResponse: The full response object which includes the transcription results.
    """
    # Define the audio source
    audio = {"uri": audio_uri}

    client = speech.SpeechClient()
    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.FLAC,  # Audio format
        sample_rate_hertz=16000,
        language_code="en-US",
        # Enable profanity filter
        profanity_filter=True,
    )

    response = client.recognize(config=config, audio=audio)

    for result in response.results:
        alternative = result.alternatives[0]
        print(f"Transcript: {alternative.transcript}")

    return response.results