Filter für vulgäre Sprache aktivieren

Auf dieser Seite wird beschrieben, wie Sie mit Speech-to-Text anstößige Wörter in Ihren Audiodaten automatisch erkennen und im Transkript zensieren.

Sie können den Filter für vulgäre Ausdrücke aktivieren, indem Sie RecognitionFeatures profanityFilter=true festlegen. Wenn diese Option aktiviert ist, versucht Speech-to-Text, anstößige Wörter zu erkennen und nur den ersten Buchstaben gefolgt von Sternchen im Transkript zurückzugeben (z. B. f***). Wenn dieses Feld auf false festgelegt oder nicht festgelegt ist, versucht Speech-to-Text nicht, Obszönitäten zu filtern.

Im folgenden Beispiel wird gezeigt, wie der Obszönitätenfilter aktiviert wird, um in einem Cloud Storage-Bucket gespeicherte Audiodaten zu erkennen.

Python

Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Python API.

Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

from google.cloud import speech

def sync_recognize_with_profanity_filter_gcs(gcs_uri: str) -> speech.RecognizeResponse:
    client = speech.SpeechClient()

    audio = {"uri": gcs_uri}

    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.FLAC,
        sample_rate_hertz=16000,
        language_code="en-US",
        profanity_filter=True,
    )

    response = client.recognize(config=config, audio=audio)

    for result in response.results:
        alternative = result.alternatives[0]
        print(f"Transcript: {alternative.transcript}")

    return response.results