Membuat dialog dengan beberapa pembicara

Halaman ini menjelaskan cara membuat dialog dengan beberapa pembicara yang dibuat oleh Text-to-Speech.

Anda dapat membuat audio dengan beberapa pembicara untuk membuat dialog. Hal ini dapat berguna untuk wawancara, cerita interaktif, game video, platform e-learning, dan solusi aksesibilitas.

Suara berikut didukung untuk audio dengan beberapa pembicara:

  • en-US-Studio-Multispeaker
    • speaker: R
    • speaker: S
    • speaker: T
    • speaker: U

Contoh. Contoh ini adalah audio yang dihasilkan menggunakan beberapa pembicara.

Contoh cara menggunakan markup multi-pembicara

Ini adalah contoh yang menunjukkan cara menggunakan markup multi-penceramah.


Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech Python API.

Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.

"""Synthesizes speech for multiple speakers.
Make sure to be working in a virtual environment.
from import texttospeech_v1beta1 as texttospeech

# Instantiates a client
client = texttospeech.TextToSpeechClient()

multi_speaker_markup = texttospeech.MultiSpeakerMarkup(
            text="I've heard that the Google Cloud multi-speaker audio generation sounds amazing!",
            text="Oh? What's so good about it?", speaker="S"
        texttospeech.MultiSpeakerMarkup.Turn(text="Well..", speaker="R"),
        texttospeech.MultiSpeakerMarkup.Turn(text="Well what?", speaker="S"),
            text="Well, you should find it out by yourself!", speaker="R"
            text="Alright alright, let's try it out!", speaker="S"

# Set the text input to be synthesized
synthesis_input = texttospeech.SynthesisInput(

# Build the voice request, select the language code ('en-US') and the voice
voice = texttospeech.VoiceSelectionParams(
    language_code="en-US", name="en-US-Studio-MultiSpeaker"

# Select the type of audio file you want returned
audio_config = texttospeech.AudioConfig(

# Perform the text-to-speech request on the text input with the selected
# voice parameters and audio file type
response = client.synthesize_speech(
    input=synthesis_input, voice=voice, audio_config=audio_config

# The response's audio_content is binary.
with open("output.mp3", "wb") as out:
    # Write the response to the output file.
    print('Audio content written to file "output.mp3"')