Coba Gemini 1.5 Pro, model multimodal kami yang paling canggih di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token 1 juta. Coba Gemini 1.5 Pro, model multimodal kami yang paling canggih di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token 1 juta.

Menyiapkan Speech-to-Text

Speech-to-Text adalah API yang didukung oleh teknologi kecerdasan buatan (AI) Google. Anda mengirimkan data audio ke Speech-to-Text, lalu menerima transkripsi teks data audio Anda sebagai respons.

Untuk informasi selengkapnya tentang cara membuat permintaan Speech-to-Text, lihat halaman permintaan.

Ringkasan

Sebelum dapat mulai mengirim permintaan ke Speech-to-Text, Anda harus mengaktifkan API di konsol Google Cloud. Langkah-langkah di halaman ini akan memandu Anda melakukan tindakan berikut:

Mengaktifkan Speech-to-Text di sebuah project.
Pastikan penagihan diaktifkan untuk Speech-to-Text.
(Opsional) Buat bucket Google Cloud Storage baru untuk menyimpan data audio Anda.

Sebelum Memulai

Ada dua cara untuk mengakses layanan ini: menggunakan REST API dan menggunakan Speech-to-Text Console. Kami menyediakan contoh kode yang menunjukkan cara membuat permintaan ke REST API dan menerima respons. Anda dapat mempelajari cara menggunakan contoh ini dengan mengikuti panduan memulai dan panduan cara kerja Speech-to-Text. Jika ingin menggunakan Speech-to-Text dengan coding minimal, Anda dapat menggunakan Cloud Speech-to-Text Console.

Panduan ini membahas langkah-langkah yang diperlukan untuk mulai mengirim permintaan ke REST API. Jika Anda baru mengenal coding, sebaiknya mulai dengan tutorial langkah demi langkah dalam konsol di Google Cloud Platform sebelum memulai panduan memulai ini.

Menyiapkan project Google Cloud untuk Speech-to-Text

Login ke konsol Google Cloud
Buka halaman pemilih project

Anda dapat memilih project yang sudah ada atau membuat project baru. Untuk informasi selengkapnya tentang cara membuat project, lihat Membuat dan mengelola project.
Jika membuat project baru, Anda akan diminta untuk menautkan akun penagihan ke project ini. Jika menggunakan project yang sudah ada, pastikan Anda telah mengaktifkan penagihan.

Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda

Catatan: Anda harus mengaktifkan penagihan agar dapat menggunakan Speech-to-Text API, tetapi Anda tidak akan dikenai biaya kecuali jika melebihi kuota gratis. Lihat pricing untuk mengetahui detail selengkapnya.
Setelah memilih project dan menautkannya ke akun penagihan, Anda dapat mengaktifkan Speech-to-Text API. Buka kotak Search products and resources di bagian atas halaman dan ketik "speech". Pilih Cloud Speech-to-Text API dari daftar hasil.
Untuk mencoba Speech-to-Text tanpa menautkannya ke project Anda, pilih opsi TRY THIS API. Untuk mengaktifkan Speech-to-Text API agar dapat digunakan dengan project Anda, klik ENABLE.
(Opsional) Aktifkan logging data. Dengan memilih mengaktifkan logging data, Anda mengizinkan Google merekam data audio apa pun yang Anda kirim ke Speech-to-Text. Data ini digunakan untuk meningkatkan kualitas model Speech-to-Text. Pengguna yang memilih mengaktifkan logging data akan mendapatkan manfaat berupa harga yang lebih rendah. Lihat halaman pricing serta persyaratan dan ketentuan logging data untuk informasi selengkapnya.

Opsional: Membuat bucket Cloud Storage

Jika ingin mentranskripsi audio dengan durasi lebih dari 60 detik atau ukuran file lebih dari 10 MB, Anda harus menyimpan data audio ini di bucket Cloud Storage agar dapat mentranskripsikannya menggunakan Speech-to-Text. Langkah-langkah berikut akan memandu Anda menyelesaikan proses pembuatan bucket baru.

Di Konsol Google Cloud, buka halaman Bucket Cloud Storage.

Buka halaman Bucket

Klik Buat bucket.

Di halaman Buat bucket, masukkan informasi bucket Anda. Untuk melanjutkan ke langkah berikutnya, klik Lanjutkan.

Untuk Beri nama bucket Anda, masukkan nama bucket yang unik. Jangan sertakan informasi sensitif pada nama bucket, karena namespace bucket bersifat global dan dapat dilihat publik.
Untuk Pilih tempat untuk menyimpan data, lakukan tindakan berikut:
- Pilih opsi Jenis lokasi.
- Pilih opsi Lokasi.
Untuk Memilih kelas penyimpanan default untuk data Anda, pilih kelas penyimpanan.
Untuk Memilih cara mengontrol akses ke objek, pilih opsi Kontrol akses.
Untuk Setelan lanjutan (opsional), tentukan metode enkripsi, kebijakan retensi, atau label bucket.

Klik Buat.

Menonaktifkan Speech-to-Text API

Selesaikan langkah-langkah berikut jika Anda tidak perlu lagi menggunakan Speech-to-Text API pada masa mendatang.

Buka dasbor Google Cloud, lalu klik link Go to APIs overview di kotak APIs.
Pilih Cloud Speech-to-Text API.
Klik tombol DISABLE API di bagian atas halaman Cloud Speech-to-Text API.

Langkah selanjutnya

Pelajari cara mengirim permintaan transkripsi ke Speech-to-Text API menggunakan library klien, gcloud, command line, atau UI Speech-to-Text.