Package google.cloud.speech.v2

Indeks

Speech

Mengaktifkan transkripsi ucapan dan pengelolaan resource.

BatchRecognize

rpc BatchRecognize(BatchRecognizeRequest) returns (Operation)

Melakukan pengenalan ucapan asinkron batch: mengirim permintaan dengan file N audio dan menerima operasi yang berjalan lama yang dapat di-polling untuk mengetahui kapan transkripsi selesai.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

CreateCustomClass

rpc CreateCustomClass(CreateCustomClassRequest) returns (Operation)

Membuat CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.customClasses.create

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

CreatePhraseSet

rpc CreatePhraseSet(CreatePhraseSetRequest) returns (Operation)

Membuat PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.phraseSets.create

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

CreateRecognizer

rpc CreateRecognizer(CreateRecognizerRequest) returns (Operation)

Membuat Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.recognizers.create

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

DeleteCustomClass

rpc DeleteCustomClass(DeleteCustomClassRequest) returns (Operation)

Menghapus CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.delete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

DeletePhraseSet

rpc DeletePhraseSet(DeletePhraseSetRequest) returns (Operation)

Menghapus PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.delete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

DeleteRecognizer

rpc DeleteRecognizer(DeleteRecognizerRequest) returns (Operation)

Menghapus Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.delete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

GetConfig

rpc GetConfig(GetConfigRequest) returns (Config)

Menampilkan Config yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.config.get

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

GetCustomClass

rpc GetCustomClass(GetCustomClassRequest) returns (CustomClass)

Menampilkan CustomClass yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.get

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

GetPhraseSet

rpc GetPhraseSet(GetPhraseSetRequest) returns (PhraseSet)

Menampilkan PhraseSet yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.get

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

GetRecognizer

rpc GetRecognizer(GetRecognizerRequest) returns (Recognizer)

Menampilkan Recognizer yang diminta. Gagal dengan NOT_FOUND jika Pengenal yang diminta tidak ada.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.get

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

ListCustomClasses

rpc ListCustomClasses(ListCustomClassesRequest) returns (ListCustomClassesResponse)

Mencantumkan CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.customClasses.list

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

ListPhraseSets

rpc ListPhraseSets(ListPhraseSetsRequest) returns (ListPhraseSetsResponse)

Mencantumkan PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.phraseSets.list

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

ListRecognizers

rpc ListRecognizers(ListRecognizersRequest) returns (ListRecognizersResponse)

Pengenal Daftar.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.recognizers.list

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

Kenali

rpc Recognize(RecognizeRequest) returns (RecognizeResponse)

Melakukan pengenalan Ucapan sinkron: menerima hasil setelah semua audio dikirim dan diproses.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

StreamingRecognize

rpc StreamingRecognize(StreamingRecognizeRequest) returns (StreamingRecognizeResponse)

Melakukan pengenalan ucapan streaming dua arah: menerima hasil saat mengirimkan audio. Metode ini hanya tersedia melalui gRPC API (bukan REST).

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UndeleteCustomClass

rpc UndeleteCustomClass(UndeleteCustomClassRequest) returns (Operation)

Membatalkan penghapusan CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.undelete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UndeletePhraseSet

rpc UndeletePhraseSet(UndeletePhraseSetRequest) returns (Operation)

Membatalkan penghapusan PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.undelete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UndeleteRecognizer

rpc UndeleteRecognizer(UndeleteRecognizerRequest) returns (Operation)

Membatalkan penghapusan Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.undelete

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UpdateConfig

rpc UpdateConfig(UpdateConfigRequest) returns (Config)

Mengupdate Config.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.config.update

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UpdateCustomClass

rpc UpdateCustomClass(UpdateCustomClassRequest) returns (Operation)

Mengupdate CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.update

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UpdatePhraseSet

rpc UpdatePhraseSet(UpdatePhraseSetRequest) returns (Operation)

Mengupdate PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.update

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

UpdateRecognizer

rpc UpdateRecognizer(UpdateRecognizerRequest) returns (Operation)

Mengupdate Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.update

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

AccessMetadata

Metadata akses untuk region tertentu. Ini dapat diterapkan jika kebijakan organisasi untuk project tertentu melarang region tertentu.

Kolom
constraint_type

ConstraintType

Menjelaskan berbagai jenis batasan yang diterapkan.

ConstraintType

Menjelaskan berbagai jenis batasan yang dapat diterapkan pada suatu wilayah.

Enum
CONSTRAINT_TYPE_UNSPECIFIED Batasan yang belum ditetapkan diterapkan.
RESOURCE_LOCATIONS_ORG_POLICY_CREATE_CONSTRAINT Kebijakan organisasi project melarang region yang ditentukan.

AutoDetectDecodingConfig

Jenis ini tidak memiliki kolom.

Parameter decoding terdeteksi secara otomatis. Didukung untuk encoding berikut:

  • WAV_LINEAR16: Sampel PCM little-endian 16-bit yang ditandatangani dalam container WAV.

  • WAV_MULAW: Sampel mulaw yang digabungkan 8-bit dalam container WAV.

  • WAV_ALAW: Sampel alaw yang digabungkan 8-bit dalam penampung WAV.

  • RFC4867_5_AMR: Frame AMR dengan header rfc4867.5.

  • RFC4867_5_AMRWB: Frame AMR-WB dengan header rfc4867.5.

  • FLAC: Bingkai FLAC dalam format container "FLAC native".

  • MP3: Bingkai audio MPEG dengan metadata ID3 opsional (diabaikan).

  • OGG_OPUS: Bingkai audio Opus dalam penampung Ogg.

  • WEBM_OPUS: Bingkai audio Opus dalam penampung WebM.

  • M4A: Format audio M4A.

BatchRecognizeFileMetadata

Metadata tentang satu file dalam batch untuk BatchRecognize.

Kolom
config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config resource Pengenal serta config di tingkat permintaan.

config_mask

FieldMask

Daftar kolom di config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

Kolom union audio_source. Sumber audio, yang merupakan URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut:
uri

string

Cloud Storage URI untuk file audio.

BatchRecognizeFileResult

Hasil akhir untuk satu file.

Kolom
error

Status

Error jika ditemukan salah satunya.

metadata

RecognitionResponseMetadata

uri
(deprecated)

string

Tidak digunakan lagi. Sebagai gantinya, gunakan cloud_storage_result.native_format_uri.

transcript
(deprecated)

BatchRecognizeResults

Tidak digunakan lagi. Sebagai gantinya, gunakan inline_result.transcript.

Kolom union result.

result hanya dapat berupa salah satu dari yang berikut:

cloud_storage_result

CloudStorageResult

Hasil pengenalan yang ditulis ke Cloud Storage. Kolom ini hanya diisi saat GcsOutputConfig ditetapkan di [RecognitionOutputConfig][google.cloud.speech.v2.RecognitionOutputConfig.

inline_result

InlineResult

Hasil pengenalan. Kolom ini hanya diisi saat InlineOutputConfig ditetapkan di [RecognitionOutputConfig][google.cloud.speech.v2.RecognitionOutputConfig.

BatchRecognizeMetadata

Metadata operasi untuk BatchRecognize.

Kolom
transcription_metadata

map<string, BatchRecognizeTranscriptionMetadata>

Memetakan dari nama file yang diberikan ke metadata transkripsi untuk file tersebut.

BatchRecognizeRequest

Pesan permintaan untuk metode BatchRecognize.

Kolom
recognizer

string

Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit kosong.

config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config resource Pengenal.

config_mask

FieldMask

Daftar kolom di config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom yang ditentukan di config akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

files[]

BatchRecognizeFileMetadata

File audio dengan metadata file untuk ASR. Jumlah file maksimum yang diizinkan untuk ditentukan adalah 5.

recognition_output_config

RecognitionOutputConfig

Opsi konfigurasi untuk tempat menampilkan transkrip setiap file.

processing_strategy

ProcessingStrategy

Strategi pemrosesan yang akan digunakan untuk permintaan ini.

ProcessingStrategy

Strategi pemrosesan yang mungkin digunakan untuk permintaan batch.

Enum
PROCESSING_STRATEGY_UNSPECIFIED Nilai default untuk strategi pemrosesan. Permintaan akan diproses segera setelah diterima.
DYNAMIC_BATCHING Jika dipilih, proses permintaan selama periode penggunaan yang lebih rendah untuk mendapatkan diskon harga. Permintaan akan dipenuhi dalam waktu 24 jam.

BatchRecognizeResponse

Pesan respons untuk BatchRecognize yang dikemas ke dalam Operation yang berjalan lama.

Kolom
results

map<string, BatchRecognizeFileResult>

Petakan dari nama file ke hasil akhir file tersebut.

total_billed_duration

Duration

Jika tersedia, detik audio yang ditagih untuk permintaan terkait.

BatchRecognizeResults

Jenis output untuk Cloud Storage transkrip BatchRecognize. Meskipun proto ini tidak ditampilkan dalam API ini di mana pun, transkrip Cloud Storage akan diserialisasi proto ini dan harus diurai seperti itu.

Kolom
results[]

SpeechRecognitionResult

Daftar hasil transkripsi berurutan yang sesuai dengan bagian audio yang berurutan.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

BatchRecognizeTranscriptionMetadata

Metadata tentang transkripsi untuk satu file (misalnya, persentase progres).

Kolom
progress_percent

int32

Jumlah file yang telah ditranskripsikan sejauh ini.

error

Status

Error jika ditemukan salah satunya.

uri

string

URI Cloud Storage tempat hasil pengenalan akan ditulis.

CloudStorageResult

Hasil akhir ditulis ke Cloud Storage.

Kolom
uri

string

URI Cloud Storage tempat hasil pengenalan ditulis.

vtt_format_uri

string

URI Cloud Storage tempat hasil pengenalan ditulis sebagai teks berformat VTT. Kolom ini hanya diisi saat output VTT diminta.

srt_format_uri

string

URI Cloud Storage tempat hasil pengenalan ditulis sebagai teks berformat SRT. Kolom ini hanya diisi saat output SRT diminta.

Konfigurasi

Pesan yang merepresentasikan konfigurasi untuk Speech-to-Text API. Hal ini mencakup kunci KMS opsional yang akan digunakan untuk mengenkripsi data yang masuk.

Kolom
name

string

Hanya output. Pengenal. Nama resource konfigurasi. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

kms_key_name

string

Opsional. Nama kunci KMS opsional yang jika ada, akan digunakan untuk mengenkripsi resource Speech-to-Text dalam penyimpanan. Memperbarui kunci ini tidak akan mengenkripsi resource yang ada menggunakan kunci ini. Hanya resource baru yang akan dienkripsi menggunakan kunci ini. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

update_time

Timestamp

Hanya output. Terakhir kali resource ini diubah.

CreateCustomClassRequest

Pesan permintaan untuk metode CreateCustomClass.

Kolom
custom_class

CustomClass

Wajib. CustomClass yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass, tetapi jangan benar-benar membuatnya.

custom_class_id

string

ID yang akan digunakan untuk CustomClass, yang akan menjadi komponen akhir dari nama resource CustomClass.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat CustomClass ini akan dibuat. Format yang diharapkan adalah projects/{project}/locations/{location}.

CreatePhraseSetRequest

Pesan permintaan untuk metode CreatePhraseSet.

Kolom
phrase_set

PhraseSet

Wajib. PhraseSet yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau PhraseSet, tetapi jangan benar-benar membuatnya.

phrase_set_id

string

ID yang akan digunakan untuk PhraseSet, yang akan menjadi komponen akhir dari nama resource PhraseSet.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat PhraseSet ini akan dibuat. Format yang diharapkan adalah projects/{project}/locations/{location}.

CreateRecognizerRequest

Pesan permintaan untuk metode CreateRecognizer.

Kolom
recognizer

Recognizer

Wajib. Pengenal yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau Pengenal, tetapi jangan benar-benar membuatnya.

recognizer_id

string

ID yang akan digunakan untuk Pengenal, yang akan menjadi komponen akhir nama resource Pengenal.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat Pengenal ini akan dibuat. Format yang diharapkan adalah projects/{project}/locations/{location}.

CustomClass

CustomClass untuk pembiasan dalam pengenalan ucapan. Digunakan untuk mendefinisikan kumpulan kata atau frasa yang mewakili konsep atau tema umum yang mungkin muncul di audio Anda, misalnya daftar nama kapal penumpang.

Kolom
name

string

Hanya output. Pengenal. Nama resource CustomClass. Format projects/{project}/locations/{location}/customClasses/{custom_class}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk CustomClass.

display_name

string

Opsional. Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk CustomClass. Harus terdiri dari 63 karakter atau kurang.

items[]

ClassItem

Koleksi item kelas.

state

State

Hanya output. Status siklus proses CustomClass.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Terakhir kali resource ini diubah.

delete_time

Timestamp

Hanya output. Waktu saat resource ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu saat resource ini akan dihapus permanen.

annotations

map<string, string>

Opsional. Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari 63 karakter atau kurang. Maksimal 100 anotasi.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah CustomClass ini sedang dalam proses diupdate atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

ClassItem

Item dari class.

Kolom
value

string

Nilai item kelas.

Negara bagian/Provinsi

Kumpulan status yang menentukan siklus proses CustomClass.

Enum
STATE_UNSPECIFIED Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan.
ACTIVE Status normal dan aktif.
DELETED CustomClass ini telah dihapus.

DeleteCustomClassRequest

Pesan permintaan untuk metode DeleteCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan dihapus. Format: projects/{project}/locations/{location}/customClasses/{custom_class}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke true, dan CustomClass tidak ditemukan, permintaan akan berhasil dan tanpa pengoperasian (tidak ada Operasi yang dicatat dalam kasus ini).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

DeletePhraseSetRequest

Pesan permintaan untuk metode DeletePhraseSet.

Kolom
name

string

Wajib. Nama PhraseSet yang akan dihapus. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau PhraseSet yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke true, dan PhraseSet tidak ditemukan, permintaan akan berhasil dan tanpa pengoperasian (tidak ada Operasi yang dicatat dalam kasus ini).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

DeleteRecognizerRequest

Pesan permintaan untuk metode DeleteRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan dihapus. Format: projects/{project}/locations/{location}/recognizers/{recognizer}

validate_only

bool

Jika disetel, validasi permintaan dan pratinjau Pengenal yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke benar (true), dan Pengenal tidak ditemukan, permintaan akan berhasil dan tanpa pengoperasian (tidak ada Operasi yang dicatat dalam kasus ini).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

ExplicitDecodingConfig

Parameter decoding yang ditentukan secara eksplisit.

Kolom
encoding

AudioEncoding

Wajib. Encoding data audio yang dikirim untuk pengenalan.

sample_rate_hertz

int32

Frekuensi sampel data audio dalam Hertz yang dikirim untuk pengenalan. Nilai yang valid adalah: 8000-48000. 16.000 sudah optimal. Untuk hasil terbaik, setel frekuensi sampling sumber audio ke 16.000 Hz. Jika tidak memungkinkan, gunakan frekuensi sampel native dari sumber audio (bukan pengambilan ulang sampel). Didukung untuk encoding berikut:

  • LINEAR16: Sampel PCM kecil 16-bit tanpa header yang ditandatangani.

  • MULAW: Sampel mulaw yang digabungkan tanpa header 8-bit.

  • ALAW: Sampel alaw tanpa header 8-bit.

audio_channel_count

int32

Jumlah channel yang ada dalam data audio yang dikirim untuk pengenalan. Didukung untuk encoding berikut:

  • LINEAR16: Sampel PCM kecil 16-bit tanpa header yang ditandatangani.

  • MULAW: Sampel mulaw yang digabungkan tanpa header 8-bit.

  • ALAW: Sampel alaw tanpa header 8-bit.

Nilai maksimum yang diizinkan adalah 8.

AudioEncoding

Encoding data audio yang didukung.

Enum
AUDIO_ENCODING_UNSPECIFIED Nilai default. Nilai ini tidak digunakan.
LINEAR16 Sampel PCM kecil 16-bit tanpa header yang ditandatangani.
MULAW Sampel mulaw yang digabungkan 8-bit header.
ALAW Sampel alaw tanpa header 8-bit.

GcsOutputConfig

Konfigurasi output untuk Cloud Storage.

Kolom
uri

string

Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan.

GetConfigRequest

Pesan permintaan untuk metode GetConfig.

Kolom
name

string

Wajib. Nama konfigurasi yang akan diambil. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

GetCustomClassRequest

Pesan permintaan untuk metode GetCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/customClasses/{custom_class}.

GetPhraseSetRequest

Pesan permintaan untuk metode GetPhraseSet.

Kolom
name

string

Wajib. Nama PhraseSet yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/phraseSets/{phrase_set}.

GetRecognizerRequest

Pesan permintaan untuk metode GetRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}.

InlineOutputConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk respons inline.

InlineResult

Hasil akhir yang ditampilkan inline dalam respons pengenalan.

Kolom
transcript

BatchRecognizeResults

Transkrip untuk file audio.

vtt_captions

string

Transkrip untuk file audio sebagai teks berformat VTT. Kolom ini hanya diisi saat output VTT diminta.

srt_captions

string

Transkrip untuk file audio sebagai teks berformat SRT. Kolom ini hanya diisi saat output SRT diminta.

LanguageMetadata

Metadata tentang lokalitas yang tersedia di region tertentu. Saat ini, hanya model yang tersedia untuk setiap lokalitas

Kolom
models

map<string, ModelMetadata>

Peta lokal (kode bahasa) -> model

ListCustomClassesRequest

Pesan permintaan untuk metode ListCustomClasses.

Kolom
parent

string

Wajib. Project dan lokasi resource CustomClass yang akan dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah hasil per permintaan. Page_size yang valid memiliki rentang dari 0 hingga 100 inklusif. Jika page_size adalah nol atau tidak ditentukan, ukuran halaman 5 akan dipilih. Jika ukuran halaman melebihi 100, ukuran akan dikonversi menjadi 100. Perhatikan bahwa panggilan mungkin menampilkan hasil yang lebih sedikit daripada ukuran halaman yang diminta.

page_token

string

Token halaman, diterima dari panggilan ListCustomClasses sebelumnya. Berikan ini untuk mengambil halaman berikutnya.

Saat melakukan penomoran halaman, semua parameter lain yang disediakan ke ListCustomClasses harus cocok dengan panggilan yang disediakan token halaman.

show_deleted

bool

Apakah menampilkan fasilitas yang telah dihapus atau tidak.

ListCustomClassesResponse

Pesan respons untuk metode ListCustomClasses.

Kolom
custom_classes[]

CustomClass

Daftar CustomClass yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak akan ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

ListPhraseSetsRequest

Pesan permintaan untuk metode ListPhraseSets.

Kolom
parent

string

Wajib. Project dan lokasi resource PhraseSet yang ingin dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah maksimum PhraseSets yang ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 PhraseSet akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100.

page_token

string

Token halaman, diterima dari panggilan ListPhraseSets sebelumnya. Berikan ini untuk mengambil halaman berikutnya.

Saat melakukan penomoran halaman, semua parameter lain yang disediakan ke ListPhraseSets harus cocok dengan panggilan yang disediakan token halaman.

show_deleted

bool

Apakah menampilkan fasilitas yang telah dihapus atau tidak.

ListPhraseSetsResponse

Pesan respons untuk metode ListPhraseSets.

Kolom
phrase_sets[]

PhraseSet

Daftar PhraseSets yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak akan ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

ListRecognizersRequest

Pesan permintaan untuk metode ListRecognizers.

Kolom
parent

string

Wajib. Project dan lokasi Pengenal yang akan dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah maksimum Pengenal yang akan ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 Pengenal akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100.

page_token

string

Token halaman, diterima dari panggilan ListRecognizers sebelumnya. Berikan ini untuk mengambil halaman berikutnya.

Saat melakukan penomoran halaman, semua parameter lain yang disediakan ke ListRecognizers harus cocok dengan panggilan yang disediakan token halaman.

show_deleted

bool

Apakah menampilkan fasilitas yang telah dihapus atau tidak.

ListRecognizersResponse

Pesan respons untuk metode ListRecognizers.

Kolom
recognizers[]

Recognizer

Daftar Pengenal yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak akan ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

LocationsMetadata

Metadata utama untuk Locations API untuk STT V2. Saat ini, ini hanyalah metadata tentang lokalitas, model, dan fitur

Kolom
languages

LanguageMetadata

Informasi tentang lokalitas, model, dan fitur yang tersedia yang direpresentasikan dalam struktur hierarki lokalitas -> model -> fitur

access_metadata

AccessMetadata

Informasi tentang metadata akses untuk region dan project yang ditentukan.

ModelFeature

Mewakili fitur tunggal dari model. Jika fiturnya recognizer, release_state fitur akan mewakili release_state model

Kolom
feature

string

Nama fitur (Catatan: fitur dapat berupa recognizer)

release_state

string

Status rilis fitur

ModelFeatures

Mewakili kumpulan fitur yang termasuk dalam model

Kolom
model_feature[]

ModelFeature

Kolom berulang yang berisi semua fitur model

ModelMetadata

Metadata tentang model di region tertentu untuk lokalitas tertentu. Saat ini, ini hanyalah fitur dari model

Kolom
model_features

map<string, ModelFeatures>

Peta nama model -> fitur model tersebut

NativeOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk proto BatchRecognizeResults serial.

OperationMetadata

Mewakili metadata operasi yang berjalan lama.

Kolom
create_time

Timestamp

Waktu operasi dibuat.

update_time

Timestamp

Waktu operasi terakhir diperbarui.

resource

string

Jalur resource untuk target operasi.

method

string

Metode yang memicu operasi.

kms_key_name

string

Nama kunci KMS yang digunakan untuk mengenkripsi konten Operasi. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Nama versi kunci KMS yang berisi konten Operasi yang dienkripsi. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

progress_percent

int32

Persentase progres Operasi. Nilai dapat berkisar dari 0-100. Jika nilainya 100, maka operasi selesai.

Kolom union request. Permintaan yang menghasilkan Operasi. request hanya ada berupa salah satu diantara berikut:
batch_recognize_request

BatchRecognizeRequest

BatchRecognizeRequest yang menghasilkan Operasi.

create_recognizer_request

CreateRecognizerRequest

CreateRecognizerRequest yang melahirkan Operasi.

update_recognizer_request

UpdateRecognizerRequest

UpdateRecognizerRequest yang melahirkan Operasi.

delete_recognizer_request

DeleteRecognizerRequest

DeleteRecognizerRequest yang melahirkan Operasi.

undelete_recognizer_request

UndeleteRecognizerRequest

UndeleteRecognizerRequest yang melahirkan Operasi.

create_custom_class_request

CreateCustomClassRequest

CreateCustomClassRequest yang melahirkan Operasi.

update_custom_class_request

UpdateCustomClassRequest

UpdateCustomClassRequest yang menghasilkan Operasi.

delete_custom_class_request

DeleteCustomClassRequest

DeleteCustomClassRequest yang menghasilkan Operasi.

undelete_custom_class_request

UndeleteCustomClassRequest

UndeleteCustomClassRequest yang menghasilkan Operasi.

create_phrase_set_request

CreatePhraseSetRequest

CreatePhraseSetRequest yang melahirkan Operasi.

update_phrase_set_request

UpdatePhraseSetRequest

UpdatePhraseSetRequest yang melahirkan Operasi.

delete_phrase_set_request

DeletePhraseSetRequest

DeletePhraseSetRequest yang melahirkan Operasi.

undelete_phrase_set_request

UndeletePhraseSetRequest

UndeletePhraseSetRequest yang melahirkan Operasi.

update_config_request
(deprecated)

UpdateConfigRequest

UpdateConfigRequest yang melahirkan Operasi.

Kolom union metadata. Metadata tertentu per RPC. metadata hanya ada berupa salah satu diantara berikut:
batch_recognize_metadata

BatchRecognizeMetadata

Metadata khusus untuk metode BatchRecognize.

OutputFormatConfig

Konfigurasi untuk format hasil yang disimpan ke output.

Kolom
native

NativeOutputFileFormatConfig

Konfigurasi untuk format output native. Jika kolom ini disetel, atau jika tidak ada kolom format output lain yang disetel, transkrip akan ditulis ke sink dalam format native.

vtt

VttOutputFileFormatConfig

Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT.

srt

SrtOutputFileFormatConfig

Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT.

PhraseSet

PhraseSet untuk membuat bias dalam pengenalan ucapan. PhraseSet digunakan untuk memberikan "petunjuk" bagi pengenal ucapan guna mendukung kata dan frasa tertentu dalam hasil.

Kolom
name

string

Hanya output. Pengenal. Nama resource PhraseSet. Format projects/{project}/locations/{location}/phraseSets/{phrase_set}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk PhraseSet.

phrases[]

Phrase

Daftar kata dan frasa.

boost

float

Peningkatan Petunjuk. Nilai positif akan meningkatkan kemungkinan bahwa frasa tertentu akan dikenali dari frasa lain yang terdengar serupa. Semakin tinggi peningkatannya, semakin tinggi juga peluang pengenalan positif palsunya. Nilai boost yang valid adalah antara 0 (eksklusif) dan 20. Sebaiknya gunakan pendekatan penelusuran biner untuk menemukan nilai optimal bagi kasus penggunaan Anda serta menambahkan frasa dengan dan tanpa penguatan pada permintaan Anda.

display_name

string

Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk PhraseSet. Harus terdiri dari 63 karakter atau kurang.

state

State

Hanya output. Status siklus proses PhraseSet.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Terakhir kali resource ini diubah.

delete_time

Timestamp

Hanya output. Waktu saat resource ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu saat resource ini akan dihapus permanen.

annotations

map<string, string>

Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari 63 karakter atau kurang. Maksimal 100 anotasi.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah PhraseSet ini sedang dalam proses update atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang akan digunakan untuk mengenkripsi PhraseSet. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang akan digunakan untuk mengenkripsi PhraseSet. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

Frasa

Frasa berisi kata dan frasa "petunjuk" sehingga pengenalan ucapan lebih cenderung dapat mengenalinya. Ini dapat digunakan untuk meningkatkan akurasi kata dan frasa tertentu, misalnya, jika perintah tertentu biasanya diucapkan oleh pengguna. Fitur ini juga dapat digunakan untuk menambahkan kata lain ke kosakata pengenal.

Item daftar juga dapat menyertakan referensi CustomClass yang berisi grup kata yang mewakili konsep umum yang terjadi dalam bahasa alami.

Kolom
value

string

Frasa itu sendiri.

boost

float

Peningkatan Petunjuk. Mengganti peningkatan yang ditetapkan di tingkat kumpulan frasa. Nilai positif akan meningkatkan kemungkinan bahwa frasa tertentu akan dikenali dari frasa lain yang terdengar serupa. Semakin tinggi peningkatannya, semakin tinggi juga peluang pengenalan positif palsunya. Nilai peningkatan negatif berkaitan dengan anti-bias. Anti-bias tidak diaktifkan, sehingga nilai boost negatif akan menampilkan error. Nilai peningkatan harus antara 0 dan 20. Nilai di luar rentang tersebut akan mengembalikan kesalahan. Sebaiknya gunakan pendekatan penelusuran biner untuk menemukan nilai optimal bagi kasus penggunaan Anda serta menambahkan frasa dengan dan tanpa penguatan pada permintaan Anda.

Negara bagian/Provinsi

Kumpulan status yang menentukan siklus proses PhraseSet.

Enum
STATE_UNSPECIFIED Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan.
ACTIVE Status normal dan aktif.
DELETED Set Frasa ini telah dihapus.

RecognitionConfig

Memberikan informasi kepada Pengenal yang menentukan cara memproses permintaan pengenalan.

Kolom
model

string

Opsional. Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik.

Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi. Model yang didukung di setiap wilayah dapat ditemukan di Tabel Model yang Didukung.

language_codes[]

string

Opsional. Bahasa audio yang disediakan sebagai tag bahasa BCP-47. Tag bahasa dinormalkan menjadi BCP-47 sebelum digunakan, misalnya "en-us" menjadi "en-US".

Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung.

Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi pada audio.

features

RecognitionFeatures

Fitur pengenalan ucapan untuk mengaktifkan.

adaptation

SpeechAdaptation

Konteks adaptasi ucapan yang memberikan bobot prediksi pengenal untuk kata dan frasa tertentu.

transcript_normalization

TranscriptNormalization

Opsional. Gunakan normalisasi transkripsi untuk mengganti bagian transkrip secara otomatis dengan frasa pilihan Anda. Untuk StreamingRecognize, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir.

Kolom union decoding_config. Parameter dekode untuk audio yang dikirim untuk pengenalan. decoding_config hanya ada berupa salah satu diantara berikut:
auto_decoding_config

AutoDetectDecodingConfig

Mendeteksi parameter decoding secara otomatis. Lebih disarankan untuk format yang didukung.

explicit_decoding_config

ExplicitDecodingConfig

Parameter decoding yang ditentukan secara eksplisit. Wajib jika menggunakan audio PCM tanpa header (linear16, mulaw, alaw).

RecognitionFeatures

Fitur pengenalan yang tersedia.

Kolom
profanity_filter

bool

Jika disetel ke true, server akan mencoba memfilter kata-kata tidak sopan, mengganti semua kecuali karakter awal di setiap kata yang difilter dengan tanda bintang, misalnya, "f***". Jika ditetapkan ke false atau dihapus, kata-kata tidak sopan tidak akan difilter.

enable_word_time_offsets

bool

Jika true, hasil teratas akan menyertakan daftar kata serta offset waktu mulai dan berakhir (stempel waktu) untuk kata tersebut. Jika false, tidak ada informasi offset waktu tingkat kata yang ditampilkan. Defaultnya adalah false.

enable_word_confidence

bool

Jika true, hasil teratas akan menyertakan daftar kata dan keyakinan untuk kata tersebut. Jika false, tidak ada informasi keyakinan tingkat kata yang ditampilkan. Defaultnya adalah false.

enable_automatic_punctuation

bool

Jika true, menambahkan tanda baca ke hipotesis hasil pengenalan. Fitur ini hanya tersedia dalam bahasa tertentu. Nilai false default tidak menambahkan tanda baca untuk menghasilkan hipotesis.

enable_spoken_punctuation

bool

Perilaku tanda baca lisan untuk panggilan. Jika true, mengganti tanda baca lisan dengan simbol yang sesuai dalam permintaan. Misalnya, "bagaimana kamu tanya" menjadi "apa kabar?". Lihat https://cloud.google.com/speech-to-text/docs/spoken-punctuation untuk mendapatkan dukungan. Jika false, tanda baca lisan tidak diganti.

enable_spoken_emojis

bool

Perilaku emoji lisan untuk panggilan. Jika true, menambahkan format emoji lisan untuk permintaan. Fitur ini akan menggantikan emoji lisan dengan simbol Unicode yang sesuai dalam transkrip akhir. Jika false, emoji lisan tidak akan diganti.

multi_channel_mode

MultiChannelMode

Mode untuk mengenali audio multi-saluran.

diarization_config

SpeakerDiarizationConfig

Konfigurasi untuk mengaktifkan pemisahan pembicara dan menetapkan parameter tambahan agar diarisasi lebih sesuai untuk aplikasi Anda. Jika fitur ini diaktifkan, kami akan mengirimkan semua kata dari awal audio sebagai alternatif teratas dalam setiap respons STREAMING berturut-turut. Hal ini dilakukan untuk meningkatkan kualitas tag pembicara karena model kami belajar mengidentifikasi pembicara dalam percakapan dari waktu ke waktu. Untuk permintaan non-streaming, hasil diarisasi hanya akan diberikan di alternatif teratas FINAL SpeechRecognitionResult.

max_alternatives

int32

Jumlah maksimum hipotesis pengenalan yang akan ditampilkan. Server mungkin menampilkan kurang dari max_alternatives. Nilai yang valid adalah 0-30. Nilai 0 atau 1 akan menampilkan maksimal satu. Jika dihilangkan, akan menampilkan maksimum satu.

MultiChannelMode

Opsi cara mengenali audio multi-saluran.

Enum
MULTI_CHANNEL_MODE_UNSPECIFIED Nilai default untuk mode multi-saluran. Jika audio berisi beberapa channel, hanya channel pertama yang akan ditranskripsikan; channel lain akan diabaikan.
SEPARATE_RECOGNITION_PER_CHANNEL Jika dipilih, setiap saluran dalam audio yang disediakan akan ditranskripsikan secara terpisah. Opsi ini tidak dapat dipilih jika model yang dipilih adalah latest_short.

RecognitionOutputConfig

Opsi konfigurasi untuk output pengenalan.

Kolom
output_format_config

OutputFormatConfig

Opsional. Konfigurasi untuk format hasil yang disimpan ke output. Jika transkrip yang tidak ditentukan hanya akan ditulis dalam format NATIVE.

Kolom union output.

output hanya dapat berupa salah satu dari yang berikut:

gcs_output_config

GcsOutputConfig

Jika pesan ini diisi, hasil pengenalan akan ditulis ke URI Google Cloud Storage yang disediakan.

inline_response_config

InlineOutputConfig

Jika pesan ini terisi, hasil pengenalan akan diberikan dalam pesan Operasi BatchRecognizeResponse saat selesai. Hal ini hanya didukung saat memanggil BatchRecognize dengan satu file audio saja.

RecognitionResponseMetadata

Metadata tentang respons dan permintaan pengenalan.

Kolom
total_billed_duration

Duration

Jika tersedia, detik audio yang ditagih untuk permintaan terkait.

RecognizeRequest

Pesan permintaan untuk metode Recognize. content atau uri harus diberikan. Menyediakan keduanya atau tidak sama sekali akan menampilkan INVALID_ARGUMENT. Lihat batas konten.

Kolom
recognizer

string

Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit kosong.

config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config resource Pengenal.

config_mask

FieldMask

Daftar kolom di config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

Kolom union audio_source. Sumber audio, yang berupa konten inline atau URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut:
content

bytes

Byte data audio yang dienkode seperti yang ditentukan dalam RecognitionConfig. Seperti semua kolom byte, buffer proto menggunakan representasi biner murni, sedangkan representasi JSON menggunakan base64.

uri

string

URI yang mengarah ke file yang berisi byte data audio seperti yang ditentukan dalam RecognitionConfig. File tidak boleh dikompresi (misalnya, gzip). Saat ini, hanya URI Google Cloud Storage yang didukung, yang harus ditentukan dalam format berikut: gs://bucket_name/object_name (format URI lainnya menampilkan INVALID_ARGUMENT). Untuk informasi selengkapnya, lihat URI Permintaan.

RecognizeResponse

Pesan respons untuk metode Recognize.

Kolom
results[]

SpeechRecognitionResult

Daftar hasil transkripsi berurutan yang sesuai dengan bagian audio yang berurutan.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

Pengenal

Pesan Pengenal. Menyimpan konfigurasi dan metadata pengenalan.

Kolom
name

string

Hanya output. Pengenal. Nama resource Pengenal. Format projects/{project}/locations/{location}/recognizers/{recognizer}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk Pengenal.

display_name

string

Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk Pengenal. Harus terdiri dari 63 karakter atau kurang.

model
(deprecated)

string

Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom model dalam pesan RecognitionConfig.

Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik.

Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi. Model yang didukung di setiap wilayah dapat ditemukan di Tabel Model yang Didukung.

language_codes[]
(deprecated)

string

Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom language_codes dalam pesan RecognitionConfig.

Bahasa audio yang disediakan sebagai tag bahasa BCP-47.

Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung.

Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi pada audio. Saat Anda membuat atau memperbarui Pengenal, nilai ini akan disimpan dalam bentuk BCP-47 yang dinormalkan. Misalnya, "en-us" disimpan sebagai "en-US".

default_recognition_config

RecognitionConfig

Konfigurasi default yang akan digunakan untuk permintaan dengan Pengenal ini. Ini dapat ditimpa oleh konfigurasi inline di kolom RecognizeRequest.config.

annotations

map<string, string>

Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari 63 karakter atau kurang. Maksimal 100 anotasi.

state

State

Hanya output. Status siklus proses Pengenal.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Terakhir kali Pengenal ini diubah.

delete_time

Timestamp

Hanya output. Waktu saat Pengenal ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu Pengenal ini akan dihapus permanen.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah Pengenal ini sedang dalam proses diperbarui atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

Negara bagian/Provinsi

Kumpulan status yang menentukan siklus proses Pengenal.

Enum
STATE_UNSPECIFIED Nilai default. Nilai ini digunakan jika status dihilangkan.
ACTIVE Pengenal aktif dan siap digunakan.
DELETED Pengenal ini telah dihapus.

SpeakerDiarizationConfig

Konfigurasi untuk mengaktifkan pemisahan pembicara.

Kolom
min_speaker_count

int32

Wajib. Jumlah minimum pembicara dalam percakapan. Rentang ini memberi Anda lebih banyak fleksibilitas dengan memungkinkan sistem menentukan jumlah speaker yang tepat secara otomatis.

Untuk memperbaiki jumlah speaker yang terdeteksi dalam audio, setel min_speaker_count = max_speaker_count.

max_speaker_count

int32

Wajib. Jumlah maksimum pembicara dalam percakapan. Nilai yang valid adalah: 1-6. Harus >= min_speaker_count. Rentang ini memberi Anda lebih banyak fleksibilitas dengan memungkinkan sistem menentukan jumlah speaker yang tepat secara otomatis.

SpeechAdaptation

Menyediakan "petunjuk" ke pengenal ucapan untuk mendukung kata dan frasa tertentu dalam hasil. PhraseSets dapat ditentukan sebagai resource inline, atau referensi ke resource PhraseSet yang ada.

Kolom
phrase_sets[]

AdaptationPhraseSet

Daftar PhraseSet inline atau referensi.

custom_classes[]

CustomClass

Daftar CustomClass inline. Resource CustomClass yang ada dapat direferensikan langsung di PhraseSet.

AdaptationPhraseSet

PhraseSet pembiasan, yang dapat berupa string yang merujuk nama resource PhraseSets yang ada, atau definisi inline PhraseSet.

Kolom

Kolom union value.

value hanya dapat berupa salah satu dari yang berikut:

phrase_set

string

Nama resource PhraseSet yang ada. Pengguna harus memiliki akses baca ke resource dan resource tidak boleh dihapus.

inline_phrase_set

PhraseSet

PhraseSet yang ditentukan inline.

SpeechRecognitionAlternative

Hipotesis alternatif (alias daftar n-terbaik).

Kolom
transcript

string

Teks transkrip yang mewakili kata-kata yang diucapkan pengguna.

confidence

float

Estimasi keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali tersebut benar. Kolom ini hanya disetel untuk alternatif teratas hasil non-streaming atau, dari hasil streaming dengan is_final disetel ke true. Kolom ini tidak dijamin akurat dan pengguna tidak boleh mengandalkannya agar selalu diberikan. Nilai default 0,0 adalah nilai sentinel yang menunjukkan confidence tidak ditetapkan.

words[]

WordInfo

Daftar informasi khusus kata untuk setiap kata yang dikenali. Jika SpeakerDiarizationConfig disetel, Anda akan melihat semua kata dari awal audio.

SpeechRecognitionResult

Hasil pengenalan ucapan yang sesuai dengan sebagian audio.

Kolom
alternatives[]

SpeechRecognitionAlternative

Dapat berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) yang paling mungkin, sesuai peringkat oleh pengenal.

channel_tag

int32

Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk audio_channel_count = N, nilai outputnya dapat berkisar dari 1 hingga N.

result_end_offset

Duration

Offset waktu dari akhir hasil ini relatif terhadap awal audio.

language_code

string

Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan yang paling besar untuk diucapkan dalam audio.

SrtOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

File subtitel berformat SubRip Text konfigurasi output.

StreamingRecognitionConfig

Menyediakan informasi konfigurasi untuk permintaan StreamingRecognize.

Kolom
config

RecognitionConfig

Wajib. Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config resource Pengenal.

config_mask

FieldMask

Daftar kolom di config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan mengganti nilai di Pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi di Pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

streaming_features

StreamingRecognitionFeatures

Fitur pengenalan ucapan untuk memungkinkan permintaan pengenalan audio streaming tertentu.

StreamingRecognitionFeatures

Fitur pengenalan yang tersedia khusus untuk permintaan pengenalan streaming.

Kolom
enable_voice_activity_events

bool

Jika true, respons dengan peristiwa ucapan aktivitas suara akan ditampilkan saat terdeteksi.

interim_results

bool

Apakah akan melakukan streaming hasil sementara ke klien atau tidak. Jika disetel ke benar (true), hasil sementara akan di-streaming ke klien. Jika tidak, hanya respons akhir yang akan di-streaming kembali.

voice_activity_timeout

VoiceActivityTimeout

Jika disetel, server akan menutup streaming secara otomatis setelah durasi yang ditentukan berlalu setelah peristiwa ucapan VOICE_ACTIVITY terakhir terkirim. Kolom voice_activity_events juga harus ditetapkan ke true.

VoiceActivityTimeout

Peristiwa dengan waktu tunggu yang dapat disetel untuk aktivitas suara.

Kolom
speech_start_timeout

Duration

Durasi untuk waktu tunggu streaming habis jika tidak ada ucapan yang dimulai. Jika hal ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini pada awal streaming, server akan menutup streaming.

speech_end_timeout

Duration

Durasi untuk waktu tunggu streaming habis setelah ucapan berakhir. Jika setelan ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini setelah ucapan terdeteksi, server akan menutup streaming.

StreamingRecognitionResult

Hasil pengenalan ucapan streaming yang sesuai dengan sebagian audio yang sedang diproses.

Kolom
alternatives[]

SpeechRecognitionAlternative

Dapat berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) yang paling mungkin, sesuai peringkat oleh pengenal.

is_final

bool

Jika false, StreamingRecognitionResult ini mewakili hasil sementara yang dapat berubah. Jika true, ini adalah saat terakhir layanan ucapan akan menampilkan StreamingRecognitionResult khusus ini, pengenal tidak akan menampilkan hipotesis lebih lanjut untuk bagian transkrip ini dan audio yang sesuai.

stability

float

Estimasi kemungkinan bahwa pengenal tidak akan mengubah tebakannya tentang hasil sementara ini. Rentang nilai dari 0.0 (benar-benar tidak stabil) hingga 1.0 (benar-benar stabil). Kolom ini hanya disediakan untuk hasil sementara (is_final=false). Nilai default 0,0 adalah nilai sentinel yang menunjukkan stability tidak ditetapkan.

result_end_offset

Duration

Offset waktu dari akhir hasil ini relatif terhadap awal audio.

channel_tag

int32

Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk audio_channel_count = N, nilai outputnya dapat berkisar dari 1 hingga N.

language_code

string

Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan yang paling besar untuk diucapkan dalam audio.

StreamingRecognizeRequest

Pesan permintaan untuk metode StreamingRecognize. Beberapa pesan StreamingRecognizeRequest dikirim dalam satu panggilan.

Jika Recognizer yang dirujuk oleh recognizer berisi konfigurasi permintaan yang ditentukan sepenuhnya, aliran data hanya dapat berisi pesan dengan audio yang ditetapkan saja.

Jika tidak, pesan pertama harus berisi pesan recognizer dan streaming_config yang bersama-sama sepenuhnya menentukan konfigurasi permintaan dan tidak boleh berisi audio. Hanya audio yang boleh ditetapkan untuk semua pesan berikutnya.

Kolom
recognizer

string

Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit kosong.

Kolom union streaming_request.

streaming_request hanya dapat berupa salah satu dari yang berikut:

streaming_config

StreamingRecognitionConfig

StreamingRecognitionConfig yang akan digunakan dalam upaya pengenalan ini. Jika diberikan, kode ini akan mengganti RecognitionConfig default yang disimpan di Pengenal.

audio

bytes

Byte audio inline yang akan dikenali. Ukuran maksimum kolom ini adalah 15 KB per permintaan.

StreamingRecognizeResponse

StreamingRecognizeResponse adalah satu-satunya pesan yang ditampilkan ke klien oleh StreamingRecognize. Rangkaian nol atau beberapa pesan StreamingRecognizeResponse akan di-streaming kembali ke klien. Jika tidak ada audio yang dapat dikenali, tidak ada pesan yang di-streaming kembali ke klien.

Berikut beberapa contoh StreamingRecognizeResponse yang mungkin ditampilkan saat memproses audio:

  1. results { alternatives { transcript: "tube" } stability: 0.01 }

  2. results { alternatives { transcript: "to be a" } stability: 0.01 }

  3. results { alternatives { transcript: "to be" } stability: 0.9 } results { alternatives { transcript: " or not to be" } stability: 0.01 }

  4. results { alternatives { transcript: "to be or not to be" confidence: 0.92 } alternatives { transcript: "to bee or not to bee" } is_final: true }

  5. results { alternatives { transcript: " that's" } stability: 0.01 }

  6. results { alternatives { transcript: " that is" } stability: 0.9 } results { alternatives { transcript: " the question" } stability: 0.01 }

  7. results { alternatives { transcript: " that is the question" confidence: 0.98 } alternatives { transcript: " that was the question" } is_final: true }

Catatan:

  • Hanya dua dari respons #4 dan #7 di atas yang berisi hasil akhir; yang ditunjukkan oleh is_final: true. Menggabungkan ini bersama-sama menghasilkan transkrip lengkap: "to be or not to be that is the question".

  • Lainnya berisi results sementara. #3 dan #6 berisi dua results sementara: bagian pertama memiliki stabilitas tinggi dan cenderung tidak berubah; bagian kedua memiliki stabilitas rendah dan sangat mungkin berubah. Desainer UI mungkin memilih untuk hanya menampilkan results dengan stabilitas tinggi.

  • Nilai stability dan confidence spesifik yang ditampilkan di atas hanya untuk tujuan ilustrasi. Nilai sebenarnya dapat berbeda.

  • Dalam setiap respons, hanya salah satu dari kolom berikut yang akan disetel: error, speech_event_type, atau satu atau beberapa (berulang) results.

Kolom
results[]

StreamingRecognitionResult

Daftar berulang ini berisi nol hasil atau lebih yang berkaitan dengan bagian berturut-turut dari audio yang sedang diproses. Kolom ini berisi nol atau satu hasil is_final=true (bagian yang baru diselesaikan), diikuti dengan nol hasil is_final=false atau lebih (hasil sementara).

speech_event_type

SpeechEventType

Menunjukkan jenis peristiwa ucapan.

speech_event_offset

Duration

Offset waktu antara awal audio dan emisi peristiwa.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

SpeechEventType

Menunjukkan jenis peristiwa ucapan.

Enum
SPEECH_EVENT_TYPE_UNSPECIFIED Tidak ada peristiwa ucapan yang ditentukan.
END_OF_SINGLE_UTTERANCE Peristiwa ini menunjukkan bahwa server telah mendeteksi akhir ucapan ucapan pengguna dan tidak mengharapkan ucapan tambahan. Oleh karena itu, server tidak akan memproses audio tambahan dan akan menutup streaming dua arah gRPC. Peristiwa ini hanya dikirim jika ada penghentian paksa karena keheningan terdeteksi lebih awal. Acara ini hanya tersedia melalui latest_short model.
SPEECH_ACTIVITY_BEGIN Peristiwa ini menunjukkan bahwa server telah mendeteksi awal aktivitas suara manusia di streaming. Peristiwa ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali selama streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true.
SPEECH_ACTIVITY_END Peristiwa ini menunjukkan bahwa server telah mendeteksi akhir aktivitas suara manusia di streaming. Peristiwa ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali selama streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true.

TranscriptNormalization

Konfigurasi normalisasi transkripsi. Gunakan normalisasi transkripsi untuk mengganti bagian transkrip secara otomatis dengan frasa pilihan Anda. Untuk StreamingRecognize, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir.

Kolom
entries[]

Entry

Daftar entri pengganti. Kami akan melakukan penggantian dengan satu entri pada satu waktu. Misalnya, entri kedua dalam ["cat" => "dog", "mountain cat" => "mountain dog"] tidak akan pernah diterapkan karena kita akan selalu memproses entri pertama sebelumnya. Maksimal 100 entri.

Entri

Konfigurasi penggantian tunggal.

Kolom
search

string

Apa yang harus diganti. Panjang maksimal adalah 100 karakter.

replace

string

Apa yang harus diganti. Panjang maksimal adalah 100 karakter.

case_sensitive

bool

Apakah penelusuran peka huruf besar/kecil.

UndeleteCustomClassRequest

Pesan permintaan untuk metode UndeleteCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/customClasses/{custom_class}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang tidak dihapus, tetapi jangan benar-benar membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UndeletePhraseSetRequest

Pesan permintaan untuk metode UndeletePhraseSet.

Kolom
name

string

Wajib. Nama PhraseSet yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau PhraseSet yang dibatalkan penghapusannya, tetapi jangan membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UndeleteRecognizerRequest

Pesan permintaan untuk metode UndeleteRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/recognizers/{recognizer}

validate_only

bool

Jika disetel, validasi permintaan dan pratinjau Pengenal yang batal dihapus, tetapi jangan benar-benar membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lain. Ini dapat dikirim pada saat permintaan pembaruan, pembatalan penghapusan, dan penghapusan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UpdateConfigRequest

Pesan permintaan untuk metode UpdateConfig.

Kolom
config

Config

Wajib. Konfigurasi yang akan diperbarui.

Kolom name konfigurasi digunakan untuk mengidentifikasi konfigurasi yang akan diperbarui. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

update_mask

FieldMask

Daftar kolom yang akan diperbarui.

UpdateCustomClassRequest

Pesan permintaan untuk metode UpdateCustomClass.

Kolom
custom_class

CustomClass

Wajib. CustomClass yang akan diperbarui.

Kolom name CustomClass digunakan untuk mengidentifikasi CustomClass yang akan diperbarui. Format: projects/{project}/locations/{location}/customClasses/{custom_class}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom akan dipertimbangkan untuk update.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang diupdate, tetapi jangan benar-benar memperbaruinya.

UpdatePhraseSetRequest

Pesan permintaan untuk metode UpdatePhraseSet.

Kolom
phrase_set

PhraseSet

Wajib. PhraseSet untuk diupdate.

Kolom name PhraseSet digunakan untuk mengidentifikasi PhraseSet yang akan diupdate. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk diperbarui. Gunakan * untuk mengupdate seluruh resource PhraseSet.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau PhraseSet yang diperbarui, tetapi jangan perbarui.

UpdateRecognizerRequest

Pesan permintaan untuk metode UpdateRecognizer.

Kolom
recognizer

Recognizer

Wajib. Pengenal yang akan diperbarui.

Kolom name Pengenal digunakan untuk mengidentifikasi Pengenal yang akan diperbarui. Format: projects/{project}/locations/{location}/recognizers/{recognizer}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk diperbarui. Gunakan * untuk memperbarui seluruh resource Pengenal.

validate_only

bool

Jika disetel, validasi permintaan dan pratinjau Pengenal yang diperbarui, tetapi jangan benar-benar memperbaruinya.

VttOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk file subtitel berformat WebVTT.

WordInfo

Informasi khusus kata untuk kata yang dikenali.

Kolom
start_offset

Duration

Offset waktu relatif terhadap awal audio, dan sesuai dengan awal kata yang diucapkan. Kolom ini hanya ditetapkan jika enable_word_time_offsets adalah true dan hanya dalam hipotesis teratas. Ini adalah fitur eksperimental dan keakuratan selisih waktu dapat bervariasi.

end_offset

Duration

Offset waktu relatif terhadap awal audio, dan sesuai dengan akhir kata yang diucapkan. Kolom ini hanya ditetapkan jika enable_word_time_offsets adalah true dan hanya dalam hipotesis teratas. Ini adalah fitur eksperimental dan keakuratan selisih waktu dapat bervariasi.

word

string

Kata yang sesuai dengan kumpulan informasi ini.

confidence

float

Estimasi keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali tersebut benar. Kolom ini hanya disetel untuk alternatif teratas hasil non-streaming atau, dari hasil streaming dengan is_final disetel ke true. Kolom ini tidak dijamin akurat dan pengguna tidak boleh mengandalkannya agar selalu diberikan. Nilai default 0,0 adalah nilai sentinel yang menunjukkan confidence tidak ditetapkan.

speaker_label

string

Label yang berbeda ditetapkan untuk setiap speaker dalam audio. Bidang ini menentukan siapa dari pembicara tersebut yang terdeteksi telah mengucapkan kata ini. speaker_label ditetapkan jika SpeakerDiarizationConfig diberikan dan hanya di alternatif teratas.