Package google.cloud.speech.v2

Indeks

Speech

Mengaktifkan transkripsi ucapan dan pengelolaan materi.

BatchRecognize

rpc BatchRecognize(BatchRecognizeRequest) returns (Operation)

Melakukan pengenalan ucapan asinkron batch: mengirim permintaan dengan file audio N dan menerima operasi yang berjalan lama yang dapat dilakukan polling untuk melihat saat transkripsi selesai.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi selengkapnya, lihat dokumentasi IAM.

CreateCustomClass

rpc CreateCustomClass(CreateCustomClassRequest) returns (Operation)

Membuat CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.customClasses.create

Untuk informasi selengkapnya, lihat dokumentasi IAM.

CreatePhraseSet

rpc CreatePhraseSet(CreatePhraseSetRequest) returns (Operation)

Membuat PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.phraseSets.create

Untuk informasi selengkapnya, lihat dokumentasi IAM.

CreateRecognizer

rpc CreateRecognizer(CreateRecognizerRequest) returns (Operation)

Membuat Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.recognizers.create

Untuk informasi selengkapnya, lihat dokumentasi IAM.

DeleteCustomClass

rpc DeleteCustomClass(DeleteCustomClassRequest) returns (Operation)

Menghapus CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.delete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

DeletePhraseSet

rpc DeletePhraseSet(DeletePhraseSetRequest) returns (Operation)

Menghapus PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.delete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

DeleteRecognizer

rpc DeleteRecognizer(DeleteRecognizerRequest) returns (Operation)

Menghapus Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.delete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

GetConfig

rpc GetConfig(GetConfigRequest) returns (Config)

Menampilkan Config yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.config.get

Untuk informasi selengkapnya, lihat dokumentasi IAM.

GetCustomClass

rpc GetCustomClass(GetCustomClassRequest) returns (CustomClass)

Menampilkan CustomClass yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.get

Untuk informasi selengkapnya, lihat dokumentasi IAM.

GetPhraseSet

rpc GetPhraseSet(GetPhraseSetRequest) returns (PhraseSet)

Menampilkan PhraseSet yang diminta.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.get

Untuk informasi selengkapnya, lihat dokumentasi IAM.

GetRecognizer

rpc GetRecognizer(GetRecognizerRequest) returns (Recognizer)

Menampilkan Recognizer yang diminta. Gagal dengan NOT_FOUND jika Pengenal yang diminta tidak ada.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.get

Untuk informasi selengkapnya, lihat dokumentasi IAM.

ListCustomClasses

rpc ListCustomClasses(ListCustomClassesRequest) returns (ListCustomClassesResponse)

Mencantumkan CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.customClasses.list

Untuk informasi selengkapnya, lihat dokumentasi IAM.

ListPhraseSets

rpc ListPhraseSets(ListPhraseSetsRequest) returns (ListPhraseSetsResponse)

Mencantumkan Kumpulan Frasa.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.phraseSets.list

Untuk informasi selengkapnya, lihat dokumentasi IAM.

ListRecognizers

rpc ListRecognizers(ListRecognizersRequest) returns (ListRecognizersResponse)

Mencantumkan Pengenal.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource parent:

  • speech.recognizers.list

Untuk informasi selengkapnya, lihat dokumentasi IAM.

Kenali

rpc Recognize(RecognizeRequest) returns (RecognizeResponse)

Melakukan pengenalan ucapan sinkron: menerima hasil setelah semua audio dikirim dan diproses.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi selengkapnya, lihat dokumentasi IAM.

StreamingRecognize

rpc StreamingRecognize(StreamingRecognizeRequest) returns (StreamingRecognizeResponse)

Melakukan streaming pengenalan ucapan dua arah: menerima hasil saat mengirim audio. Metode ini hanya tersedia melalui gRPC API (bukan REST).

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UndeleteCustomClass

rpc UndeleteCustomClass(UndeleteCustomClassRequest) returns (Operation)

Membatalkan penghapusan CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.undelete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UndeletePhraseSet

rpc UndeletePhraseSet(UndeletePhraseSetRequest) returns (Operation)

Membatalkan penghapusan PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.undelete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UndeleteRecognizer

rpc UndeleteRecognizer(UndeleteRecognizerRequest) returns (Operation)

Membatalkan penghapusan Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.undelete

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UpdateConfig

rpc UpdateConfig(UpdateConfigRequest) returns (Config)

Mengupdate Config.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.config.update

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UpdateCustomClass

rpc UpdateCustomClass(UpdateCustomClassRequest) returns (Operation)

Mengupdate CustomClass.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.customClasses.update

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UpdatePhraseSet

rpc UpdatePhraseSet(UpdatePhraseSetRequest) returns (Operation)

Mengupdate PhraseSet.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.phraseSets.update

Untuk informasi selengkapnya, lihat dokumentasi IAM.

UpdateRecognizer

rpc UpdateRecognizer(UpdateRecognizerRequest) returns (Operation)

Mengupdate Recognizer.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource name:

  • speech.recognizers.update

Untuk informasi selengkapnya, lihat dokumentasi IAM.

AccessMetadata

Metadata akses untuk region tertentu. Ini dapat diterapkan jika kebijakan organisasi untuk project tertentu tidak mengizinkan region tertentu.

Kolom
constraint_type

ConstraintType

Menjelaskan berbagai jenis batasan yang diterapkan.

ConstraintType

Menjelaskan berbagai jenis batasan yang dapat diterapkan pada suatu wilayah.

Enum
CONSTRAINT_TYPE_UNSPECIFIED Batasan yang tidak ditentukan diterapkan.
RESOURCE_LOCATIONS_ORG_POLICY_CREATE_CONSTRAINT Kebijakan organisasi proyek tidak mengizinkan region yang ditentukan.

AutoDetectDecodingConfig

Jenis ini tidak memiliki kolom.

Parameter dekode terdeteksi secara otomatis. Didukung untuk encoding berikut:

  • WAV_LINEAR16: Sampel PCM little-endian 16-bit yang ditandatangani dalam container WAV.

  • WAV_MULAW: Sampel mulaw bersama 8 bit dalam container WAV.

  • WAV_ALAW: Sampel alaw yang disertakan 8 bit dalam container WAV.

  • RFC4867_5_AMR: Frame AMR dengan header rfc4867.5.

  • RFC4867_5_AMRWB: Frame AMR-WB dengan header rfc4867.5.

  • FLAC: Frame FLAC dalam format penampung "FLAC native".

  • MP3: Frame audio MPEG dengan metadata ID3 opsional (diabaikan).

  • OGG_OPUS: Frame audio Opus dalam penampung Ogg.

  • WEBM_OPUS: Frame audio Opus dalam penampung WebM.

  • MP4_AAC: Frame audio AAC dalam container MP4.

  • M4A_AAC: Frame audio AAC dalam penampung M4A.

  • MOV_AAC: Frame audio AAC dalam penampung MOV.

BatchRecognizeFileMetadata

Metadata tentang satu file dalam batch untuk BatchKenali.

Kolom
config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config dari resource Pengenal serta config di tingkat permintaan.

config_mask

FieldMask

Daftar kolom dalam config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan menggantikan nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan mengganti konfigurasi di pengenal untuk permintaan pengenalan ini.

Kolom union audio_source. Sumber audio, yang merupakan URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut:
uri

string

URI Cloud Storage untuk file audio.

BatchRecognizeFileResult

Hasil akhir untuk satu file.

Kolom
error

Status

Error jika ditemukan.

metadata

RecognitionResponseMetadata

uri
(deprecated)

string

Tidak digunakan lagi. Sebagai gantinya, gunakan cloud_storage_result.native_format_uri.

transcript
(deprecated)

BatchRecognizeResults

Tidak digunakan lagi. Sebagai gantinya, gunakan inline_result.transcript.

Kolom union result.

result hanya dapat berupa salah satu dari yang berikut:

cloud_storage_result

CloudStorageResult

Hasil pengenalan yang ditulis ke Cloud Storage. Kolom ini hanya diisi jika GcsOutputConfig ditetapkan di [RecognitionOutputConfig][google.cloud.speech.v2.RecognitionOutputConfig.

inline_result

InlineResult

Hasil pengenalan. Kolom ini hanya diisi jika InlineOutputConfig ditetapkan di [RecognitionOutputConfig][google.cloud.speech.v2.RecognitionOutputConfig.

BatchRecognizeMetadata

Metadata operasi untuk BatchRecognize.

Kolom
transcription_metadata

map<string, BatchRecognizeTranscriptionMetadata>

Petakan dari nama file yang diberikan ke metadata transkripsi untuk file tersebut.

BatchRecognizeRequest

Pesan permintaan untuk metode BatchRecognize.

Kolom
recognizer

string

Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit yang kosong.

config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config dari resource Pengenal.

config_mask

FieldMask

Daftar kolom dalam config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom yang ditentukan di config akan menggantikan nilai di pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan mengganti konfigurasi di pengenal untuk permintaan pengenalan ini.

files[]

BatchRecognizeFileMetadata

File audio dengan metadata file untuk ASR. Jumlah file maksimum yang diizinkan untuk ditentukan adalah 5.

recognition_output_config

RecognitionOutputConfig

Opsi konfigurasi untuk tempat menampilkan transkrip setiap file.

processing_strategy

ProcessingStrategy

Strategi pemrosesan yang akan digunakan untuk permintaan ini.

ProcessingStrategy

Kemungkinan strategi pemrosesan untuk permintaan batch.

Enum
PROCESSING_STRATEGY_UNSPECIFIED Nilai default untuk strategi pemrosesan. Permintaan akan diproses segera setelah diterima.
DYNAMIC_BATCHING Jika dipilih, permintaan akan diproses selama periode penggunaan yang lebih rendah untuk diskon harga. Permintaan akan dipenuhi dalam waktu 24 jam.

BatchRecognizeResponse

Pesan respons untuk BatchRecognize yang dikemas ke dalam Operation yang berjalan lama.

Kolom
results

map<string, BatchRecognizeFileResult>

Petakan dari nama file ke hasil akhir file tersebut.

total_billed_duration

Duration

Jika tersedia, detik audio yang ditagih untuk permintaan yang sesuai.

BatchRecognizeResults

Jenis output untuk Cloud Storage transkrip Batchcat. Meskipun proto ini tidak ditampilkan dalam API ini di mana pun, transkrip Cloud Storage akan diserialisasi proto ini dan harus diuraikan sebagaimana mestinya.

Kolom
results[]

SpeechRecognitionResult

Daftar berurutan hasil transkripsi yang sesuai dengan bagian audio secara berurutan.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

BatchRecognizeTranscriptionMetadata

Metadata tentang transkripsi untuk satu file (misalnya, persentase progres).

Kolom
progress_percent

int32

Jumlah file yang telah ditranskripsikan sejauh ini.

error

Status

Error jika ditemukan.

uri

string

URI Cloud Storage yang akan menjadi tempat penulisan hasil pengenalan.

CloudStorageResult

Hasil akhir ditulis ke Cloud Storage.

Kolom
uri

string

URI Cloud Storage tempat hasil pengenalan ditulis.

vtt_format_uri

string

URI Cloud Storage yang hasil pengenalannya ditulis sebagai teks berformat VTT. Kolom ini hanya diisi saat output VTT diminta.

srt_format_uri

string

URI Cloud Storage yang hasil pengenalannya ditulis sebagai teks berformat SRT. Kolom ini hanya diisi saat output SRT diminta.

Konfigurasi

Pesan yang mewakili konfigurasi untuk Speech-to-Text API. Opsi ini mencakup kunci KMS opsional yang akan digunakan untuk mengenkripsi data yang masuk.

Kolom
name

string

Hanya output. ID. Nama resource konfigurasi. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

kms_key_name

string

Opsional. Nama kunci KMS opsional yang jika ada, akan digunakan untuk mengenkripsi resource Speech-to-Text dalam penyimpanan. Memperbarui kunci ini tidak akan mengenkripsi resource yang ada menggunakan kunci ini; hanya resource baru yang akan dienkripsi menggunakan kunci ini. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

update_time

Timestamp

Hanya output. Waktu terakhir sumber daya ini diubah.

CreateCustomClassRequest

Pesan permintaan untuk metode CreateCustomClass.

Kolom
custom_class

CustomClass

Wajib. CustomClass yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass, tetapi jangan benar-benar membuatnya.

custom_class_id

string

ID yang akan digunakan untuk CustomClass, yang akan menjadi komponen akhir dari nama resource CustomClass.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat CustomClass ini akan dibuat. Format yang diharapkan adalah projects/{project}/locations/{location}.

CreatePhraseSetRequest

Pesan permintaan untuk metode CreatePhraseSet.

Kolom
phrase_set

PhraseSet

Wajib. FrasaSet yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau frasaSet, tetapi jangan benar-benar membuatnya.

phrase_set_id

string

ID yang akan digunakan untuk Set Frasa, yang akan menjadi komponen akhir dari nama resource frasaSet.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat pembuatan Set Frasa ini. Format yang diharapkan adalah projects/{project}/locations/{location}.

CreateRecognizerRequest

Pesan permintaan untuk metode CreateRecognizer.

Kolom
recognizer

Recognizer

Wajib. Pengenal yang akan dibuat.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau Pengenal, tetapi jangan benar-benar membuatnya.

recognizer_id

string

ID yang akan digunakan untuk Pengenal, yang akan menjadi komponen akhir nama resource Pengenal.

Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/.

parent

string

Wajib. Project dan lokasi tempat Pengenal ini akan dibuat. Format yang diharapkan adalah projects/{project}/locations/{location}.

CustomClass

CustomClass untuk pembiasan dalam pengenalan ucapan. Digunakan untuk menentukan kumpulan kata atau frasa yang mewakili konsep atau tema umum yang mungkin muncul di audio Anda, misalnya daftar nama kapal penumpang.

Kolom
name

string

Hanya output. ID. Nama resource CustomClass. Format projects/{project}/locations/{location}/customClasses/{custom_class}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk CustomClass.

display_name

string

Opsional. Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk CustomClass. Harus terdiri dari 63 karakter atau kurang.

items[]

ClassItem

Kumpulan item class.

state

State

Hanya output. Status siklus proses CustomClass.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Waktu terakhir sumber daya ini diubah.

delete_time

Timestamp

Hanya output. Waktu saat resource ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu saat resource ini akan dihapus permanen.

annotations

map<string, string>

Opsional. Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah CustomClass ini sedang dalam proses pembaruan atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

ClassItem

Item kelas.

Kolom
value

string

Nilai item class.

Negara bagian/Provinsi

Serangkaian status yang menentukan siklus proses CustomClass.

Enum
STATE_UNSPECIFIED Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan.
ACTIVE Status normal dan aktif.
DELETED CustomClass ini telah dihapus.

DeleteCustomClassRequest

Pesan permintaan untuk metode DeleteCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan dihapus. Format: projects/{project}/locations/{location}/customClasses/{custom_class}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke benar (true), dan CustomClass tidak ditemukan, permintaan akan berhasil dan tidak beroperasi (dalam kasus ini, tidak ada Operasi yang dicatat).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

DeletePhraseSetRequest

Pesan permintaan untuk metode DeletePhraseSet.

Kolom
name

string

Wajib. Nama FraseSet yang akan dihapus. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau frasaSet yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke true (benar), dan frasaSet tidak ditemukan, permintaan akan berhasil dan tidak dioperasikan (dalam kasus ini, tidak ada Operasi yang dicatat).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

DeleteRecognizerRequest

Pesan permintaan untuk metode DeleteRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan dihapus. Format: projects/{project}/locations/{location}/recognizers/{recognizer}

validate_only

bool

Jika ditetapkan, validasikan permintaan dan pratinjau Pengenal yang dihapus, tetapi jangan benar-benar menghapusnya.

allow_missing

bool

Jika disetel ke benar (true), dan Pengenal tidak ditemukan, permintaan akan berhasil dan tidak dioperasikan (dalam kasus ini, tidak ada Operasi yang dicatat).

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

ExplicitDecodingConfig

Parameter dekode yang ditentukan secara eksplisit.

Kolom
encoding

AudioEncoding

Wajib. Encoding data audio yang dikirim untuk pengenalan.

sample_rate_hertz

int32

Frekuensi sampel data audio dalam Hertz yang dikirim untuk pengenalan. Nilai yang valid adalah: 8000-48000. 16.000 adalah nilai optimal. Untuk hasil terbaik, setel frekuensi pengambilan sampel sumber audio ke 16.000 Hz. Jika tidak memungkinkan, gunakan frekuensi sampel native sumber audio (bukan pengambilan ulang sampel). Didukung untuk encoding berikut:

  • LINEAR16: Sampel PCM little-endian tanpa header 16-bit.

  • MULAW: Sampel mulaw dengan 8-bit tanpa header.

  • ALAW: Sampel alaw yang disertai 8-bit tanpa header.

audio_channel_count

int32

Jumlah channel yang ada dalam data audio yang dikirim untuk pengenalan. Didukung untuk encoding berikut:

  • LINEAR16: Sampel PCM little-endian tanpa header 16-bit.

  • MULAW: Sampel mulaw dengan 8-bit tanpa header.

  • ALAW: Sampel alaw yang disertai 8-bit tanpa header.

Nilai maksimum yang diizinkan adalah 8.

AudioEncoding

Encoding data audio yang didukung.

Enum
AUDIO_ENCODING_UNSPECIFIED Nilai default. Nilai ini tidak digunakan.
LINEAR16 Sampel PCM little-endian tanpa header 16-bit.
MULAW Sampel mulaw dengan 8-bit tanpa header.
ALAW Sampel alaw dengan 8-bit tanpa header.

GcsOutputConfig

Konfigurasi output untuk Cloud Storage.

Kolom
uri

string

Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan.

GetConfigRequest

Pesan permintaan untuk metode GetConfig.

Kolom
name

string

Wajib. Nama konfigurasi yang akan diambil. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

GetCustomClassRequest

Pesan permintaan untuk metode GetCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/customClasses/{custom_class}.

GetPhraseSetRequest

Pesan permintaan untuk metode GetPhraseSet.

Kolom
name

string

Wajib. Nama frasaSet yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/phraseSets/{phrase_set}.

GetRecognizerRequest

Pesan permintaan untuk metode GetRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan diambil. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}.

InlineOutputConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk respons inline.

InlineResult

Hasil akhir ditampilkan secara inline dalam respons pengenalan.

Kolom
transcript

BatchRecognizeResults

Transkrip untuk file audio.

vtt_captions

string

Transkrip untuk file audio sebagai teks berformat VTT. Kolom ini hanya diisi saat output VTT diminta.

srt_captions

string

Transkrip untuk file audio sebagai teks berformat SRT. Kolom ini hanya diisi saat output SRT diminta.

LanguageMetadata

Metadata tentang lokalitas yang tersedia di wilayah tertentu. Saat ini, hal tersebut hanyalah model yang tersedia untuk setiap lokalitas

Kolom
models

map<string, ModelMetadata>

Peta lokal (kode bahasa) -> model

ListCustomClassesRequest

Pesan permintaan untuk metode ListCustomClasses.

Kolom
parent

string

Wajib. Project dan lokasi resource CustomClass yang akan dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah hasil per permintaan. Page_size yang valid berkisar dari 0 hingga 100 inklusif. Jika page_size nol atau tidak ditentukan, ukuran halaman 5 akan dipilih. Jika ukuran halaman melebihi 100, ukuran halaman akan dikonversi menjadi 100. Perhatikan bahwa panggilan mungkin menampilkan lebih sedikit hasil daripada ukuran halaman yang diminta.

page_token

string

Token halaman, yang diterima dari panggilan ListCustomClasses sebelumnya. Berikan atribut ini untuk mengambil halaman selanjutnya.

Saat memberi nomor halaman, semua parameter lain yang diberikan ke ListCustomClasses harus cocok dengan panggilan yang menyediakan token halaman.

show_deleted

bool

Apakah akan menampilkan resource yang telah dihapus atau tidak.

ListCustomClassesResponse

Pesan respons untuk metode ListCustomClasses.

Kolom
custom_classes[]

CustomClass

Daftar CustomClass yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

ListPhraseSetsRequest

Pesan permintaan untuk metode ListPhraseSets.

Kolom
parent

string

Wajib. Project dan lokasi resource frasaSet yang akan dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah maksimum frasaSet yang akan ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 Set Frasa akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100.

page_token

string

Token halaman, yang diterima dari panggilan ListPhraseSets sebelumnya. Berikan atribut ini untuk mengambil halaman selanjutnya.

Saat memberi nomor halaman, semua parameter lain yang diberikan ke ListPhraseSets harus cocok dengan panggilan yang menyediakan token halaman.

show_deleted

bool

Apakah akan menampilkan resource yang telah dihapus atau tidak.

ListPhraseSetsResponse

Pesan respons untuk metode ListPhraseSets.

Kolom
phrase_sets[]

PhraseSet

Daftar Set Frasa yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

ListRecognizersRequest

Pesan permintaan untuk metode ListRecognizers.

Kolom
parent

string

Wajib. Project dan lokasi Pengenal yang akan dicantumkan. Format yang diharapkan adalah projects/{project}/locations/{location}.

page_size

int32

Jumlah maksimum Pengenal yang akan ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 Pengenal akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100.

page_token

string

Token halaman, yang diterima dari panggilan ListRecognizers sebelumnya. Berikan atribut ini untuk mengambil halaman selanjutnya.

Saat memberi nomor halaman, semua parameter lain yang diberikan ke ListRecognizers harus cocok dengan panggilan yang menyediakan token halaman.

show_deleted

bool

Apakah akan menampilkan resource yang telah dihapus atau tidak.

ListRecognizersResponse

Pesan respons untuk metode ListRecognizers.

Kolom
recognizers[]

Recognizer

Daftar Pengenal yang diminta.

next_page_token

string

Token, yang dapat dikirim sebagai page_token untuk mengambil halaman berikutnya. Jika kolom ini dihilangkan, tidak ada halaman berikutnya. Masa berlaku token ini akan berakhir setelah 72 jam.

LocationsMetadata

Metadata utama untuk locations API untuk STT V2. Saat ini, ini hanyalah metadata tentang lokalitas, model, dan fitur

Kolom
languages

LanguageMetadata

Informasi tentang lokalitas, model, dan fitur yang tersedia yang direpresentasikan dalam struktur hierarki lokal -> model -> fitur

access_metadata

AccessMetadata

Informasi tentang metadata akses untuk region dan project yang ditentukan.

ModelFeature

Merepresentasikan fitur tunggal model. Jika fiturnya adalah recognizer, release_state fitur tersebut akan mewakili release_state model

Kolom
feature

string

Nama fitur (Catatan: fitur dapat berupa recognizer)

release_state

string

Status rilis fitur

ModelFeatures

Mewakili kumpulan fitur milik model

Kolom
model_feature[]

ModelFeature

Kolom berulang yang berisi semua fitur model

ModelMetadata

Metadata tentang model di region tertentu untuk lokalitas tertentu. Saat ini, ini hanyalah fitur model

Kolom
model_features

map<string, ModelFeatures>

Peta nama model -> fitur dari model tersebut

NativeOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk proto BatchRecognizeResults yang diserialisasi.

OperationMetadata

Mewakili metadata operasi yang berjalan lama.

Kolom
create_time

Timestamp

Waktu operasi dibuat.

update_time

Timestamp

Waktu operasi terakhir diperbarui.

resource

string

Jalur resource untuk target operasi.

method

string

Metode yang memicu operasi.

kms_key_name

string

Nama kunci KMS yang digunakan untuk mengenkripsi konten Operasi. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Nama versi kunci KMS yang digunakan untuk mengenkripsi konten Operasi. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

progress_percent

int32

Persentase progres Operasi. Nilainya dapat berkisar dari 0-100. Jika nilainya 100, operasi selesai.

Kolom union request. Permintaan yang memunculkan Operation. request hanya ada berupa salah satu diantara berikut:
batch_recognize_request

BatchRecognizeRequest

BatchKenaliRequest yang melahirkan Operation.

create_recognizer_request

CreateRecognizerRequest

CreateKenalirRequest yang melahirkan Operation.

update_recognizer_request

UpdateRecognizerRequest

UpdateKenalirRequest yang melahirkan Operation.

delete_recognizer_request

DeleteRecognizerRequest

DeleteKenalirRequest yang melahirkan Operation.

undelete_recognizer_request

UndeleteRecognizerRequest

UndeleteKenalirRequest yang melahirkan Operation.

create_custom_class_request

CreateCustomClassRequest

CreateCustomClassRequest yang menghasilkan Operation.

update_custom_class_request

UpdateCustomClassRequest

UpdateCustomClassRequest yang menghasilkan Operation.

delete_custom_class_request

DeleteCustomClassRequest

DeleteCustomClassRequest yang menghasilkan Operation.

undelete_custom_class_request

UndeleteCustomClassRequest

UndeleteCustomClassRequest yang menghasilkan Operation.

create_phrase_set_request

CreatePhraseSetRequest

CreatePhraseSetRequest yang melahirkan Operation.

update_phrase_set_request

UpdatePhraseSetRequest

UpdatefrasaSetRequest yang melahirkan Operation.

delete_phrase_set_request

DeletePhraseSetRequest

DeletefrasaSetRequest yang melahirkan Operation.

undelete_phrase_set_request

UndeletePhraseSetRequest

UndeletefrasaSetRequest yang melahirkan Operation.

update_config_request
(deprecated)

UpdateConfigRequest

UpdateConfigRequest yang menghasilkan Operation.

Kolom union metadata. Metadata spesifik per RPC. metadata hanya ada berupa salah satu diantara berikut:
batch_recognize_metadata

BatchRecognizeMetadata

Metadata khusus untuk metode BatchKenali.

OutputFormatConfig

Konfigurasi untuk format hasil yang disimpan ke output.

Kolom
native

NativeOutputFileFormatConfig

Konfigurasi untuk format output native. Jika kolom ini disetel, atau jika tidak ada kolom format output lain yang ditetapkan, transkrip akan ditulis ke sink dalam format native.

vtt

VttOutputFileFormatConfig

Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT.

srt

SrtOutputFileFormatConfig

Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT.

PhraseSet

Set Frasa untuk pembiasan dalam pengenalan ucapan. Set Frasa digunakan untuk memberikan "petunjuk" kepada pengenal ucapan agar dapat memilih kata dan frasa tertentu dalam hasil.

Kolom
name

string

Hanya output. ID. Nama resource frasaSet. Format projects/{project}/locations/{location}/phraseSets/{phrase_set}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk frasaSet.

phrases[]

Phrase

Daftar kata dan frasa.

boost

float

Peningkatan Petunjuk. Nilai positif akan meningkatkan probabilitas bahwa frasa tertentu akan dikenali di antara frasa lain yang terdengar serupa. Semakin tinggi boostnya, semakin tinggi juga peluang pengenalan positif palsu. Nilai boost yang valid adalah antara 0 (eksklusif) dan 20. Sebaiknya gunakan pendekatan penelusuran biner untuk menemukan nilai optimal untuk kasus penggunaan Anda serta menambahkan frasa dengan dan tanpa peningkatan permintaan Anda.

display_name

string

Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk frasaSet. Harus terdiri dari 63 karakter atau kurang.

state

State

Hanya output. Status siklus proses frasaSet.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Waktu terakhir sumber daya ini diubah.

delete_time

Timestamp

Hanya output. Waktu saat resource ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu saat resource ini akan dihapus permanen.

annotations

map<string, string>

Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah FraseSet ini sedang dalam proses diperbarui atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi FraseSet. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi FraseSet. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

Frasa

Frasa berisi kata dan frasa "petunjuk" sehingga pengenalan ucapan lebih cenderung mengenalinya. Tindakan ini dapat digunakan untuk meningkatkan akurasi kata dan frasa tertentu, misalnya, jika perintah tertentu biasanya diucapkan oleh pengguna. Ini juga dapat digunakan untuk menambahkan kata-kata tambahan ke kosakata pengenal.

Item daftar juga dapat menyertakan referensi CustomClass yang berisi kelompok kata yang mewakili konsep umum yang terjadi dalam natural language.

Kolom
value

string

Frasa itu sendiri.

boost

float

Peningkatan Petunjuk. Mengganti peningkatan yang ditetapkan di tingkat kumpulan frasa. Nilai positif akan meningkatkan probabilitas bahwa frasa tertentu akan dikenali di antara frasa lain yang terdengar serupa. Semakin tinggi boostnya, semakin tinggi juga peluang pengenalan positif palsu. Nilai peningkatan negatif berkaitan dengan anti-bias. Anti-bias tidak diaktifkan, jadi nilai peningkatan negatif akan menampilkan kesalahan. Nilai peningkatan harus antara 0 dan 20. Setiap nilai di luar rentang tersebut akan menampilkan error. Sebaiknya gunakan pendekatan penelusuran biner untuk menemukan nilai optimal untuk kasus penggunaan Anda serta menambahkan frasa dengan dan tanpa peningkatan permintaan Anda.

Negara bagian/Provinsi

Serangkaian status yang menentukan siklus proses frasaSet.

Enum
STATE_UNSPECIFIED Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan.
ACTIVE Status normal dan aktif.
DELETED Set Frasa ini telah dihapus.

RecognitionConfig

Memberikan informasi kepada Pengenal yang menentukan cara memproses permintaan pengenalan.

Kolom
model

string

Opsional. Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik.

Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi dan model yang didukung di setiap wilayah dapat ditemukan di Daftar Model yang Didukung.

language_codes[]

string

Opsional. Bahasa audio yang disediakan sebagai tag bahasa BCP-47. Tag bahasa dinormalkan menjadi BCP-47 sebelum digunakan, misalnya "en-us" menjadi "en-US".

Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung.

Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi dalam audio.

features

RecognitionFeatures

Untuk mengaktifkan fitur pengenalan ucapan.

adaptation

SpeechAdaptation

Konteks adaptasi ucapan yang memberi bobot prediksi pengenal untuk kata dan frasa tertentu.

transcript_normalization

TranscriptNormalization

Opsional. Gunakan normalisasi transkripsi untuk otomatis mengganti bagian transkrip dengan frasa pilihan Anda. Untuk StreamingKenali, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir.

Kolom union decoding_config. Parameter decoding untuk audio yang dikirimkan untuk pengenalan. decoding_config hanya ada berupa salah satu diantara berikut:
auto_decoding_config

AutoDetectDecodingConfig

Mendeteksi parameter decoding secara otomatis. Lebih disarankan untuk format yang didukung.

explicit_decoding_config

ExplicitDecodingConfig

Parameter dekode yang ditentukan secara eksplisit. Wajib jika menggunakan audio PCM tanpa header (linear16, mulaw, alaw).

RecognitionFeatures

Fitur pengenalan yang tersedia.

Kolom
profanity_filter

bool

Jika disetel ke true, server akan mencoba memfilter kata-kata tidak sopan, dengan mengganti semua karakter kecuali karakter awal di setiap kata yang difilter dengan tanda bintang, misalnya, "f***". Jika ditetapkan ke false atau dihilangkan, kata-kata tidak sopan tidak akan difilter.

enable_word_time_offsets

bool

Jika true, hasil teratas akan menyertakan daftar kata serta offset waktu mulai dan berakhir (stempel waktu) untuk kata-kata tersebut. Jika false, tidak ada informasi selisih waktu tingkat kata yang ditampilkan. Defaultnya adalah false.

enable_word_confidence

bool

Jika true, hasil teratas akan menyertakan daftar kata dan tingkat keyakinan untuk kata tersebut. Jika false, tidak ada informasi keyakinan tingkat kata yang ditampilkan. Defaultnya adalah false.

enable_automatic_punctuation

bool

Jika true, menambahkan tanda baca ke hipotesis hasil pengenalan. Fitur ini hanya tersedia dalam bahasa tertentu. Nilai false default tidak menambahkan tanda baca ke hipotesis hasil.

enable_spoken_punctuation

bool

Perilaku tanda baca yang diucapkan untuk panggilan. Jika true, mengganti tanda baca lisan dengan simbol yang sesuai dalam permintaan. Misalnya, "bagaimana kabarmu" menjadi "kamu apa kabar?". Lihat https://cloud.google.com/speech-to-text/docs/spoken-punctuation untuk mendapatkan dukungan. Jika false, tanda baca yang diucapkan tidak diganti.

enable_spoken_emojis

bool

Perilaku emoji lisan untuk panggilan. Jika true, menambahkan format emoji lisan untuk permintaan. Tindakan ini akan menggantikan emoji lisan dengan simbol Unicode yang sesuai dalam transkrip akhir. Jika false, emoji lisan tidak akan diganti.

multi_channel_mode

MultiChannelMode

Mode untuk mengenali audio multi-channel.

diarization_config

SpeakerDiarizationConfig

Konfigurasi untuk mengaktifkan diarisasi speaker dan menyetel parameter tambahan agar diarisasi menjadi lebih cocok bagi aplikasi Anda. Jika ini diaktifkan, kami akan mengirimkan semua kata dari awal audio untuk alternatif teratas di setiap respons STREAMING berturut-turut. Hal ini dilakukan untuk meningkatkan kualitas tag pembicara seiring model kami belajar mengidentifikasi pembicara dalam percakapan dari waktu ke waktu. Untuk permintaan non-streaming, hasil diarisasi hanya akan diberikan di alternatif teratas dari FINAL SpeechRecognitionResult.

max_alternatives

int32

Jumlah maksimum hipotesis pengenalan yang akan ditampilkan. Server mungkin menampilkan kurang dari max_alternatives. Nilai yang valid adalah 0-30. Nilai 0 atau 1 akan menampilkan maksimum satu. Jika dihilangkan, akan menampilkan maksimum satu.

MultiChannelMode

Opsi untuk mengenali audio multi-channel.

Enum
MULTI_CHANNEL_MODE_UNSPECIFIED Nilai default untuk mode multi-saluran. Jika audio berisi beberapa channel, hanya channel pertama yang akan ditranskripsikan; channel lain akan diabaikan.
SEPARATE_RECOGNITION_PER_CHANNEL Jika dipilih, setiap saluran dalam audio yang disediakan ditranskripsikan secara independen. Opsi ini tidak dapat dipilih jika model yang dipilih adalah latest_short.

RecognitionOutputConfig

Opsi konfigurasi untuk output pengenalan.

Kolom
output_format_config

OutputFormatConfig

Opsional. Konfigurasi untuk format hasil yang disimpan ke output. Jika transkrip yang tidak ditentukan hanya akan ditulis dalam format NATIVE.

Kolom union output.

output hanya dapat berupa salah satu dari yang berikut:

gcs_output_config

GcsOutputConfig

Jika pesan ini diisi, hasil pengenalan akan ditulis ke URI Google Cloud Storage yang disediakan.

inline_response_config

InlineOutputConfig

Jika pesan ini diisi, hasil pengenalan akan diberikan dalam pesan BatchRecognizeResponse Operation saat selesai. Ini hanya didukung saat memanggil BatchRecognize hanya dengan satu file audio.

RecognitionResponseMetadata

Metadata tentang permintaan dan respons pengenalan.

Kolom
total_billed_duration

Duration

Jika tersedia, detik audio yang ditagih untuk permintaan yang sesuai.

RecognizeRequest

Pesan permintaan untuk metode Recognize. content atau uri harus diberikan. Menyediakan keduanya atau tidak akan menampilkan INVALID_ARGUMENT. Lihat batas konten.

Kolom
recognizer

string

Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit yang kosong.

config

RecognitionConfig

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config dari resource Pengenal.

config_mask

FieldMask

Daftar kolom dalam config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan menggantikan nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan mengganti konfigurasi di pengenal untuk permintaan pengenalan ini.

Kolom union audio_source. Sumber audio, yang berupa konten inline atau URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut:
content

bytes

Byte data audio yang dienkode seperti yang ditentukan dalam RecognitionConfig. Seperti semua kolom byte, buffer proto menggunakan representasi biner murni, sedangkan representasi JSON menggunakan base64.

uri

string

URI yang mengarah ke file yang berisi byte data audio seperti yang ditentukan dalam RecognitionConfig. File tidak boleh dikompresi (misalnya, gzip). Saat ini, hanya URI Google Cloud Storage yang didukung, yang harus ditentukan dalam format berikut: gs://bucket_name/object_name (format URI lainnya menampilkan INVALID_ARGUMENT). Untuk informasi selengkapnya, lihat URI Permintaan.

RecognizeResponse

Pesan respons untuk metode Recognize.

Kolom
results[]

SpeechRecognitionResult

Daftar berurutan hasil transkripsi yang sesuai dengan bagian audio secara berurutan.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

Pengenal

Pesan Pengenal. Menyimpan metadata dan konfigurasi pengenalan.

Kolom
name

string

Hanya output. ID. Nama resource Pengenal. Format projects/{project}/locations/{location}/recognizers/{recognizer}.

uid

string

Hanya output. ID unik yang ditetapkan sistem untuk Pengenal.

display_name

string

Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk Pengenal. Harus terdiri dari 63 karakter atau kurang.

model
(deprecated)

string

Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom model di pesan RecognitionConfig.

Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik.

Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi dan model yang didukung di setiap wilayah dapat ditemukan di Daftar Model yang Didukung.

language_codes[]
(deprecated)

string

Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom language_codes di pesan RecognitionConfig.

Bahasa audio yang disediakan sebagai tag bahasa BCP-47.

Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung.

Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi dalam audio. Saat Anda membuat atau memperbarui Pengenal, nilai ini disimpan dalam bentuk BCP-47 yang dinormalisasi. Misalnya, "en-us" disimpan sebagai "en-US".

default_recognition_config

RecognitionConfig

Konfigurasi default yang akan digunakan untuk permintaan dengan Pengenal ini. Fungsi ini dapat ditimpa oleh konfigurasi inline di kolom RecognizeRequest.config.

annotations

map<string, string>

Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi.

state

State

Hanya output. Status siklus proses Pengenal.

create_time

Timestamp

Hanya output. Waktu pembuatan.

update_time

Timestamp

Hanya output. Waktu terakhir Pengenal ini diubah.

delete_time

Timestamp

Hanya output. Waktu Pengenal ini diminta untuk dihapus.

expire_time

Timestamp

Hanya output. Waktu saat Pengenal ini akan dihapus permanen.

etag

string

Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

reconciling

bool

Hanya output. Apakah Pengenal ini sedang dalam proses pembaruan atau tidak.

kms_key_name

string

Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}.

kms_key_version_name

string

Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{crypto_key}/cryptoKeyVersions/{crypto_key_version}.

Negara bagian/Provinsi

Serangkaian status yang menentukan siklus proses Pengenal.

Enum
STATE_UNSPECIFIED Nilai default. Nilai ini digunakan jika status dihilangkan.
ACTIVE Pengenal aktif dan siap digunakan.
DELETED Pengenal ini telah dihapus.

SpeakerDiarizationConfig

Konfigurasi untuk mengaktifkan diarisasi speaker.

Kolom
min_speaker_count

int32

Wajib. Jumlah minimum pembicara dalam percakapan. Rentang ini membuat Anda lebih fleksibel karena memungkinkan sistem menentukan jumlah speaker yang tepat secara otomatis.

Untuk memperbaiki jumlah speaker yang terdeteksi dalam audio, setel min_speaker_count = max_speaker_count.

max_speaker_count

int32

Wajib. Jumlah maksimum pembicara dalam percakapan. Nilai yang valid adalah: 1-6. Harus >= min_speaker_count. Rentang ini membuat Anda lebih fleksibel karena memungkinkan sistem menentukan jumlah speaker yang tepat secara otomatis.

SpeechAdaptation

Memberikan "petunjuk" kepada pengenal ucapan untuk mendukung kata dan frasa tertentu dalam hasil. Frasa Set dapat ditetapkan sebagai resource inline, atau referensi ke resource frasaSet yang ada.

Kolom
phrase_sets[]

AdaptationPhraseSet

Daftar Set Frasa inline atau yang direferensikan.

custom_classes[]

CustomClass

Daftar CustomClass inline. Resource CustomClass yang ada dapat direferensikan secara langsung di FrasaSet.

AdaptationPhraseSet

FraseSet yang membias, yang dapat berupa string yang merujuk pada nama resource frasaSets yang ada, atau definisi inline dari frasaSet.

Kolom

Kolom union value.

value hanya dapat berupa salah satu dari yang berikut:

phrase_set

string

Nama resource frasaSet yang ada. Pengguna harus memiliki akses baca ke resource dan tidak boleh dihapus.

inline_phrase_set

PhraseSet

Set Frasa yang ditentukan inline.

SpeechRecognitionAlternative

Hipotesis alternatif (alias n-daftar terbaik).

Kolom
transcript

string

Teks transkrip yang mewakili kata-kata yang diucapkan pengguna.

confidence

float

Perkiraan tingkat keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali benar. Kolom ini hanya ditetapkan untuk alternatif teratas dari hasil non-streaming atau, dari hasil streaming dengan is_final ditetapkan ke true. Kolom ini tidak dijamin akurat dan pengguna tidak boleh mengandalkannya untuk selalu disediakan. Default 0.0 adalah nilai sentinel yang menunjukkan confidence belum ditetapkan.

words[]

WordInfo

Daftar informasi terkait kata untuk setiap kata yang dikenali. Jika SpeakerDiarizationConfig disetel, Anda akan melihat semua kata dari awal audio.

SpeechRecognitionResult

Hasil pengenalan ucapan yang sesuai dengan bagian audio.

Kolom
alternatives[]

SpeechRecognitionAlternative

Mungkin berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) adalah yang paling mungkin, berdasarkan peringkat berdasarkan pengenal.

channel_tag

int32

Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk audio_channel_count = N, nilai output-nya dapat berkisar dari 1 hingga N.

result_end_offset

Duration

Offset waktu akhir hasil ini relatif terhadap awal audio.

language_code

string

Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan paling besar untuk diucapkan dalam audio.

SrtOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

File subtitel berformat SubRip Text konfigurasi output.

StreamingRecognitionConfig

Memberikan informasi konfigurasi untuk permintaan StreamingRecognition.

Kolom
config

RecognitionConfig

Wajib. Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom config_mask dapat digunakan untuk mengganti bagian default_recognition_config dari resource Pengenal.

config_mask

FieldMask

Daftar kolom dalam config yang menggantikan nilai dalam default_recognition_config pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan menggantikan nilai di Pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan menggantikan konfigurasi di Pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan mengganti konfigurasi di pengenal untuk permintaan pengenalan ini.

streaming_features

StreamingRecognitionFeatures

Fitur pengenalan ucapan untuk mengaktifkan permintaan pengenalan audio streaming.

StreamingRecognitionFeatures

Fitur pengenalan yang tersedia khusus untuk permintaan pengenalan streaming.

Kolom
enable_voice_activity_events

bool

Jika true, respons dengan peristiwa ucapan aktivitas suara akan ditampilkan saat terdeteksi.

interim_results

bool

Apakah akan mengalirkan hasil sementara ke klien atau tidak. Jika disetel ke benar (true), hasil sementara akan di-streaming ke klien. Jika tidak, hanya respons akhir yang akan di-streaming kembali.

voice_activity_timeout

VoiceActivityTimeout

Jika disetel, server akan otomatis menutup streaming setelah durasi yang ditentukan telah berlalu, setelah peristiwa ucapan VOICE_ACTIVITY terakhir dikirim. Kolom voice_activity_events juga harus ditetapkan ke true.

VoiceActivityTimeout

Peristiwa yang waktu tunggunya dapat disetel untuk aktivitas suara.

Kolom
speech_start_timeout

Duration

Durasi untuk waktu tunggu streaming habis jika tidak ada ucapan yang dimulai. Jika kebijakan ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini pada awal streaming, server akan menutup streaming.

speech_end_timeout

Duration

Durasi untuk waktu tunggu streaming habis setelah ucapan berakhir. Jika kebijakan ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini setelah ucapan terdeteksi, server akan menutup streaming.

StreamingRecognitionResult

Hasil pengenalan ucapan streaming yang sesuai dengan sebagian audio yang sedang diproses.

Kolom
alternatives[]

SpeechRecognitionAlternative

Mungkin berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) adalah yang paling mungkin, berdasarkan peringkat berdasarkan pengenal.

is_final

bool

Jika false, StreamingRecognitionResult ini mewakili hasil sementara yang dapat berubah. Jika true, ini adalah saat terakhir layanan ucapan akan menampilkan StreamingRecognitionResult tertentu ini, pengenal tidak akan menampilkan hipotesis lebih lanjut untuk bagian transkrip ini dan audio yang sesuai.

stability

float

Perkiraan kemungkinan bahwa pengenal tidak akan mengubah tebakannya tentang hasil sementara ini. Nilainya berkisar dari 0.0 (benar-benar tidak stabil) hingga 1.0 (benar-benar stabil). Kolom ini hanya disediakan untuk hasil sementara (is_final=false). Nilai default 0.0 adalah nilai sentinel yang menunjukkan stability belum ditetapkan.

result_end_offset

Duration

Offset waktu akhir hasil ini relatif terhadap awal audio.

channel_tag

int32

Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk audio_channel_count = N, nilai output-nya dapat berkisar dari 1 hingga N.

language_code

string

Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan paling besar untuk diucapkan dalam audio.

StreamingRecognizeRequest

Pesan permintaan untuk metode StreamingRecognize. Beberapa pesan StreamingRecognizeRequest dikirim dalam satu panggilan.

Jika Recognizer yang direferensikan oleh recognizer berisi konfigurasi permintaan yang ditentukan sepenuhnya, aliran data hanya dapat berisi pesan dengan hanya audio yang disetel.

Jika tidak, pesan pertama harus berisi pesan recognizer dan streaming_config yang bersama-sama menentukan konfigurasi permintaan sepenuhnya dan tidak boleh berisi audio. Semua pesan berikutnya hanya boleh memiliki audio yang disetel.

Kolom
recognizer

string

Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit yang kosong.

Kolom union streaming_request.

streaming_request hanya dapat berupa salah satu dari yang berikut:

streaming_config

StreamingRecognitionConfig

StreamingRecognitionConfig yang akan digunakan dalam upaya pengenalan ini. Jika disediakan, tindakan ini akan mengganti RecognitionConfig default yang disimpan di Pengenal.

audio

bytes

Byte audio inline yang akan dikenali. Ukuran maksimum untuk kolom ini adalah 15 KB per permintaan.

StreamingRecognizeResponse

StreamingRecognizeResponse adalah satu-satunya pesan yang ditampilkan ke klien oleh StreamingRecognize. Serangkaian nol atau beberapa pesan StreamingRecognizeResponse di-streaming kembali ke klien. Jika tidak ada audio yang dapat dikenali, tidak ada pesan yang di-streaming kembali ke klien.

Berikut adalah beberapa contoh StreamingRecognizeResponse yang mungkin ditampilkan saat memproses audio:

  1. results { alternatives { transcript: "tube" } stability: 0.01 }

  2. results { alternatives { transcript: "to be a" } stability: 0.01 }

  3. results { alternatives { transcript: "to be" } stability: 0.9 } results { alternatives { transcript: " or not to be" } stability: 0.01 }

  4. results { alternatives { transcript: "to be or not to be" confidence: 0.92 } alternatives { transcript: "to bee or not to bee" } is_final: true }

  5. results { alternatives { transcript: " that's" } stability: 0.01 }

  6. results { alternatives { transcript: " that is" } stability: 0.9 } results { alternatives { transcript: " the question" } stability: 0.01 }

  7. results { alternatives { transcript: " that is the question" confidence: 0.98 } alternatives { transcript: " that was the question" } is_final: true }

Catatan:

  • Hanya dua dari respons #4 dan #7 di atas yang berisi hasil akhir; hal tersebut ditunjukkan oleh is_final: true. Menggabungkan keduanya akan menghasilkan transkrip lengkap: "menjadi atau tidak menjadi itu adalah pertanyaan".

  • Kolom lainnya berisi results sementara. #3 dan #6 berisi dua results sementara: bagian pertama memiliki stabilitas tinggi dan cenderung tidak berubah; bagian kedua memiliki stabilitas rendah dan sangat mungkin untuk berubah. UI designer dapat memilih untuk hanya menampilkan results dengan stabilitas tinggi.

  • Nilai stability dan confidence spesifik yang ditampilkan di atas hanya untuk tujuan ilustrasi. Nilai sebenarnya dapat berbeda.

  • Di setiap respons, hanya satu kolom ini yang akan ditetapkan: error, speech_event_type, atau satu atau beberapa (berulang) results.

Kolom
results[]

StreamingRecognitionResult

Daftar berulang ini berisi nol hasil atau lebih yang sesuai dengan bagian audio yang sedang diproses. Laporan ini berisi nol atau satu hasil is_final=true (bagian yang baru diselesaikan), diikuti dengan nol atau beberapa hasil is_final=false (hasil sementara).

speech_event_type

SpeechEventType

Menunjukkan jenis peristiwa ucapan.

speech_event_offset

Duration

Offset waktu antara awal audio dan kemunculan peristiwa.

metadata

RecognitionResponseMetadata

Metadata tentang pengenalan.

SpeechEventType

Menunjukkan jenis peristiwa ucapan.

Enum
SPEECH_EVENT_TYPE_UNSPECIFIED Tidak ada peristiwa ucapan yang ditentukan.
END_OF_SINGLE_UTTERANCE Peristiwa ini menunjukkan bahwa server mendeteksi akhir ucapan pengguna dan tidak mengharapkan ucapan tambahan. Oleh karena itu, server tidak akan memproses audio tambahan dan akan menutup streaming dua arah gRPC. Peristiwa ini hanya dikirim jika ada penghentian paksa karena senyap yang terdeteksi lebih awal. Acara ini hanya tersedia melalui latest_short model.
SPEECH_ACTIVITY_BEGIN Peristiwa ini menunjukkan bahwa server telah mendeteksi awal aktivitas suara manusia dalam streaming. Acara ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali di sepanjang streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true.
SPEECH_ACTIVITY_END Peristiwa ini menunjukkan bahwa server telah mendeteksi akhir aktivitas suara manusia pada streaming. Acara ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali di sepanjang streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true.

TranscriptNormalization

Konfigurasi normalisasi transkripsi. Gunakan normalisasi transkripsi untuk otomatis mengganti bagian transkrip dengan frasa pilihan Anda. Untuk StreamingKenali, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir.

Kolom
entries[]

Entry

Daftar entri pengganti. Kami akan melakukan penggantian dengan satu entri dalam satu waktu. Misalnya, entri kedua dalam ["cat" => "dog", "mountain cat" => "mountain dog"] tidak akan pernah diterapkan karena kami akan selalu memproses entri pertama sebelumnya. Maksimal 100 entri.

Entri

Konfigurasi penggantian tunggal.

Kolom
search

string

Yang harus diganti. Panjang maksimal adalah 100 karakter.

replace

string

Apa yang akan diganti. Panjang maksimal adalah 100 karakter.

case_sensitive

bool

Apakah penelusuran peka huruf besar/kecil.

UndeleteCustomClassRequest

Pesan permintaan untuk metode UndeleteCustomClass.

Kolom
name

string

Wajib. Nama CustomClass yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/customClasses/{custom_class}

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang tidak dihapus, tetapi jangan benar-benar membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UndeletePhraseSetRequest

Pesan permintaan untuk metode UndeletePhraseSet.

Kolom
name

string

Wajib. Nama FrasaSet yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}

validate_only

bool

Jika disetel, validasi permintaan dan pratinjau frasaSet yang tidak dihapus, tetapi jangan benar-benar membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UndeleteRecognizerRequest

Pesan permintaan untuk metode UndeleteRecognizer.

Kolom
name

string

Wajib. Nama Pengenal yang akan dibatalkan penghapusannya. Format: projects/{project}/locations/{location}/recognizers/{recognizer}

validate_only

bool

Jika disetel, validasi permintaan dan pratinjau Pengenal yang belum dihapus, tetapi jangan benar-benar membatalkan penghapusannya.

etag

string

Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan.

UpdateConfigRequest

Pesan permintaan untuk metode UpdateConfig.

Kolom
config

Config

Wajib. Konfigurasi yang akan diperbarui.

Kolom name konfigurasi digunakan untuk mengidentifikasi konfigurasi yang akan diupdate. Format yang diharapkan adalah projects/{project}/locations/{location}/config.

update_mask

FieldMask

Daftar kolom yang akan diperbarui.

UpdateCustomClassRequest

Pesan permintaan untuk metode UpdateCustomClass.

Kolom
custom_class

CustomClass

Wajib. CustomClass yang akan diperbarui.

Kolom name CustomClass digunakan untuk mengidentifikasi CustomClass yang akan diupdate. Format: projects/{project}/locations/{location}/customClasses/{custom_class}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom dipertimbangkan untuk diperbarui.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang diperbarui, tetapi jangan benar-benar memperbaruinya.

UpdatePhraseSetRequest

Pesan permintaan untuk metode UpdatePhraseSet.

Kolom
phrase_set

PhraseSet

Wajib. FrasaSet yang akan diperbarui.

Kolom name frasaSet digunakan untuk mengidentifikasi frasaSet yang akan diperbarui. Format: projects/{project}/locations/{location}/phraseSets/{phrase_set}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk update. Gunakan * untuk mengupdate seluruh resource frasaSet.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau frasaSet yang diperbarui, tetapi jangan benar-benar memperbaruinya.

UpdateRecognizerRequest

Pesan permintaan untuk metode UpdateRecognizer.

Kolom
recognizer

Recognizer

Wajib. Pengenal yang akan diupdate.

Kolom name Pengenal digunakan untuk mengidentifikasi Pengenal yang akan diperbarui. Format: projects/{project}/locations/{location}/recognizers/{recognizer}.

update_mask

FieldMask

Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk update. Gunakan * untuk mengupdate seluruh resource Pengenal.

validate_only

bool

Jika ditetapkan, validasi permintaan dan pratinjau Pengenal yang diperbarui, tetapi jangan benar-benar memperbaruinya.

VttOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk file subtitel berformat WebVTT.

WordInfo

Informasi spesifik per kata untuk kata yang dikenali.

Kolom
start_offset

Duration

Offset waktu relatif terhadap awal audio, dan sesuai dengan awal kata yang diucapkan. Kolom ini hanya ditetapkan jika enable_word_time_offsets adalah true dan hanya dalam hipotesis teratas. Fitur ini adalah fitur eksperimental dan keakuratan selisih waktu dapat bervariasi.

end_offset

Duration

Offset waktu relatif terhadap awal audio, dan sesuai dengan akhir kata yang diucapkan. Kolom ini hanya ditetapkan jika enable_word_time_offsets adalah true dan hanya dalam hipotesis teratas. Fitur ini adalah fitur eksperimental dan keakuratan selisih waktu dapat bervariasi.

word

string

Kata yang sesuai dengan kumpulan informasi ini.

confidence

float

Perkiraan tingkat keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali benar. Kolom ini hanya ditetapkan untuk alternatif teratas dari hasil non-streaming atau, dari hasil streaming dengan is_final ditetapkan ke true. Kolom ini tidak dijamin akurat dan pengguna tidak boleh mengandalkannya untuk selalu disediakan. Default 0.0 adalah nilai sentinel yang menunjukkan confidence belum ditetapkan.

speaker_label

string

Label yang berbeda ditetapkan untuk setiap pembicara dalam audio. Kolom ini menentukan salah satu pembicara yang terdeteksi telah mengucapkan kata ini. speaker_label disetel jika SpeakerDiarizationConfig diberikan dan hanya berada dalam alternatif teratas.