Indeks
Speech
(antar muka)AccessMetadata
(pesan)AccessMetadata.ConstraintType
(enum)AutoDetectDecodingConfig
(pesan)BatchRecognizeFileMetadata
(pesan)BatchRecognizeFileResult
(pesan)BatchRecognizeMetadata
(pesan)BatchRecognizeRequest
(pesan)BatchRecognizeRequest.ProcessingStrategy
(enum)BatchRecognizeResponse
(pesan)BatchRecognizeResults
(pesan)BatchRecognizeTranscriptionMetadata
(pesan)CloudStorageResult
(pesan)Config
(pesan)CreateCustomClassRequest
(pesan)CreatePhraseSetRequest
(pesan)CreateRecognizerRequest
(pesan)CustomClass
(pesan)CustomClass.ClassItem
(pesan)CustomClass.State
(enum)DeleteCustomClassRequest
(pesan)DeletePhraseSetRequest
(pesan)DeleteRecognizerRequest
(pesan)ExplicitDecodingConfig
(pesan)ExplicitDecodingConfig.AudioEncoding
(enum)GcsOutputConfig
(pesan)GetConfigRequest
(pesan)GetCustomClassRequest
(pesan)GetPhraseSetRequest
(pesan)GetRecognizerRequest
(pesan)InlineOutputConfig
(pesan)InlineResult
(pesan)LanguageMetadata
(pesan)ListCustomClassesRequest
(pesan)ListCustomClassesResponse
(pesan)ListPhraseSetsRequest
(pesan)ListPhraseSetsResponse
(pesan)ListRecognizersRequest
(pesan)ListRecognizersResponse
(pesan)LocationsMetadata
(pesan)ModelFeature
(pesan)ModelFeatures
(pesan)ModelMetadata
(pesan)NativeOutputFileFormatConfig
(pesan)OperationMetadata
(pesan)OutputFormatConfig
(pesan)PhraseSet
(pesan)PhraseSet.Phrase
(pesan)PhraseSet.State
(enum)RecognitionConfig
(pesan)RecognitionFeatures
(pesan)RecognitionFeatures.MultiChannelMode
(enum)RecognitionOutputConfig
(pesan)RecognitionResponseMetadata
(pesan)RecognizeRequest
(pesan)RecognizeResponse
(pesan)Recognizer
(pesan)Recognizer.State
(enum)SpeakerDiarizationConfig
(pesan)SpeechAdaptation
(pesan)SpeechAdaptation.AdaptationPhraseSet
(pesan)SpeechRecognitionAlternative
(pesan)SpeechRecognitionResult
(pesan)SrtOutputFileFormatConfig
(pesan)StreamingRecognitionConfig
(pesan)StreamingRecognitionFeatures
(pesan)StreamingRecognitionFeatures.VoiceActivityTimeout
(pesan)StreamingRecognitionResult
(pesan)StreamingRecognizeRequest
(pesan)StreamingRecognizeResponse
(pesan)StreamingRecognizeResponse.SpeechEventType
(enum)TranscriptNormalization
(pesan)TranscriptNormalization.Entry
(pesan)UndeleteCustomClassRequest
(pesan)UndeletePhraseSetRequest
(pesan)UndeleteRecognizerRequest
(pesan)UpdateConfigRequest
(pesan)UpdateCustomClassRequest
(pesan)UpdatePhraseSetRequest
(pesan)UpdateRecognizerRequest
(pesan)VttOutputFileFormatConfig
(pesan)WordInfo
(pesan)
Speech
Mengaktifkan transkripsi ucapan dan pengelolaan materi.
BatchRecognize |
---|
Melakukan pengenalan ucapan asinkron batch: mengirim permintaan dengan file audio N dan menerima operasi yang berjalan lama yang dapat dilakukan polling untuk melihat saat transkripsi selesai.
|
CreateCustomClass |
---|
Membuat
|
CreatePhraseSet |
---|
Membuat
|
CreateRecognizer |
---|
Membuat
|
DeleteCustomClass |
---|
Menghapus
|
DeletePhraseSet |
---|
Menghapus
|
DeleteRecognizer |
---|
Menghapus
|
GetConfig |
---|
Menampilkan
|
GetCustomClass |
---|
Menampilkan
|
GetPhraseSet |
---|
Menampilkan
|
GetRecognizer |
---|
Menampilkan
|
ListCustomClasses |
---|
Mencantumkan CustomClass.
|
ListPhraseSets |
---|
Mencantumkan Kumpulan Frasa.
|
ListRecognizers |
---|
Mencantumkan Pengenal.
|
Kenali |
---|
Melakukan pengenalan ucapan sinkron: menerima hasil setelah semua audio dikirim dan diproses.
|
StreamingRecognize |
---|
Melakukan streaming pengenalan ucapan dua arah: menerima hasil saat mengirim audio. Metode ini hanya tersedia melalui gRPC API (bukan REST).
|
UndeleteCustomClass |
---|
Membatalkan penghapusan
|
UndeletePhraseSet |
---|
Membatalkan penghapusan
|
UndeleteRecognizer |
---|
Membatalkan penghapusan
|
UpdateConfig |
---|
Mengupdate
|
UpdateCustomClass |
---|
Mengupdate
|
UpdatePhraseSet |
---|
Mengupdate
|
UpdateRecognizer |
---|
Mengupdate
|
AccessMetadata
Metadata akses untuk region tertentu. Ini dapat diterapkan jika kebijakan organisasi untuk project tertentu tidak mengizinkan region tertentu.
Kolom | |
---|---|
constraint_type |
Menjelaskan berbagai jenis batasan yang diterapkan. |
ConstraintType
Menjelaskan berbagai jenis batasan yang dapat diterapkan pada suatu wilayah.
Enum | |
---|---|
CONSTRAINT_TYPE_UNSPECIFIED |
Batasan yang tidak ditentukan diterapkan. |
RESOURCE_LOCATIONS_ORG_POLICY_CREATE_CONSTRAINT |
Kebijakan organisasi proyek tidak mengizinkan region yang ditentukan. |
AutoDetectDecodingConfig
Jenis ini tidak memiliki kolom.
Parameter dekode terdeteksi secara otomatis. Didukung untuk encoding berikut:
WAV_LINEAR16: Sampel PCM little-endian 16-bit yang ditandatangani dalam container WAV.
WAV_MULAW: Sampel mulaw bersama 8 bit dalam container WAV.
WAV_ALAW: Sampel alaw yang disertakan 8 bit dalam container WAV.
RFC4867_5_AMR: Frame AMR dengan header rfc4867.5.
RFC4867_5_AMRWB: Frame AMR-WB dengan header rfc4867.5.
FLAC: Frame FLAC dalam format penampung "FLAC native".
MP3: Frame audio MPEG dengan metadata ID3 opsional (diabaikan).
OGG_OPUS: Frame audio Opus dalam penampung Ogg.
WEBM_OPUS: Frame audio Opus dalam penampung WebM.
MP4_AAC: Frame audio AAC dalam container MP4.
M4A_AAC: Frame audio AAC dalam penampung M4A.
MOV_AAC: Frame audio AAC dalam penampung MOV.
BatchRecognizeFileMetadata
Metadata tentang satu file dalam batch untuk BatchKenali.
Kolom | |
---|---|
config |
Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom |
config_mask |
Daftar kolom dalam |
Kolom union audio_source . Sumber audio, yang merupakan URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut: |
|
uri |
URI Cloud Storage untuk file audio. |
BatchRecognizeFileResult
Hasil akhir untuk satu file.
Kolom | |
---|---|
error |
Error jika ditemukan. |
metadata |
|
uri |
Tidak digunakan lagi. Sebagai gantinya, gunakan |
transcript |
Tidak digunakan lagi. Sebagai gantinya, gunakan |
Kolom union
|
|
cloud_storage_result |
Hasil pengenalan yang ditulis ke Cloud Storage. Kolom ini hanya diisi jika |
inline_result |
Hasil pengenalan. Kolom ini hanya diisi jika |
BatchRecognizeMetadata
Metadata operasi untuk BatchRecognize
.
Kolom | |
---|---|
transcription_metadata |
Petakan dari nama file yang diberikan ke metadata transkripsi untuk file tersebut. |
BatchRecognizeRequest
Pesan permintaan untuk metode BatchRecognize
.
Kolom | |
---|---|
recognizer |
Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah |
config |
Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom |
config_mask |
Daftar kolom dalam |
files[] |
File audio dengan metadata file untuk ASR. Jumlah file maksimum yang diizinkan untuk ditentukan adalah 5. |
recognition_output_config |
Opsi konfigurasi untuk tempat menampilkan transkrip setiap file. |
processing_strategy |
Strategi pemrosesan yang akan digunakan untuk permintaan ini. |
ProcessingStrategy
Kemungkinan strategi pemrosesan untuk permintaan batch.
Enum | |
---|---|
PROCESSING_STRATEGY_UNSPECIFIED |
Nilai default untuk strategi pemrosesan. Permintaan akan diproses segera setelah diterima. |
DYNAMIC_BATCHING |
Jika dipilih, permintaan akan diproses selama periode penggunaan yang lebih rendah untuk diskon harga. Permintaan akan dipenuhi dalam waktu 24 jam. |
BatchRecognizeResponse
Pesan respons untuk BatchRecognize
yang dikemas ke dalam Operation
yang berjalan lama.
Kolom | |
---|---|
results |
Petakan dari nama file ke hasil akhir file tersebut. |
total_billed_duration |
Jika tersedia, detik audio yang ditagih untuk permintaan yang sesuai. |
BatchRecognizeResults
Jenis output untuk Cloud Storage transkrip Batchcat. Meskipun proto ini tidak ditampilkan dalam API ini di mana pun, transkrip Cloud Storage akan diserialisasi proto ini dan harus diuraikan sebagaimana mestinya.
Kolom | |
---|---|
results[] |
Daftar berurutan hasil transkripsi yang sesuai dengan bagian audio secara berurutan. |
metadata |
Metadata tentang pengenalan. |
BatchRecognizeTranscriptionMetadata
Metadata tentang transkripsi untuk satu file (misalnya, persentase progres).
Kolom | |
---|---|
progress_percent |
Jumlah file yang telah ditranskripsikan sejauh ini. |
error |
Error jika ditemukan. |
uri |
URI Cloud Storage yang akan menjadi tempat penulisan hasil pengenalan. |
CloudStorageResult
Hasil akhir ditulis ke Cloud Storage.
Kolom | |
---|---|
uri |
URI Cloud Storage tempat hasil pengenalan ditulis. |
vtt_format_uri |
URI Cloud Storage yang hasil pengenalannya ditulis sebagai teks berformat VTT. Kolom ini hanya diisi saat output |
srt_format_uri |
URI Cloud Storage yang hasil pengenalannya ditulis sebagai teks berformat SRT. Kolom ini hanya diisi saat output |
Konfigurasi
Pesan yang mewakili konfigurasi untuk Speech-to-Text API. Opsi ini mencakup kunci KMS opsional yang akan digunakan untuk mengenkripsi data yang masuk.
Kolom | |
---|---|
name |
Hanya output. ID. Nama resource konfigurasi. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah |
kms_key_name |
Opsional. Nama kunci KMS opsional yang jika ada, akan digunakan untuk mengenkripsi resource Speech-to-Text dalam penyimpanan. Memperbarui kunci ini tidak akan mengenkripsi resource yang ada menggunakan kunci ini; hanya resource baru yang akan dienkripsi menggunakan kunci ini. Format yang diharapkan adalah |
update_time |
Hanya output. Waktu terakhir sumber daya ini diubah. |
CreateCustomClassRequest
Pesan permintaan untuk metode CreateCustomClass
.
Kolom | |
---|---|
custom_class |
Wajib. CustomClass yang akan dibuat. |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau CustomClass, tetapi jangan benar-benar membuatnya. |
custom_class_id |
ID yang akan digunakan untuk CustomClass, yang akan menjadi komponen akhir dari nama resource CustomClass. Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/. |
parent |
Wajib. Project dan lokasi tempat CustomClass ini akan dibuat. Format yang diharapkan adalah |
CreatePhraseSetRequest
Pesan permintaan untuk metode CreatePhraseSet
.
Kolom | |
---|---|
phrase_set |
Wajib. FrasaSet yang akan dibuat. |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau frasaSet, tetapi jangan benar-benar membuatnya. |
phrase_set_id |
ID yang akan digunakan untuk Set Frasa, yang akan menjadi komponen akhir dari nama resource frasaSet. Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/. |
parent |
Wajib. Project dan lokasi tempat pembuatan Set Frasa ini. Format yang diharapkan adalah |
CreateRecognizerRequest
Pesan permintaan untuk metode CreateRecognizer
.
Kolom | |
---|---|
recognizer |
Wajib. Pengenal yang akan dibuat. |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau Pengenal, tetapi jangan benar-benar membuatnya. |
recognizer_id |
ID yang akan digunakan untuk Pengenal, yang akan menjadi komponen akhir nama resource Pengenal. Nilai ini harus terdiri dari 4-63 karakter, dan karakter yang valid adalah /[a-z][0-9]-/. |
parent |
Wajib. Project dan lokasi tempat Pengenal ini akan dibuat. Format yang diharapkan adalah |
CustomClass
CustomClass untuk pembiasan dalam pengenalan ucapan. Digunakan untuk menentukan kumpulan kata atau frasa yang mewakili konsep atau tema umum yang mungkin muncul di audio Anda, misalnya daftar nama kapal penumpang.
Kolom | |
---|---|
name |
Hanya output. ID. Nama resource CustomClass. Format |
uid |
Hanya output. ID unik yang ditetapkan sistem untuk CustomClass. |
display_name |
Opsional. Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk CustomClass. Harus terdiri dari 63 karakter atau kurang. |
items[] |
Kumpulan item class. |
state |
Hanya output. Status siklus proses CustomClass. |
create_time |
Hanya output. Waktu pembuatan. |
update_time |
Hanya output. Waktu terakhir sumber daya ini diubah. |
delete_time |
Hanya output. Waktu saat resource ini diminta untuk dihapus. |
expire_time |
Hanya output. Waktu saat resource ini akan dihapus permanen. |
annotations |
Opsional. Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi. |
etag |
Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
reconciling |
Hanya output. Apakah CustomClass ini sedang dalam proses pembaruan atau tidak. |
kms_key_name |
Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah |
kms_key_version_name |
Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi CustomClass. Format yang diharapkan adalah |
ClassItem
Item kelas.
Kolom | |
---|---|
value |
Nilai item class. |
Negara bagian/Provinsi
Serangkaian status yang menentukan siklus proses CustomClass.
Enum | |
---|---|
STATE_UNSPECIFIED |
Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan. |
ACTIVE |
Status normal dan aktif. |
DELETED |
CustomClass ini telah dihapus. |
DeleteCustomClassRequest
Pesan permintaan untuk metode DeleteCustomClass
.
Kolom | |
---|---|
name |
Wajib. Nama CustomClass yang akan dihapus. Format: |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang dihapus, tetapi jangan benar-benar menghapusnya. |
allow_missing |
Jika disetel ke benar (true), dan CustomClass tidak ditemukan, permintaan akan berhasil dan tidak beroperasi (dalam kasus ini, tidak ada Operasi yang dicatat). |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
DeletePhraseSetRequest
Pesan permintaan untuk metode DeletePhraseSet
.
Kolom | |
---|---|
name |
Wajib. Nama FraseSet yang akan dihapus. Format: |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau frasaSet yang dihapus, tetapi jangan benar-benar menghapusnya. |
allow_missing |
Jika disetel ke true (benar), dan frasaSet tidak ditemukan, permintaan akan berhasil dan tidak dioperasikan (dalam kasus ini, tidak ada Operasi yang dicatat). |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
DeleteRecognizerRequest
Pesan permintaan untuk metode DeleteRecognizer
.
Kolom | |
---|---|
name |
Wajib. Nama Pengenal yang akan dihapus. Format: |
validate_only |
Jika ditetapkan, validasikan permintaan dan pratinjau Pengenal yang dihapus, tetapi jangan benar-benar menghapusnya. |
allow_missing |
Jika disetel ke benar (true), dan Pengenal tidak ditemukan, permintaan akan berhasil dan tidak dioperasikan (dalam kasus ini, tidak ada Operasi yang dicatat). |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
ExplicitDecodingConfig
Parameter dekode yang ditentukan secara eksplisit.
Kolom | |
---|---|
encoding |
Wajib. Encoding data audio yang dikirim untuk pengenalan. |
sample_rate_hertz |
Frekuensi sampel data audio dalam Hertz yang dikirim untuk pengenalan. Nilai yang valid adalah: 8000-48000. 16.000 adalah nilai optimal. Untuk hasil terbaik, setel frekuensi pengambilan sampel sumber audio ke 16.000 Hz. Jika tidak memungkinkan, gunakan frekuensi sampel native sumber audio (bukan pengambilan ulang sampel). Didukung untuk encoding berikut:
|
audio_channel_count |
Jumlah channel yang ada dalam data audio yang dikirim untuk pengenalan. Didukung untuk encoding berikut:
Nilai maksimum yang diizinkan adalah 8. |
AudioEncoding
Encoding data audio yang didukung.
Enum | |
---|---|
AUDIO_ENCODING_UNSPECIFIED |
Nilai default. Nilai ini tidak digunakan. |
LINEAR16 |
Sampel PCM little-endian tanpa header 16-bit. |
MULAW |
Sampel mulaw dengan 8-bit tanpa header. |
ALAW |
Sampel alaw dengan 8-bit tanpa header. |
GcsOutputConfig
Konfigurasi output untuk Cloud Storage.
Kolom | |
---|---|
uri |
Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan. |
GetConfigRequest
Pesan permintaan untuk metode GetConfig
.
Kolom | |
---|---|
name |
Wajib. Nama konfigurasi yang akan diambil. Hanya ada satu resource konfigurasi per project per lokasi. Format yang diharapkan adalah |
GetCustomClassRequest
Pesan permintaan untuk metode GetCustomClass
.
Kolom | |
---|---|
name |
Wajib. Nama CustomClass yang akan diambil. Format yang diharapkan adalah |
GetPhraseSetRequest
Pesan permintaan untuk metode GetPhraseSet
.
Kolom | |
---|---|
name |
Wajib. Nama frasaSet yang akan diambil. Format yang diharapkan adalah |
GetRecognizerRequest
Pesan permintaan untuk metode GetRecognizer
.
Kolom | |
---|---|
name |
Wajib. Nama Pengenal yang akan diambil. Format yang diharapkan adalah |
InlineOutputConfig
Jenis ini tidak memiliki kolom.
Konfigurasi output untuk respons inline.
InlineResult
Hasil akhir ditampilkan secara inline dalam respons pengenalan.
Kolom | |
---|---|
transcript |
Transkrip untuk file audio. |
vtt_captions |
Transkrip untuk file audio sebagai teks berformat VTT. Kolom ini hanya diisi saat output |
srt_captions |
Transkrip untuk file audio sebagai teks berformat SRT. Kolom ini hanya diisi saat output |
LanguageMetadata
Metadata tentang lokalitas yang tersedia di wilayah tertentu. Saat ini, hal tersebut hanyalah model yang tersedia untuk setiap lokalitas
Kolom | |
---|---|
models |
Peta lokal (kode bahasa) -> model |
ListCustomClassesRequest
Pesan permintaan untuk metode ListCustomClasses
.
Kolom | |
---|---|
parent |
Wajib. Project dan lokasi resource CustomClass yang akan dicantumkan. Format yang diharapkan adalah |
page_size |
Jumlah hasil per permintaan. Page_size yang valid berkisar dari 0 hingga 100 inklusif. Jika page_size nol atau tidak ditentukan, ukuran halaman 5 akan dipilih. Jika ukuran halaman melebihi 100, ukuran halaman akan dikonversi menjadi 100. Perhatikan bahwa panggilan mungkin menampilkan lebih sedikit hasil daripada ukuran halaman yang diminta. |
page_token |
Token halaman, yang diterima dari panggilan Saat memberi nomor halaman, semua parameter lain yang diberikan ke |
show_deleted |
Apakah akan menampilkan resource yang telah dihapus atau tidak. |
ListCustomClassesResponse
Pesan respons untuk metode ListCustomClasses
.
Kolom | |
---|---|
custom_classes[] |
Daftar CustomClass yang diminta. |
next_page_token |
Token, yang dapat dikirim sebagai |
ListPhraseSetsRequest
Pesan permintaan untuk metode ListPhraseSets
.
Kolom | |
---|---|
parent |
Wajib. Project dan lokasi resource frasaSet yang akan dicantumkan. Format yang diharapkan adalah |
page_size |
Jumlah maksimum frasaSet yang akan ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 Set Frasa akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100. |
page_token |
Token halaman, yang diterima dari panggilan Saat memberi nomor halaman, semua parameter lain yang diberikan ke |
show_deleted |
Apakah akan menampilkan resource yang telah dihapus atau tidak. |
ListPhraseSetsResponse
Pesan respons untuk metode ListPhraseSets
.
Kolom | |
---|---|
phrase_sets[] |
Daftar Set Frasa yang diminta. |
next_page_token |
Token, yang dapat dikirim sebagai |
ListRecognizersRequest
Pesan permintaan untuk metode ListRecognizers
.
Kolom | |
---|---|
parent |
Wajib. Project dan lokasi Pengenal yang akan dicantumkan. Format yang diharapkan adalah |
page_size |
Jumlah maksimum Pengenal yang akan ditampilkan. Layanan mungkin menampilkan lebih sedikit dari nilai ini. Jika tidak ditentukan, maksimal 5 Pengenal akan ditampilkan. Nilai maksimum adalah 100; nilai di atas 100 akan dikonversi menjadi 100. |
page_token |
Token halaman, yang diterima dari panggilan Saat memberi nomor halaman, semua parameter lain yang diberikan ke |
show_deleted |
Apakah akan menampilkan resource yang telah dihapus atau tidak. |
ListRecognizersResponse
Pesan respons untuk metode ListRecognizers
.
Kolom | |
---|---|
recognizers[] |
Daftar Pengenal yang diminta. |
next_page_token |
Token, yang dapat dikirim sebagai |
LocationsMetadata
Metadata utama untuk locations API untuk STT V2. Saat ini, ini hanyalah metadata tentang lokalitas, model, dan fitur
Kolom | |
---|---|
languages |
Informasi tentang lokalitas, model, dan fitur yang tersedia yang direpresentasikan dalam struktur hierarki lokal -> model -> fitur |
access_metadata |
Informasi tentang metadata akses untuk region dan project yang ditentukan. |
ModelFeature
Merepresentasikan fitur tunggal model. Jika fiturnya adalah recognizer
, release_state fitur tersebut akan mewakili release_state model
Kolom | |
---|---|
feature |
Nama fitur (Catatan: fitur dapat berupa |
release_state |
Status rilis fitur |
ModelFeatures
Mewakili kumpulan fitur milik model
Kolom | |
---|---|
model_feature[] |
Kolom berulang yang berisi semua fitur model |
ModelMetadata
Metadata tentang model di region tertentu untuk lokalitas tertentu. Saat ini, ini hanyalah fitur model
Kolom | |
---|---|
model_features |
Peta nama model -> fitur dari model tersebut |
NativeOutputFileFormatConfig
Jenis ini tidak memiliki kolom.
Konfigurasi output untuk proto BatchRecognizeResults
yang diserialisasi.
OperationMetadata
Mewakili metadata operasi yang berjalan lama.
Kolom | |
---|---|
create_time |
Waktu operasi dibuat. |
update_time |
Waktu operasi terakhir diperbarui. |
resource |
Jalur resource untuk target operasi. |
method |
Metode yang memicu operasi. |
kms_key_name |
Nama kunci KMS yang digunakan untuk mengenkripsi konten Operasi. Format yang diharapkan adalah |
kms_key_version_name |
Nama versi kunci KMS yang digunakan untuk mengenkripsi konten Operasi. Format yang diharapkan adalah |
progress_percent |
Persentase progres Operasi. Nilainya dapat berkisar dari 0-100. Jika nilainya 100, operasi selesai. |
Kolom union request . Permintaan yang memunculkan Operation. request hanya ada berupa salah satu diantara berikut: |
|
batch_recognize_request |
BatchKenaliRequest yang melahirkan Operation. |
create_recognizer_request |
CreateKenalirRequest yang melahirkan Operation. |
update_recognizer_request |
UpdateKenalirRequest yang melahirkan Operation. |
delete_recognizer_request |
DeleteKenalirRequest yang melahirkan Operation. |
undelete_recognizer_request |
UndeleteKenalirRequest yang melahirkan Operation. |
create_custom_class_request |
CreateCustomClassRequest yang menghasilkan Operation. |
update_custom_class_request |
UpdateCustomClassRequest yang menghasilkan Operation. |
delete_custom_class_request |
DeleteCustomClassRequest yang menghasilkan Operation. |
undelete_custom_class_request |
UndeleteCustomClassRequest yang menghasilkan Operation. |
create_phrase_set_request |
CreatePhraseSetRequest yang melahirkan Operation. |
update_phrase_set_request |
UpdatefrasaSetRequest yang melahirkan Operation. |
delete_phrase_set_request |
DeletefrasaSetRequest yang melahirkan Operation. |
undelete_phrase_set_request |
UndeletefrasaSetRequest yang melahirkan Operation. |
update_config_request |
UpdateConfigRequest yang menghasilkan Operation. |
Kolom union metadata . Metadata spesifik per RPC. metadata hanya ada berupa salah satu diantara berikut: |
|
batch_recognize_metadata |
Metadata khusus untuk metode BatchKenali. |
OutputFormatConfig
Konfigurasi untuk format hasil yang disimpan ke output
.
Kolom | |
---|---|
native |
Konfigurasi untuk format output native. Jika kolom ini disetel, atau jika tidak ada kolom format output lain yang ditetapkan, transkrip akan ditulis ke sink dalam format native. |
vtt |
Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT. |
srt |
Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT. |
PhraseSet
Set Frasa untuk pembiasan dalam pengenalan ucapan. Set Frasa digunakan untuk memberikan "petunjuk" kepada pengenal ucapan agar dapat memilih kata dan frasa tertentu dalam hasil.
Kolom | |
---|---|
name |
Hanya output. ID. Nama resource frasaSet. Format |
uid |
Hanya output. ID unik yang ditetapkan sistem untuk frasaSet. |
phrases[] |
Daftar kata dan frasa. |
boost |
Peningkatan Petunjuk. Nilai positif akan meningkatkan probabilitas bahwa frasa tertentu akan dikenali di antara frasa lain yang terdengar serupa. Semakin tinggi boostnya, semakin tinggi juga peluang pengenalan positif palsu. Nilai |
display_name |
Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk frasaSet. Harus terdiri dari 63 karakter atau kurang. |
state |
Hanya output. Status siklus proses frasaSet. |
create_time |
Hanya output. Waktu pembuatan. |
update_time |
Hanya output. Waktu terakhir sumber daya ini diubah. |
delete_time |
Hanya output. Waktu saat resource ini diminta untuk dihapus. |
expire_time |
Hanya output. Waktu saat resource ini akan dihapus permanen. |
annotations |
Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi. |
etag |
Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
reconciling |
Hanya output. Apakah FraseSet ini sedang dalam proses diperbarui atau tidak. |
kms_key_name |
Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi FraseSet. Format yang diharapkan adalah |
kms_key_version_name |
Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi FraseSet. Format yang diharapkan adalah |
Frasa
Frasa berisi kata dan frasa "petunjuk" sehingga pengenalan ucapan lebih cenderung mengenalinya. Tindakan ini dapat digunakan untuk meningkatkan akurasi kata dan frasa tertentu, misalnya, jika perintah tertentu biasanya diucapkan oleh pengguna. Ini juga dapat digunakan untuk menambahkan kata-kata tambahan ke kosakata pengenal.
Item daftar juga dapat menyertakan referensi CustomClass yang berisi kelompok kata yang mewakili konsep umum yang terjadi dalam natural language.
Kolom | |
---|---|
value |
Frasa itu sendiri. |
boost |
Peningkatan Petunjuk. Mengganti peningkatan yang ditetapkan di tingkat kumpulan frasa. Nilai positif akan meningkatkan probabilitas bahwa frasa tertentu akan dikenali di antara frasa lain yang terdengar serupa. Semakin tinggi boostnya, semakin tinggi juga peluang pengenalan positif palsu. Nilai peningkatan negatif berkaitan dengan anti-bias. Anti-bias tidak diaktifkan, jadi nilai peningkatan negatif akan menampilkan kesalahan. Nilai peningkatan harus antara 0 dan 20. Setiap nilai di luar rentang tersebut akan menampilkan error. Sebaiknya gunakan pendekatan penelusuran biner untuk menemukan nilai optimal untuk kasus penggunaan Anda serta menambahkan frasa dengan dan tanpa peningkatan permintaan Anda. |
Negara bagian/Provinsi
Serangkaian status yang menentukan siklus proses frasaSet.
Enum | |
---|---|
STATE_UNSPECIFIED |
Status tidak ditentukan. Ini hanya digunakan/berguna untuk membedakan nilai yang tidak ditetapkan. |
ACTIVE |
Status normal dan aktif. |
DELETED |
Set Frasa ini telah dihapus. |
RecognitionConfig
Memberikan informasi kepada Pengenal yang menentukan cara memproses permintaan pengenalan.
Kolom | |
---|---|
model |
Opsional. Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik. Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi dan model yang didukung di setiap wilayah dapat ditemukan di Daftar Model yang Didukung. |
language_codes[] |
Opsional. Bahasa audio yang disediakan sebagai tag bahasa BCP-47. Tag bahasa dinormalkan menjadi BCP-47 sebelum digunakan, misalnya "en-us" menjadi "en-US". Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung. Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi dalam audio. |
features |
Untuk mengaktifkan fitur pengenalan ucapan. |
adaptation |
Konteks adaptasi ucapan yang memberi bobot prediksi pengenal untuk kata dan frasa tertentu. |
transcript_normalization |
Opsional. Gunakan normalisasi transkripsi untuk otomatis mengganti bagian transkrip dengan frasa pilihan Anda. Untuk StreamingKenali, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir. |
Kolom union decoding_config . Parameter decoding untuk audio yang dikirimkan untuk pengenalan. decoding_config hanya ada berupa salah satu diantara berikut: |
|
auto_decoding_config |
Mendeteksi parameter decoding secara otomatis. Lebih disarankan untuk format yang didukung. |
explicit_decoding_config |
Parameter dekode yang ditentukan secara eksplisit. Wajib jika menggunakan audio PCM tanpa header (linear16, mulaw, alaw). |
RecognitionFeatures
Fitur pengenalan yang tersedia.
Kolom | |
---|---|
profanity_filter |
Jika disetel ke |
enable_word_time_offsets |
Jika |
enable_word_confidence |
Jika |
enable_automatic_punctuation |
Jika |
enable_spoken_punctuation |
Perilaku tanda baca yang diucapkan untuk panggilan. Jika |
enable_spoken_emojis |
Perilaku emoji lisan untuk panggilan. Jika |
multi_channel_mode |
Mode untuk mengenali audio multi-channel. |
diarization_config |
Konfigurasi untuk mengaktifkan diarisasi speaker dan menyetel parameter tambahan agar diarisasi menjadi lebih cocok bagi aplikasi Anda. Jika ini diaktifkan, kami akan mengirimkan semua kata dari awal audio untuk alternatif teratas di setiap respons STREAMING berturut-turut. Hal ini dilakukan untuk meningkatkan kualitas tag pembicara seiring model kami belajar mengidentifikasi pembicara dalam percakapan dari waktu ke waktu. Untuk permintaan non-streaming, hasil diarisasi hanya akan diberikan di alternatif teratas dari FINAL SpeechRecognitionResult. |
max_alternatives |
Jumlah maksimum hipotesis pengenalan yang akan ditampilkan. Server mungkin menampilkan kurang dari |
MultiChannelMode
Opsi untuk mengenali audio multi-channel.
Enum | |
---|---|
MULTI_CHANNEL_MODE_UNSPECIFIED |
Nilai default untuk mode multi-saluran. Jika audio berisi beberapa channel, hanya channel pertama yang akan ditranskripsikan; channel lain akan diabaikan. |
SEPARATE_RECOGNITION_PER_CHANNEL |
Jika dipilih, setiap saluran dalam audio yang disediakan ditranskripsikan secara independen. Opsi ini tidak dapat dipilih jika model yang dipilih adalah latest_short . |
RecognitionOutputConfig
Opsi konfigurasi untuk output pengenalan.
Kolom | |
---|---|
output_format_config |
Opsional. Konfigurasi untuk format hasil yang disimpan ke |
Kolom union
|
|
gcs_output_config |
Jika pesan ini diisi, hasil pengenalan akan ditulis ke URI Google Cloud Storage yang disediakan. |
inline_response_config |
Jika pesan ini diisi, hasil pengenalan akan diberikan dalam pesan |
RecognitionResponseMetadata
Metadata tentang permintaan dan respons pengenalan.
Kolom | |
---|---|
total_billed_duration |
Jika tersedia, detik audio yang ditagih untuk permintaan yang sesuai. |
RecognizeRequest
Pesan permintaan untuk metode Recognize
. content
atau uri
harus diberikan. Menyediakan keduanya atau tidak akan menampilkan INVALID_ARGUMENT
. Lihat batas konten.
Kolom | |
---|---|
recognizer |
Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah |
config |
Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom |
config_mask |
Daftar kolom dalam |
Kolom union audio_source . Sumber audio, yang berupa konten inline atau URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut: |
|
content |
Byte data audio yang dienkode seperti yang ditentukan dalam |
uri |
URI yang mengarah ke file yang berisi byte data audio seperti yang ditentukan dalam |
RecognizeResponse
Pesan respons untuk metode Recognize
.
Kolom | |
---|---|
results[] |
Daftar berurutan hasil transkripsi yang sesuai dengan bagian audio secara berurutan. |
metadata |
Metadata tentang pengenalan. |
Pengenal
Pesan Pengenal. Menyimpan metadata dan konfigurasi pengenalan.
Kolom | |
---|---|
name |
Hanya output. ID. Nama resource Pengenal. Format |
uid |
Hanya output. ID unik yang ditetapkan sistem untuk Pengenal. |
display_name |
Nama yang dapat ditetapkan pengguna dan dapat dibaca manusia untuk Pengenal. Harus terdiri dari 63 karakter atau kurang. |
model |
Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom Model yang akan digunakan untuk permintaan pengenalan. Pilih model yang paling sesuai dengan domain Anda untuk mendapatkan hasil terbaik. Panduan untuk memilih model yang akan digunakan dapat ditemukan di Dokumentasi Model Transkripsi dan model yang didukung di setiap wilayah dapat ditemukan di Daftar Model yang Didukung. |
language_codes[] |
Opsional. Kolom ini sekarang tidak digunakan lagi. Pilih kolom Bahasa audio yang disediakan sebagai tag bahasa BCP-47. Bahasa yang didukung untuk setiap model tercantum dalam Tabel Model yang Didukung. Jika bahasa tambahan disediakan, hasil pengenalan akan berisi pengenalan dalam bahasa yang paling mungkin terdeteksi. Hasil pengenalan akan menyertakan tag bahasa dari bahasa yang terdeteksi dalam audio. Saat Anda membuat atau memperbarui Pengenal, nilai ini disimpan dalam bentuk BCP-47 yang dinormalisasi. Misalnya, "en-us" disimpan sebagai "en-US". |
default_recognition_config |
Konfigurasi default yang akan digunakan untuk permintaan dengan Pengenal ini. Fungsi ini dapat ditimpa oleh konfigurasi inline di kolom |
annotations |
Memungkinkan pengguna menyimpan data arbitrer dalam jumlah kecil. Kunci dan nilai masing-masing harus terdiri dari maksimal 63 karakter. Maksimal 100 anotasi. |
state |
Hanya output. Status siklus proses Pengenal. |
create_time |
Hanya output. Waktu pembuatan. |
update_time |
Hanya output. Waktu terakhir Pengenal ini diubah. |
delete_time |
Hanya output. Waktu Pengenal ini diminta untuk dihapus. |
expire_time |
Hanya output. Waktu saat Pengenal ini akan dihapus permanen. |
etag |
Hanya output. Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
reconciling |
Hanya output. Apakah Pengenal ini sedang dalam proses pembaruan atau tidak. |
kms_key_name |
Hanya output. Nama kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah |
kms_key_version_name |
Hanya output. Nama versi kunci KMS yang digunakan untuk mengenkripsi Pengenal. Format yang diharapkan adalah |
Negara bagian/Provinsi
Serangkaian status yang menentukan siklus proses Pengenal.
Enum | |
---|---|
STATE_UNSPECIFIED |
Nilai default. Nilai ini digunakan jika status dihilangkan. |
ACTIVE |
Pengenal aktif dan siap digunakan. |
DELETED |
Pengenal ini telah dihapus. |
SpeakerDiarizationConfig
Konfigurasi untuk mengaktifkan diarisasi speaker.
Kolom | |
---|---|
min_speaker_count |
Wajib. Jumlah minimum pembicara dalam percakapan. Rentang ini membuat Anda lebih fleksibel karena memungkinkan sistem menentukan jumlah speaker yang tepat secara otomatis. Untuk memperbaiki jumlah speaker yang terdeteksi dalam audio, setel |
max_speaker_count |
Wajib. Jumlah maksimum pembicara dalam percakapan. Nilai yang valid adalah: 1-6. Harus >= |
SpeechAdaptation
Memberikan "petunjuk" kepada pengenal ucapan untuk mendukung kata dan frasa tertentu dalam hasil. Frasa Set dapat ditetapkan sebagai resource inline, atau referensi ke resource frasaSet yang ada.
Kolom | |
---|---|
phrase_sets[] |
Daftar Set Frasa inline atau yang direferensikan. |
custom_classes[] |
Daftar CustomClass inline. Resource CustomClass yang ada dapat direferensikan secara langsung di FrasaSet. |
AdaptationPhraseSet
FraseSet yang membias, yang dapat berupa string yang merujuk pada nama resource frasaSets yang ada, atau definisi inline dari frasaSet.
Kolom | |
---|---|
Kolom union
|
|
phrase_set |
Nama resource frasaSet yang ada. Pengguna harus memiliki akses baca ke resource dan tidak boleh dihapus. |
inline_phrase_set |
Set Frasa yang ditentukan inline. |
SpeechRecognitionAlternative
Hipotesis alternatif (alias n-daftar terbaik).
Kolom | |
---|---|
transcript |
Teks transkrip yang mewakili kata-kata yang diucapkan pengguna. |
confidence |
Perkiraan tingkat keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali benar. Kolom ini hanya ditetapkan untuk alternatif teratas dari hasil non-streaming atau, dari hasil streaming dengan |
words[] |
Daftar informasi terkait kata untuk setiap kata yang dikenali. Jika |
SpeechRecognitionResult
Hasil pengenalan ucapan yang sesuai dengan bagian audio.
Kolom | |
---|---|
alternatives[] |
Mungkin berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) adalah yang paling mungkin, berdasarkan peringkat berdasarkan pengenal. |
channel_tag |
Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk |
result_end_offset |
Offset waktu akhir hasil ini relatif terhadap awal audio. |
language_code |
Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan paling besar untuk diucapkan dalam audio. |
SrtOutputFileFormatConfig
Jenis ini tidak memiliki kolom.
File subtitel berformat SubRip Text konfigurasi output.
StreamingRecognitionConfig
Memberikan informasi konfigurasi untuk permintaan StreamingRecognition.
Kolom | |
---|---|
config |
Wajib. Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini dikombinasikan dengan kolom |
config_mask |
Daftar kolom dalam |
streaming_features |
Fitur pengenalan ucapan untuk mengaktifkan permintaan pengenalan audio streaming. |
StreamingRecognitionFeatures
Fitur pengenalan yang tersedia khusus untuk permintaan pengenalan streaming.
Kolom | |
---|---|
enable_voice_activity_events |
Jika |
interim_results |
Apakah akan mengalirkan hasil sementara ke klien atau tidak. Jika disetel ke benar (true), hasil sementara akan di-streaming ke klien. Jika tidak, hanya respons akhir yang akan di-streaming kembali. |
voice_activity_timeout |
Jika disetel, server akan otomatis menutup streaming setelah durasi yang ditentukan telah berlalu, setelah peristiwa ucapan VOICE_ACTIVITY terakhir dikirim. Kolom |
VoiceActivityTimeout
Peristiwa yang waktu tunggunya dapat disetel untuk aktivitas suara.
Kolom | |
---|---|
speech_start_timeout |
Durasi untuk waktu tunggu streaming habis jika tidak ada ucapan yang dimulai. Jika kebijakan ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini pada awal streaming, server akan menutup streaming. |
speech_end_timeout |
Durasi untuk waktu tunggu streaming habis setelah ucapan berakhir. Jika kebijakan ini disetel dan tidak ada ucapan yang terdeteksi dalam durasi ini setelah ucapan terdeteksi, server akan menutup streaming. |
StreamingRecognitionResult
Hasil pengenalan ucapan streaming yang sesuai dengan sebagian audio yang sedang diproses.
Kolom | |
---|---|
alternatives[] |
Mungkin berisi satu atau beberapa hipotesis pengenalan. Alternatif ini diurutkan dalam hal akurasi, dengan alternatif teratas (pertama) adalah yang paling mungkin, berdasarkan peringkat berdasarkan pengenal. |
is_final |
Jika |
stability |
Perkiraan kemungkinan bahwa pengenal tidak akan mengubah tebakannya tentang hasil sementara ini. Nilainya berkisar dari 0.0 (benar-benar tidak stabil) hingga 1.0 (benar-benar stabil). Kolom ini hanya disediakan untuk hasil sementara ( |
result_end_offset |
Offset waktu akhir hasil ini relatif terhadap awal audio. |
channel_tag |
Untuk audio multi-saluran, ini adalah nomor saluran yang sesuai dengan hasil yang dikenali untuk audio dari saluran tersebut. Untuk |
language_code |
Hanya output. Tag bahasa BCP-47 dari bahasa dalam hasil ini. Kode bahasa ini terdeteksi memiliki kemungkinan paling besar untuk diucapkan dalam audio. |
StreamingRecognizeRequest
Pesan permintaan untuk metode StreamingRecognize
. Beberapa pesan StreamingRecognizeRequest
dikirim dalam satu panggilan.
Jika Recognizer
yang direferensikan oleh recognizer
berisi konfigurasi permintaan yang ditentukan sepenuhnya, aliran data hanya dapat berisi pesan dengan hanya audio
yang disetel.
Jika tidak, pesan pertama harus berisi pesan recognizer
dan streaming_config
yang bersama-sama menentukan konfigurasi permintaan sepenuhnya dan tidak boleh berisi audio
. Semua pesan berikutnya hanya boleh memiliki audio
yang disetel.
Kolom | |
---|---|
recognizer |
Wajib. Nama Pengenal yang akan digunakan selama pengenalan. Format yang diharapkan adalah |
Kolom union
|
|
streaming_config |
StreamingRecognitionConfig yang akan digunakan dalam upaya pengenalan ini. Jika disediakan, tindakan ini akan mengganti RecognitionConfig default yang disimpan di Pengenal. |
audio |
Byte audio inline yang akan dikenali. Ukuran maksimum untuk kolom ini adalah 15 KB per permintaan. |
StreamingRecognizeResponse
StreamingRecognizeResponse
adalah satu-satunya pesan yang ditampilkan ke klien oleh StreamingRecognize
. Serangkaian nol atau beberapa pesan StreamingRecognizeResponse
di-streaming kembali ke klien. Jika tidak ada audio yang dapat dikenali, tidak ada pesan yang di-streaming kembali ke klien.
Berikut adalah beberapa contoh StreamingRecognizeResponse
yang mungkin ditampilkan saat memproses audio:
results { alternatives { transcript: "tube" } stability: 0.01 }
results { alternatives { transcript: "to be a" } stability: 0.01 }
results { alternatives { transcript: "to be" } stability: 0.9 } results { alternatives { transcript: " or not to be" } stability: 0.01 }
results { alternatives { transcript: "to be or not to be" confidence: 0.92 } alternatives { transcript: "to bee or not to bee" } is_final: true }
results { alternatives { transcript: " that's" } stability: 0.01 }
results { alternatives { transcript: " that is" } stability: 0.9 } results { alternatives { transcript: " the question" } stability: 0.01 }
results { alternatives { transcript: " that is the question" confidence: 0.98 } alternatives { transcript: " that was the question" } is_final: true }
Catatan:
Hanya dua dari respons #4 dan #7 di atas yang berisi hasil akhir; hal tersebut ditunjukkan oleh
is_final: true
. Menggabungkan keduanya akan menghasilkan transkrip lengkap: "menjadi atau tidak menjadi itu adalah pertanyaan".Kolom lainnya berisi
results
sementara. #3 dan #6 berisi duaresults
sementara: bagian pertama memiliki stabilitas tinggi dan cenderung tidak berubah; bagian kedua memiliki stabilitas rendah dan sangat mungkin untuk berubah. UI designer dapat memilih untuk hanya menampilkanresults
dengan stabilitas tinggi.Nilai
stability
danconfidence
spesifik yang ditampilkan di atas hanya untuk tujuan ilustrasi. Nilai sebenarnya dapat berbeda.Di setiap respons, hanya satu kolom ini yang akan ditetapkan:
error
,speech_event_type
, atau satu atau beberapa (berulang)results
.
Kolom | |
---|---|
results[] |
Daftar berulang ini berisi nol hasil atau lebih yang sesuai dengan bagian audio yang sedang diproses. Laporan ini berisi nol atau satu hasil |
speech_event_type |
Menunjukkan jenis peristiwa ucapan. |
speech_event_offset |
Offset waktu antara awal audio dan kemunculan peristiwa. |
metadata |
Metadata tentang pengenalan. |
SpeechEventType
Menunjukkan jenis peristiwa ucapan.
Enum | |
---|---|
SPEECH_EVENT_TYPE_UNSPECIFIED |
Tidak ada peristiwa ucapan yang ditentukan. |
END_OF_SINGLE_UTTERANCE |
Peristiwa ini menunjukkan bahwa server mendeteksi akhir ucapan pengguna dan tidak mengharapkan ucapan tambahan. Oleh karena itu, server tidak akan memproses audio tambahan dan akan menutup streaming dua arah gRPC. Peristiwa ini hanya dikirim jika ada penghentian paksa karena senyap yang terdeteksi lebih awal. Acara ini hanya tersedia melalui latest_short model . |
SPEECH_ACTIVITY_BEGIN |
Peristiwa ini menunjukkan bahwa server telah mendeteksi awal aktivitas suara manusia dalam streaming. Acara ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali di sepanjang streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true. |
SPEECH_ACTIVITY_END |
Peristiwa ini menunjukkan bahwa server telah mendeteksi akhir aktivitas suara manusia pada streaming. Acara ini dapat ditampilkan beberapa kali jika ucapan dimulai dan berhenti berulang kali di sepanjang streaming. Peristiwa ini hanya dikirim jika voice_activity_events ditetapkan ke true. |
TranscriptNormalization
Konfigurasi normalisasi transkripsi. Gunakan normalisasi transkripsi untuk otomatis mengganti bagian transkrip dengan frasa pilihan Anda. Untuk StreamingKenali, normalisasi ini hanya berlaku untuk transkrip parsial stabil (stabilitas > 0,8) dan transkrip akhir.
Kolom | |
---|---|
entries[] |
Daftar entri pengganti. Kami akan melakukan penggantian dengan satu entri dalam satu waktu. Misalnya, entri kedua dalam ["cat" => "dog", "mountain cat" => "mountain dog"] tidak akan pernah diterapkan karena kami akan selalu memproses entri pertama sebelumnya. Maksimal 100 entri. |
Entri
Konfigurasi penggantian tunggal.
Kolom | |
---|---|
search |
Yang harus diganti. Panjang maksimal adalah 100 karakter. |
replace |
Apa yang akan diganti. Panjang maksimal adalah 100 karakter. |
case_sensitive |
Apakah penelusuran peka huruf besar/kecil. |
UndeleteCustomClassRequest
Pesan permintaan untuk metode UndeleteCustomClass
.
Kolom | |
---|---|
name |
Wajib. Nama CustomClass yang akan dibatalkan penghapusannya. Format: |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang tidak dihapus, tetapi jangan benar-benar membatalkan penghapusannya. |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
UndeletePhraseSetRequest
Pesan permintaan untuk metode UndeletePhraseSet
.
Kolom | |
---|---|
name |
Wajib. Nama FrasaSet yang akan dibatalkan penghapusannya. Format: |
validate_only |
Jika disetel, validasi permintaan dan pratinjau frasaSet yang tidak dihapus, tetapi jangan benar-benar membatalkan penghapusannya. |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
UndeleteRecognizerRequest
Pesan permintaan untuk metode UndeleteRecognizer
.
Kolom | |
---|---|
name |
Wajib. Nama Pengenal yang akan dibatalkan penghapusannya. Format: |
validate_only |
Jika disetel, validasi permintaan dan pratinjau Pengenal yang belum dihapus, tetapi jangan benar-benar membatalkan penghapusannya. |
etag |
Checksum ini dihitung oleh server berdasarkan nilai {i>field<i} lainnya. Permintaan ini dapat dikirim saat memperbarui, membatalkan penghapusan, dan menghapus permintaan untuk memastikan klien memiliki nilai terbaru sebelum melanjutkan. |
UpdateConfigRequest
Pesan permintaan untuk metode UpdateConfig
.
Kolom | |
---|---|
config |
Wajib. Konfigurasi yang akan diperbarui. Kolom |
update_mask |
Daftar kolom yang akan diperbarui. |
UpdateCustomClassRequest
Pesan permintaan untuk metode UpdateCustomClass
.
Kolom | |
---|---|
custom_class |
Wajib. CustomClass yang akan diperbarui. Kolom |
update_mask |
Daftar kolom yang akan diperbarui. Jika kosong, semua kolom dipertimbangkan untuk diperbarui. |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau CustomClass yang diperbarui, tetapi jangan benar-benar memperbaruinya. |
UpdatePhraseSetRequest
Pesan permintaan untuk metode UpdatePhraseSet
.
Kolom | |
---|---|
phrase_set |
Wajib. FrasaSet yang akan diperbarui. Kolom |
update_mask |
Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk update. Gunakan |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau frasaSet yang diperbarui, tetapi jangan benar-benar memperbaruinya. |
UpdateRecognizerRequest
Pesan permintaan untuk metode UpdateRecognizer
.
Kolom | |
---|---|
recognizer |
Wajib. Pengenal yang akan diupdate. Kolom |
update_mask |
Daftar kolom yang akan diperbarui. Jika kosong, semua kolom bernilai non-default akan dipertimbangkan untuk update. Gunakan |
validate_only |
Jika ditetapkan, validasi permintaan dan pratinjau Pengenal yang diperbarui, tetapi jangan benar-benar memperbaruinya. |
VttOutputFileFormatConfig
Jenis ini tidak memiliki kolom.
Konfigurasi output untuk file subtitel berformat WebVTT.
WordInfo
Informasi spesifik per kata untuk kata yang dikenali.
Kolom | |
---|---|
start_offset |
Offset waktu relatif terhadap awal audio, dan sesuai dengan awal kata yang diucapkan. Kolom ini hanya ditetapkan jika |
end_offset |
Offset waktu relatif terhadap awal audio, dan sesuai dengan akhir kata yang diucapkan. Kolom ini hanya ditetapkan jika |
word |
Kata yang sesuai dengan kumpulan informasi ini. |
confidence |
Perkiraan tingkat keyakinan antara 0,0 dan 1,0. Angka yang lebih tinggi menunjukkan estimasi kemungkinan yang lebih besar bahwa kata yang dikenali benar. Kolom ini hanya ditetapkan untuk alternatif teratas dari hasil non-streaming atau, dari hasil streaming dengan |
speaker_label |
Label yang berbeda ditetapkan untuk setiap pembicara dalam audio. Kolom ini menentukan salah satu pembicara yang terdeteksi telah mengucapkan kata ini. |