Halaman ini diterjemahkan oleh Cloud Translation API.

Method: projects.locations.recognizers.batchRecognize

Melakukan pengenalan ucapan asinkron batch: mengirim permintaan dengan file N audio dan menerima operasi yang berjalan lama yang dapat di-polling untuk mengetahui kapan transkripsi selesai.

Permintaan HTTP

POST https://{endpoint}/v2/{recognizer=projects/*/locations/*/recognizers/*}:batchRecognize

Dengan {endpoint} adalah salah satu endpoint layanan yang didukung.

URL menggunakan sintaksis gRPC Transcoding.

Parameter lokasi

Parameter

Parameter
`recognizer`	`string` Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah `projects/{project}/locations/{location}/recognizers/{recognizer}`. Segmen {recognizer} dapat disetel ke `_` untuk menggunakan Pengenal implisit kosong.

recognizer

string

Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit kosong.

Isi permintaan

Isi permintaan memuat data dengan struktur berikut:

Representasi JSON

Representasi JSON
{ "config": { object (`RecognitionConfig`) }, "configMask": string, "files": [ { object (`BatchRecognizeFileMetadata`) } ], "recognitionOutputConfig": { object (`RecognitionOutputConfig`) }, "processingStrategy": enum (`ProcessingStrategy`) }

{
  "config": {
    object (RecognitionConfig)
  },
  "configMask": string,
  "files": [
    {
      object (BatchRecognizeFileMetadata)
    }
  ],
  "recognitionOutputConfig": {
    object (RecognitionOutputConfig)
  },
  "processingStrategy": enum (ProcessingStrategy)
}

Kolom
`config`	`object (RecognitionConfig)` Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom `configMask` dapat digunakan untuk mengganti bagian `defaultRecognitionConfig` resource Pengenal.
`configMask`	`string (FieldMask format)` Daftar kolom di `config` yang menggantikan nilai dalam `defaultRecognitionConfig` pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom yang ditentukan di `config` akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (`*`) diberikan, `config` akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini. Ini adalah daftar yang dipisahkan koma yang berisi nama kolom yang sepenuhnya memenuhi syarat. Contoh: `"user.displayName,photo"`.
`files[]`	`object (BatchRecognizeFileMetadata)` File audio dengan metadata file untuk ASR. Jumlah file maksimum yang diizinkan untuk ditentukan adalah 5.
`recognitionOutputConfig`	`object (RecognitionOutputConfig)` Opsi konfigurasi untuk tempat menampilkan transkrip setiap file.
`processingStrategy`	`enum (ProcessingStrategy)` Strategi pemrosesan yang akan digunakan untuk permintaan ini.

Isi respons

Jika berhasil, isi respons akan berisi instance Operation.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

speech.recognizers.recognize

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

BatchRecognizeFileMetadata

Metadata tentang satu file dalam batch untukRecognizers.batchRecognize.

Representasi JSON

Representasi JSON
{ "config": { object (`RecognitionConfig`) }, "configMask": string, // Union field `audio_source` can be only one of the following: "uri": string // End of list of possible types for union field `audio_source`. }

{
  "config": {
    object (RecognitionConfig)
  },
  "configMask": string,

  // Union field audio_source can be only one of the following:
  "uri": string
  // End of list of possible types for union field audio_source.
}

Kolom
`config`	`object (RecognitionConfig)` Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom `configMask` dapat digunakan untuk mengganti bagian `defaultRecognitionConfig` resource Pengenal serta `config` di tingkat permintaan.
`configMask`	`string (FieldMask format)` Daftar kolom di `config` yang menggantikan nilai dalam `defaultRecognitionConfig` pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di `config` akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (`*`) diberikan, `config` akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini. Ini adalah daftar yang dipisahkan koma yang berisi nama kolom yang sepenuhnya memenuhi syarat. Contoh: `"user.displayName,photo"`.
Kolom union `audio_source`. Sumber audio, yang merupakan URI Google Cloud Storage. `audio_source` hanya ada berupa salah satu diantara berikut:
`uri`	`string` Cloud Storage URI untuk file audio.

RecognitionOutputConfig

Opsi konfigurasi untuk output pengenalan.

Representasi JSON

Representasi JSON
{ "outputFormatConfig": { object (`OutputFormatConfig`) }, // Union field `output` can be only one of the following: "gcsOutputConfig": { object (`GcsOutputConfig`) }, "inlineResponseConfig": { object (`InlineOutputConfig`) } // End of list of possible types for union field `output`. }

{
  "outputFormatConfig": {
    object (OutputFormatConfig)
  },

  // Union field output can be only one of the following:
  "gcsOutputConfig": {
    object (GcsOutputConfig)
  },
  "inlineResponseConfig": {
    object (InlineOutputConfig)
  }
  // End of list of possible types for union field output.
}

Kolom
`outputFormatConfig`	`object (OutputFormatConfig)` Opsional. Konfigurasi untuk format hasil yang disimpan ke `output`. Jika transkrip yang tidak ditentukan hanya akan ditulis dalam format `NATIVE`.
Kolom union `output`. `output` hanya dapat berupa salah satu dari yang berikut:
`gcsOutputConfig`	`object (GcsOutputConfig)` Jika pesan ini diisi, hasil pengenalan akan ditulis ke URI Google Cloud Storage yang disediakan.
`inlineResponseConfig`	`object (InlineOutputConfig)` Jika pesan ini terisi, hasil pengenalan akan diberikan dalam pesan Operasi `BatchRecognizeResponse` saat selesai. Hal ini hanya didukung saat memanggil `recognizers.batchRecognize` dengan satu file audio saja.

GcsOutputConfig

Konfigurasi output untuk Cloud Storage.

Representasi JSON
{ "uri": string }

Kolom

Kolom
`uri`	`string` Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan.

uri

string

Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan.

InlineOutputConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk respons inline.

OutputFormatConfig

Konfigurasi untuk format hasil yang disimpan ke output.

Representasi JSON
{ "native": { object (`NativeOutputFileFormatConfig`) }, "vtt": { object (`VttOutputFileFormatConfig`) }, "srt": { object (`SrtOutputFileFormatConfig`) } }

Kolom

Kolom
`native`	`object (NativeOutputFileFormatConfig)` Konfigurasi untuk format output native. Jika kolom ini disetel atau jika tidak ada kolom format output lain yang disetel, transkrip akan ditulis ke sink dalam format native.
`vtt`	`object (VttOutputFileFormatConfig)` Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT.
`srt`	`object (SrtOutputFileFormatConfig)` Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT.

native

object (NativeOutputFileFormatConfig)

Konfigurasi untuk format output native. Jika kolom ini disetel atau jika tidak ada kolom format output lain yang disetel, transkrip akan ditulis ke sink dalam format native.

vtt

object (VttOutputFileFormatConfig)

Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT.

srt

object (SrtOutputFileFormatConfig)

Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT.

NativeOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk proto BatchRecognizeResults serial.

VttOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk file subtitel berformat WebVTT.

SrtOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

File subtitel berformat SubRip Text konfigurasi output.

ProcessingStrategy

Strategi pemrosesan yang mungkin digunakan untuk permintaan batch.

Enum
`PROCESSING_STRATEGY_UNSPECIFIED`	Nilai default untuk strategi pemrosesan. Permintaan akan diproses segera setelah diterima.
`DYNAMIC_BATCHING`	Jika dipilih, proses permintaan selama periode penggunaan yang lebih rendah untuk mendapatkan diskon harga. Permintaan akan dipenuhi dalam waktu 24 jam.