Method: projects.locations.recognizers.batchRecognize

Melakukan pengenalan ucapan asinkron batch: mengirim permintaan dengan file N audio dan menerima operasi yang berjalan lama yang dapat di-polling untuk mengetahui kapan transkripsi selesai.

Permintaan HTTP

POST https://{endpoint}/v2/{recognizer=projects/*/locations/*/recognizers/*}:batchRecognize

Dengan {endpoint} adalah salah satu endpoint layanan yang didukung.

URL menggunakan sintaksis gRPC Transcoding.

Parameter lokasi

Parameter
recognizer

string

Wajib. Nama Pengenal yang digunakan selama pengenalan. Format yang diharapkan adalah projects/{project}/locations/{location}/recognizers/{recognizer}. Segmen {recognizer} dapat disetel ke _ untuk menggunakan Pengenal implisit kosong.

Isi permintaan

Isi permintaan memuat data dengan struktur berikut:

Representasi JSON
{
  "config": {
    object (RecognitionConfig)
  },
  "configMask": string,
  "files": [
    {
      object (BatchRecognizeFileMetadata)
    }
  ],
  "recognitionOutputConfig": {
    object (RecognitionOutputConfig)
  },
  "processingStrategy": enum (ProcessingStrategy)
}
Kolom
config

object (RecognitionConfig)

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom configMask dapat digunakan untuk mengganti bagian defaultRecognitionConfig resource Pengenal.

configMask

string (FieldMask format)

Daftar kolom di config yang menggantikan nilai dalam defaultRecognitionConfig pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom yang ditentukan di config akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

Ini adalah daftar yang dipisahkan koma yang berisi nama kolom yang sepenuhnya memenuhi syarat. Contoh: "user.displayName,photo".

files[]

object (BatchRecognizeFileMetadata)

File audio dengan metadata file untuk ASR. Jumlah file maksimum yang diizinkan untuk ditentukan adalah 5.

recognitionOutputConfig

object (RecognitionOutputConfig)

Opsi konfigurasi untuk tempat menampilkan transkrip setiap file.

processingStrategy

enum (ProcessingStrategy)

Strategi pemrosesan yang akan digunakan untuk permintaan ini.

Isi respons

Jika berhasil, isi respons akan berisi instance Operation.

Cakupan otorisasi

Memerlukan cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform

Untuk informasi selengkapnya, lihat Ringkasan Autentikasi.

Izin IAM

Memerlukan izin IAM berikut pada resource recognizer:

  • speech.recognizers.recognize

Untuk informasi lebih lanjut, lihat dokumentasi IAM.

BatchRecognizeFileMetadata

Metadata tentang satu file dalam batch untukRecognizers.batchRecognize.

Representasi JSON
{
  "config": {
    object (RecognitionConfig)
  },
  "configMask": string,

  // Union field audio_source can be only one of the following:
  "uri": string
  // End of list of possible types for union field audio_source.
}
Kolom
config

object (RecognitionConfig)

Fitur dan metadata audio yang akan digunakan untuk Pengenalan Ucapan Otomatis. Kolom ini yang dikombinasikan dengan kolom configMask dapat digunakan untuk mengganti bagian defaultRecognitionConfig resource Pengenal serta config di tingkat permintaan.

configMask

string (FieldMask format)

Daftar kolom di config yang menggantikan nilai dalam defaultRecognitionConfig pengenal selama permintaan pengenalan ini. Jika tidak ada mask yang diberikan, semua kolom bernilai non-default di config akan mengganti nilai dalam pengenal untuk permintaan pengenalan ini. Jika mask disediakan, hanya kolom yang tercantum dalam mask yang akan mengganti konfigurasi dalam pengenal untuk permintaan pengenalan ini. Jika karakter pengganti (*) diberikan, config akan sepenuhnya mengganti dan menggantikan konfigurasi di pengenal untuk permintaan pengenalan ini.

Ini adalah daftar yang dipisahkan koma yang berisi nama kolom yang sepenuhnya memenuhi syarat. Contoh: "user.displayName,photo".

Kolom union audio_source. Sumber audio, yang merupakan URI Google Cloud Storage. audio_source hanya ada berupa salah satu diantara berikut:
uri

string

Cloud Storage URI untuk file audio.

RecognitionOutputConfig

Opsi konfigurasi untuk output pengenalan.

Representasi JSON
{
  "outputFormatConfig": {
    object (OutputFormatConfig)
  },

  // Union field output can be only one of the following:
  "gcsOutputConfig": {
    object (GcsOutputConfig)
  },
  "inlineResponseConfig": {
    object (InlineOutputConfig)
  }
  // End of list of possible types for union field output.
}
Kolom
outputFormatConfig

object (OutputFormatConfig)

Opsional. Konfigurasi untuk format hasil yang disimpan ke output. Jika transkrip yang tidak ditentukan hanya akan ditulis dalam format NATIVE.

Kolom union output.

output hanya dapat berupa salah satu dari yang berikut:

gcsOutputConfig

object (GcsOutputConfig)

Jika pesan ini diisi, hasil pengenalan akan ditulis ke URI Google Cloud Storage yang disediakan.

inlineResponseConfig

object (InlineOutputConfig)

Jika pesan ini terisi, hasil pengenalan akan diberikan dalam pesan Operasi BatchRecognizeResponse saat selesai. Hal ini hanya didukung saat memanggil recognizers.batchRecognize dengan satu file audio saja.

GcsOutputConfig

Konfigurasi output untuk Cloud Storage.

Representasi JSON
{
  "uri": string
}
Kolom
uri

string

Awalan URI Cloud Storage yang akan digunakan untuk menulis hasil pengenalan.

InlineOutputConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk respons inline.

OutputFormatConfig

Konfigurasi untuk format hasil yang disimpan ke output.

Representasi JSON
{
  "native": {
    object (NativeOutputFileFormatConfig)
  },
  "vtt": {
    object (VttOutputFileFormatConfig)
  },
  "srt": {
    object (SrtOutputFileFormatConfig)
  }
}
Kolom
native

object (NativeOutputFileFormatConfig)

Konfigurasi untuk format output native. Jika kolom ini disetel atau jika tidak ada kolom format output lain yang disetel, transkrip akan ditulis ke sink dalam format native.

vtt

object (VttOutputFileFormatConfig)

Konfigurasi untuk format output VTT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format VTT.

srt

object (SrtOutputFileFormatConfig)

Konfigurasi untuk format output SRT. Jika kolom ini disetel, transkrip akan ditulis ke sink dalam format SRT.

NativeOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk proto BatchRecognizeResults serial.

VttOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

Konfigurasi output untuk file subtitel berformat WebVTT.

SrtOutputFileFormatConfig

Jenis ini tidak memiliki kolom.

File subtitel berformat SubRip Text konfigurasi output.

ProcessingStrategy

Strategi pemrosesan yang mungkin digunakan untuk permintaan batch.

Enum
PROCESSING_STRATEGY_UNSPECIFIED Nilai default untuk strategi pemrosesan. Permintaan akan diproses segera setelah diterima.
DYNAMIC_BATCHING Jika dipilih, proses permintaan selama periode penggunaan yang lebih rendah untuk mendapatkan diskon harga. Permintaan akan dipenuhi dalam waktu 24 jam.