REST Resource: documents

Resource: Dokumen

Merepresentasikan input ke metode API.

Representasi JSON
{
  "type": enum (Type),
  "language": string,
  "referenceWebUri": string,
  "boilerplateHandling": enum (BoilerplateHandling),

  // Union field source can be only one of the following:
  "content": string,
  "gcsContentUri": string
  // End of list of possible types for union field source.
}
Kolom
type

enum (Type)

Wajib. Jika jenis tidak ditetapkan atau TYPE_UNSPECIFIED, error INVALID_ARGUMENT akan ditampilkan.

language

string

Bahasa dokumen (jika tidak ditentukan, bahasa akan otomatis terdeteksi). Kode bahasa ISO dan BCP-47 diterima.
Dukungan Bahasa mencantumkan bahasa yang saat ini didukung untuk setiap metode API. Jika bahasa (baik yang ditentukan oleh pemanggil maupun yang dideteksi secara otomatis) tidak didukung oleh metode API yang dipanggil, error INVALID_ARGUMENT akan ditampilkan.

referenceWebUri

string

URI web tempat dokumen berasal. URI ini tidak digunakan untuk mengambil konten, tetapi sebagai petunjuk untuk menganalisis dokumen.

boilerplateHandling

enum (BoilerplateHandling)

Menunjukkan cara boilerplate yang terdeteksi(misalnya, iklan, pernyataan hak cipta, banner) harus ditangani untuk dokumen ini. Jika tidak ditentukan, boilerplate akan diperlakukan sama seperti konten.

Kolom union source. Sumber dokumen: string yang berisi konten atau URI Google Cloud Storage. source hanya ada berupa salah satu diantara berikut:
content

string

Konten input dalam format string. Cloud Audit Logs dikecualikan karena didasarkan pada data pengguna.

gcsContentUri

string

URI Google Cloud Storage tempat konten file berada. URI ini harus dalam bentuk: gs://bucketName/object_name. Untuk mengetahui detail selengkapnya, lihat https://cloud.google.com/storage/docs/reference-uris. CATATAN: Pembuatan versi objek Cloud Storage tidak didukung.

Jenis

Enum jenis dokumen.

Enum
TYPE_UNSPECIFIED Jenis konten tidak ditentukan.
PLAIN_TEXT Teks biasa
HTML HTML

BoilerplateHandling

Cara menangani boilerplate yang terdeteksi dalam dokumen

Enum
BOILERPLATE_HANDLING_UNSPECIFIED Penanganan boilerplate tidak ditentukan.
SKIP_BOILERPLATE Jangan menganalisis boilerplate yang terdeteksi. URI web referensi diperlukan untuk mendeteksi boilerplate.
KEEP_BOILERPLATE Perlakukan boilerplate sama seperti konten.

Metode

analyzeEntities

Menemukan entity bernama (saat ini nama diri dan kata benda umum) dalam teks beserta jenis entity, keterlihatan, sebutan untuk setiap entity, dan properti lainnya.

analyzeEntitySentiment

Menemukan entity, mirip dengan AnalyzeEntities dalam teks dan menganalisis sentimen yang terkait dengan setiap entity dan penyebutannya.

analyzeSentiment

Menganalisis sentimen teks yang diberikan.

analyzeSyntax

Menganalisis sintaksis teks dan memberikan batas kalimat serta tokenisasi beserta tag jenis kata, hierarki dependensi, dan properti lainnya.

annotateText

Metode praktis yang menyediakan semua fitur sintaksis, sentimen, entity, dan klasifikasi dalam satu panggilan.

classifyText

Mengklasifikasikan dokumen ke dalam kategori.

moderateText

Memoderasi dokumen untuk kategori berbahaya dan sensitif.