REST Resource: documents

Risorsa: documento

Rappresenta l'input per i metodi dell'API.

Rappresentazione JSON
{
  "type": enum (Type),
  "language": string,
  "referenceWebUri": string,
  "boilerplateHandling": enum (BoilerplateHandling),

  // Union field source can be only one of the following:
  "content": string,
  "gcsContentUri": string
  // End of list of possible types for union field source.
}
Campi
type

enum (Type)

Obbligatorio. Se il tipo non è impostato o è TYPE_UNSPECIFIED, viene restituito un errore INVALID_ARGUMENT.

language

string

La lingua del documento (se non specificata, la lingua viene rilevata automaticamente). Sono accettati sia i codici lingua ISO che BCP-47.
Supporto delle lingue elenca le lingue attualmente supportate per ogni metodo dell'API. Se la lingua (specificata dall'utente che chiama o rilevata automaticamente) non è supportata dal metodo dell'API chiamato, viene restituito un errore INVALID_ARGUMENT.

referenceWebUri

string

L'URI web da cui proviene il documento. Questo URI non viene utilizzato per recuperare i contenuti, ma come suggerimento per analizzare il documento.

boilerplateHandling

enum (BoilerplateHandling)

Indica in che modo deve essere gestito il testo standard rilevato(ad es. annunci, dichiarazioni di copyright, banner) per questo documento. Se non specificato, il testo standard verrà trattato come i contenuti.

Campo unione source. L'origine del documento: una stringa contenente i contenuti o un URI di Google Cloud Storage. source può essere solo uno dei seguenti:
content

string

I contenuti dell'input in formato di stringa. L'audit logging di Cloud è esente in quanto si basa sui dati utente.

gcsContentUri

string

L'URI Google Cloud Storage in cui si trovano i contenuti del file. Questo URI deve avere il seguente formato: gs://bucketName/object_name. Per ulteriori dettagli, visita la pagina https://cloud.google.com/storage/docs/reference-uris. NOTA: il controllo delle versioni degli oggetti Cloud Storage non è supportato.

Tipo

L'enum dei tipi di documento.

Enum
TYPE_UNSPECIFIED Il tipo di contenuti non è specificato.
PLAIN_TEXT Testo normale
HTML HTML

BoilerplateHandling

Modi per gestire il testo standard rilevato nel documento

Enum
BOILERPLATE_HANDLING_UNSPECIFIED La gestione del boilerplate non è specificata.
SKIP_BOILERPLATE Non analizzare il boilerplate rilevato. L'URI web di riferimento è obbligatorio per rilevare il boilerplate.
KEEP_BOILERPLATE Tratta il testo boilerplate come i contenuti.

Metodi

analyzeEntities

Individua le entità denominate (attualmente nomi propri e nomi comuni) nel testo, oltre ai tipi di entità, alla salienza, alle menzioni per ogni entità e ad altre proprietà.

analyzeEntitySentiment

Trova entità simili a AnalyzeEntities nel testo e analizza il sentiment associato a ogni entità e alle sue menzioni.

analyzeSentiment

Analizza il sentiment del testo fornito.

analyzeSyntax

Analizza la sintassi del testo e fornisce i confini delle frasi e la tokenizzazione, oltre a tag delle parti del discorso, alberi di dipendenza e altre proprietà.

annotateText

Un metodo pratico che fornisce tutte le funzionalità di sintassi, sentiment, entità e classificazione in un'unica chiamata.

classifyText

Classifica un documento in categorie.

moderateText

Modera un documento per categorie dannose e sensibili.