REST Resource: documents

Recurso: Documento

Representa la entrada a los métodos de la API.

Representación JSON
{
  "type": enum (Type),
  "language": string,
  "referenceWebUri": string,
  "boilerplateHandling": enum (BoilerplateHandling),

  // Union field source can be only one of the following:
  "content": string,
  "gcsContentUri": string
  // End of list of possible types for union field source.
}
Campos
type

enum (Type)

Obligatorio. Si el tipo no está configurado o es TYPE_UNSPECIFIED, se muestra un error INVALID_ARGUMENT.

language

string

Es el idioma del documento (si no se especifica, el idioma se detecta automáticamente). Se aceptan los códigos de idioma ISO y BCP-47.
En Idiomas compatibles, se enumeran los idiomas admitidos actualmente para cada método de la API. Si el método de la API llamado no admite el idioma (especificado por el llamador o detectado automáticamente), se muestra un error INVALID_ARGUMENT.

referenceWebUri

string

Es el URI web del que proviene el documento. Este URI no se usa para recuperar el contenido, sino como una sugerencia para analizar el documento.

boilerplateHandling

enum (BoilerplateHandling)

Indica cómo se debe controlar el texto de referencia detectado(p.ej., anuncios, declaraciones de derechos de autor, banners) para este documento. Si no se especifica, el texto de referencia se tratará de la misma manera que el contenido.

Campo de unión source. Es la fuente del documento: una cadena que contiene el contenido o un URI de Google Cloud Storage. source puede ser solo uno de los siguientes:
content

string

Es el contenido de la entrada en formato de cadena. Los registros de auditoría de Cloud están exentos, ya que se basan en datos del usuario.

gcsContentUri

string

Es el URI de Google Cloud Storage donde se encuentra el contenido del archivo. Este URI debe tener el formato gs://bucketName/object_name. Para obtener más detalles, consulta https://cloud.google.com/storage/docs/reference-uris. NOTA: No se admite el control de versiones de objetos de Cloud Storage.

Tipo

La enumeración de tipos de documentos.

Enums
TYPE_UNSPECIFIED No se especificó el tipo de contenido.
PLAIN_TEXT Texto sin formato
HTML HTML

BoilerplateHandling

Formas de manejar el texto de referencia detectado en el documento

Enums
BOILERPLATE_HANDLING_UNSPECIFIED No se especifica el manejo de texto de referencia.
SKIP_BOILERPLATE No analices el texto estándar detectado. Se requiere el URI web de referencia para detectar el texto de referencia.
KEEP_BOILERPLATE Trata el texto estándar de la misma manera que el contenido.

Métodos

analyzeEntities

Encuentra entidades nombradas (actualmente, nombres propios y sustantivos comunes) en el texto, junto con los tipos de entidades, la relevancia, las menciones de cada entidad y otras propiedades.

analyzeEntitySentiment

Busca entidades similares a AnalyzeEntities en el texto y analiza el sentimiento asociado con cada entidad y sus menciones.

analyzeSentiment

Analiza el sentimiento del texto proporcionado.

analyzeSyntax

Analiza la sintaxis del texto y proporciona límites de oraciones y tokenización, junto con etiquetas de categorías gramaticales, árboles de dependencia y otras propiedades.

annotateText

Es un método conveniente que proporciona todas las funciones de análisis sintáctico, opiniones, entidades y clasificación en una sola llamada.

classifyText

Clasifica un documento en categorías.

moderateText

Modera un documento en busca de categorías dañinas y sensibles.