REST Resource: documents

리소스: Document

API 메서드의 입력을 나타냅니다.

JSON 표현
{
  "type": enum (Type),
  "language": string,
  "referenceWebUri": string,
  "boilerplateHandling": enum (BoilerplateHandling),

  // Union field source can be only one of the following:
  "content": string,
  "gcsContentUri": string
  // End of list of possible types for union field source.
}
필드
type

enum (Type)

필수 입력란입니다. 유형이 설정되지 않았거나 TYPE_UNSPECIFIED인 경우 INVALID_ARGUMENT 오류를 반환합니다.

language

string

문서의 언어입니다. 지정하지 않으면 언어가 자동으로 감지됩니다. ISO 및 BCP-47 언어 코드 모두 허용됩니다.
Language Support에는 현재 각 API 메서드에 지원되는 언어가 나열됩니다. 호출자가 지정했거나 자동으로 감지된 언어가 호출된 API 메서드에서 지원되지 않으면 INVALID_ARGUMENT 오류가 반환됩니다.

referenceWebUri

string

문서의 출처인 웹 URI입니다. 이 URI는 콘텐츠를 가져오는 데 사용되지 않고 문서를 분석하기 위한 힌트로 사용됩니다.

boilerplateHandling

enum (BoilerplateHandling)

이 문서에서 감지된 상용구(예: 광고, 저작권 선언, 배너)를 처리하는 방법을 나타냅니다. 지정하지 않으면 템플릿이 콘텐츠와 동일하게 취급됩니다.

통합 필드 source. 문서의 소스: 콘텐츠 또는 Google Cloud Storage URI가 포함된 문자열입니다. source은 다음 중 하나여야 합니다.
content

string

문자열 형식의 입력 콘텐츠입니다. Cloud 감사 로깅은 사용자 데이터를 기반으로 하므로 예외입니다.

gcsContentUri

string

파일 콘텐츠가 위치한 Google Cloud Storage URI입니다. 이 URI는 gs://bucketName/object_name 형식이어야 합니다. 자세한 내용은 https://cloud.google.com/storage/docs/reference-uris를 참고하세요. 참고: Cloud Storage 객체 버전 관리는 지원되지 않습니다.

유형

문서 유형 enum입니다.

열거형
TYPE_UNSPECIFIED 콘텐츠 유형이 지정되지 않았습니다.
PLAIN_TEXT 일반 텍스트
HTML HTML

BoilerplateHandling

문서에서 감지된 상용구를 처리하는 방법

열거형
BOILERPLATE_HANDLING_UNSPECIFIED 템플릿 처리가 지정되지 않았습니다.
SKIP_BOILERPLATE 감지된 상용구는 분석하지 않습니다. 템플릿을 감지하려면 참조 웹 URI가 필요합니다.
KEEP_BOILERPLATE 상용구를 콘텐츠와 동일하게 취급합니다.

메서드

analyzeEntities

텍스트에서 명칭이 지정된 항목 (현재는 고유한 이름 및 일반 명사)과 함께 항목 유형, 가시도, 각 항목의 멘션, 기타 속성을 찾습니다.

analyzeEntitySentiment

텍스트에서 AnalyzeEntities와 유사한 항목을 찾고 각 항목 및 언급과 관련된 감정을 분석합니다.

analyzeSentiment

제공된 텍스트의 감정을 분석합니다.

analyzeSyntax

텍스트의 문법을 분석하고 품사 태그, 종속 항목 트리, 기타 속성과 함께 문장 경계 및 토큰화를 제공합니다.

annotateText

한 번의 호출로 모든 구문, 감정, 항목, 분류 기능을 제공하는 편의 메서드입니다.

classifyText

문서를 카테고리로 분류합니다.

moderateText

유해하고 민감한 카테고리의 문서를 검토합니다.