문서 처리 함수 선택

이 문서에서는 BigQuery ML에서 사용할 수 있는 문서 처리 함수(ML.GENERATE_TEXTML.PROCESS_DOCUMENT)를 비교합니다.

이 문서의 정보를 사용하여 함수에 겹치는 기능이 있는 경우에 사용할 함수를 결정할 수 있습니다.

간략한 이러한 함수의 차이점은 다음과 같습니다.

  • ML.GENERATE_TEXT는 일부 콘텐츠가 문서에 있는 자연어 처리 (NLP) 태스크를 실행하는 데 적합합니다. 이 함수에는 다음과 같은 이점이 있습니다.

    • 비용 절감
    • 더 많은 언어 지원
    • 더 빠른 처리량
    • 모델 조정 기능
    • 멀티모달 모델의 사용 가능 여부

    이 접근 방식에 가장 적합한 문서 처리 작업의 예는 Gemini API로 문서 처리 기능 살펴보기를 참고하세요.

  • ML.PROCESS_DOCUMENT는 문서 파싱 및 사전 정의된 구조화된 응답이 필요한 문서 처리 작업을 실행하는 데 적합합니다.

지원되는 모델

지원되는 모델은 다음과 같습니다.

  • ML.GENERATE_TEXT: Vertex AI Gemini 모델의 하위 집합을 사용하여 텍스트를 생성할 수 있습니다. 지원되는 모델에 대한 자세한 내용은 ML.GENERATE_TEXT 구문을 참고하세요.
  • ML.PROCESS_DOCUMENT: Document AI API 기본 모델을 사용합니다. Document AI API를 사용하면 인보이스 파서, 레이아웃 파서, 양식 파서와 같은 다양한 문서 프로세서에 액세스할 수 있습니다. 이러한 문서 프로세서를 사용하여 다양한 구조의 PDF 파일을 처리할 수 있습니다.

지원되는 태스크

지원되는 태스크는 다음과 같습니다.

  • ML.GENERATE_TEXT: 입력이 문서인 모든 NLP 태스크를 실행할 수 있습니다. 예를 들어 회사의 재무 문서가 있는 경우 What is the quarterly revenue for each division?와 같은 프롬프트를 제공하여 문서 정보를 검색할 수 있습니다.
  • ML.PROCESS_DOCUMENT: 인보이스, 세금 양식, 재무 명세서와 같은 다양한 문서 유형에 대해 특수화된 문서 처리를 실행할 수 있습니다. 문서 청크 처리를 실행할 수도 있습니다. 이 작업에 ML.PROCESS_DOCUMENT 함수를 사용하는 방법에 관한 자세한 내용은 검색 강화 생성 파이프라인에서 PDF 파싱을 참고하세요.

가격 책정

가격은 다음과 같습니다.

감독하에 조정

지도 조정 지원은 다음과 같습니다.

  • ML.GENERATE_TEXT: 일부 모델에서 지도 조정이 지원됩니다.
  • ML.PROCESS_DOCUMENT: 지도 조정이 지원되지 않습니다.

분당 쿼리 수(QPM) 한도

QPM 한도는 다음과 같습니다.

  • ML.GENERATE_TEXT: gemini-1.5-pro 모델의 경우 기본 us-central1 리전에서 QPM 60개, gemini-1.5-flash 모델의 경우 기본 us-central1 리전에서 QPM 200개 자세한 내용은 Vertex AI의 생성형 AI 할당량을 참고하세요.
  • ML.PROCESS_DOCUMENT: 프로세서 유형당 120QPM이며 프로젝트당 전체 한도는 600QPM입니다. 자세한 내용은 할당량 목록을 참고하세요.

할당량을 늘리려면 할당량 상향 요청을 참고하세요.

토큰 한도

토큰 한도는 다음과 같습니다.

  • ML.GENERATE_TEXT: 입력 토큰 700개, 출력 토큰 8,196개
  • ML.PROCESS_DOCUMENT: 토큰 한도가 없습니다. 하지만 이 함수에는 사용하는 프로세서에 따라 페이지 한도가 다릅니다. 자세한 내용은 한도를 참고하세요.

지원 언어

지원되는 언어는 다음과 같습니다.

  • ML.GENERATE_TEXT: Gemini와 동일한 언어를 지원합니다.
  • ML.PROCESS_DOCUMENT: 언어 지원은 문서 프로세서 유형에 따라 다릅니다. 대부분은 영어만 지원합니다. 자세한 내용은 프로세서 목록을 참고하세요.

사용 가능한 리전

사용 가능한 리전은 다음과 같습니다.

  • ML.GENERATE_TEXT: 모든 Vertex AI용 생성형 AI 리전에서 사용할 수 있습니다.
  • ML.PROCESS_DOCUMENT: 모든 프로세서의 EUUS 멀티 리전에서 사용할 수 있습니다. 일부 프로세서는 특정 지역에만 제공됩니다. 자세한 내용은 지역 및 다지역 지원을 참고하세요.