문서 처리 함수 선택
이 문서에서는 BigQuery ML에서 사용할 수 있는 문서 처리 함수(ML.GENERATE_TEXT
및 ML.PROCESS_DOCUMENT
)를 비교합니다.
이 문서의 정보를 사용하여 함수에 겹치는 기능이 있는 경우에 사용할 함수를 결정할 수 있습니다.
간략한 이러한 함수의 차이점은 다음과 같습니다.
ML.GENERATE_TEXT
는 일부 콘텐츠가 문서에 있는 자연어 처리 (NLP) 태스크를 실행하는 데 적합합니다. 이 함수에는 다음과 같은 이점이 있습니다.- 비용 절감
- 더 많은 언어 지원
- 더 빠른 처리량
- 모델 조정 기능
- 멀티모달 모델의 사용 가능 여부
이 접근 방식에 가장 적합한 문서 처리 작업의 예는 Gemini API로 문서 처리 기능 살펴보기를 참고하세요.
ML.PROCESS_DOCUMENT
는 문서 파싱 및 사전 정의된 구조화된 응답이 필요한 문서 처리 작업을 실행하는 데 적합합니다.
지원되는 모델
지원되는 모델은 다음과 같습니다.
ML.GENERATE_TEXT
: Vertex AI Gemini 모델의 하위 집합을 사용하여 텍스트를 생성할 수 있습니다. 지원되는 모델에 대한 자세한 내용은ML.GENERATE_TEXT
구문을 참고하세요.ML.PROCESS_DOCUMENT
: Document AI API 기본 모델을 사용합니다. Document AI API를 사용하면 인보이스 파서, 레이아웃 파서, 양식 파서와 같은 다양한 문서 프로세서에 액세스할 수 있습니다. 이러한 문서 프로세서를 사용하여 다양한 구조의 PDF 파일을 처리할 수 있습니다.
지원되는 태스크
지원되는 태스크는 다음과 같습니다.
ML.GENERATE_TEXT
: 입력이 문서인 모든 NLP 태스크를 실행할 수 있습니다. 예를 들어 회사의 재무 문서가 있는 경우What is the quarterly revenue for each division?
와 같은 프롬프트를 제공하여 문서 정보를 검색할 수 있습니다.ML.PROCESS_DOCUMENT
: 인보이스, 세금 양식, 재무 명세서와 같은 다양한 문서 유형에 대해 특수화된 문서 처리를 실행할 수 있습니다. 문서 청크 처리를 실행할 수도 있습니다. 이 작업에ML.PROCESS_DOCUMENT
함수를 사용하는 방법에 관한 자세한 내용은 검색 강화 생성 파이프라인에서 PDF 파싱을 참고하세요.
가격 책정
가격은 다음과 같습니다.
ML.GENERATE_TEXT
: 이 함수와 함께 사용하는 Vertex AI 모델의 가격은 Vertex AI 가격 책정을 참고하세요. 지원되는 모델의 지도 조정은 노드 시간당 달러로 청구됩니다. 자세한 내용은 Vertex AI 커스텀 학습 가격 책정을 참고하세요.ML.PROCESS_DOCUMENT
: 이 함수와 함께 사용하는 Cloud AI 서비스의 가격은 Document AI API 가격 책정을 참고하세요.
감독하에 조정
지도 조정 지원은 다음과 같습니다.
ML.GENERATE_TEXT
: 일부 모델에서 지도 조정이 지원됩니다.ML.PROCESS_DOCUMENT
: 지도 조정이 지원되지 않습니다.
분당 쿼리 수(QPM) 한도
QPM 한도는 다음과 같습니다.
ML.GENERATE_TEXT
:gemini-1.5-pro
모델의 경우 기본us-central1
리전에서 QPM 60개,gemini-1.5-flash
모델의 경우 기본us-central1
리전에서 QPM 200개 자세한 내용은 Vertex AI의 생성형 AI 할당량을 참고하세요.ML.PROCESS_DOCUMENT
: 프로세서 유형당 120QPM이며 프로젝트당 전체 한도는 600QPM입니다. 자세한 내용은 할당량 목록을 참고하세요.
할당량을 늘리려면 할당량 상향 요청을 참고하세요.
토큰 한도
토큰 한도는 다음과 같습니다.
ML.GENERATE_TEXT
: 입력 토큰 700개, 출력 토큰 8,196개ML.PROCESS_DOCUMENT
: 토큰 한도가 없습니다. 하지만 이 함수에는 사용하는 프로세서에 따라 페이지 한도가 다릅니다. 자세한 내용은 한도를 참고하세요.
지원 언어
지원되는 언어는 다음과 같습니다.
ML.GENERATE_TEXT
: Gemini와 동일한 언어를 지원합니다.ML.PROCESS_DOCUMENT
: 언어 지원은 문서 프로세서 유형에 따라 다릅니다. 대부분은 영어만 지원합니다. 자세한 내용은 프로세서 목록을 참고하세요.
사용 가능한 리전
사용 가능한 리전은 다음과 같습니다.
ML.GENERATE_TEXT
: 모든 Vertex AI용 생성형 AI 리전에서 사용할 수 있습니다.ML.PROCESS_DOCUMENT
: 모든 프로세서의EU
및US
멀티 리전에서 사용할 수 있습니다. 일부 프로세서는 특정 지역에만 제공됩니다. 자세한 내용은 지역 및 다지역 지원을 참고하세요.