스크립트 작성 함수 선택

이 문서에서는 BigQuery ML에서 사용할 수 있는 스크립트 작성 함수(ML.GENERATE_TEXTML.TRANSCRIBE)를 비교합니다.

이 문서의 정보를 사용하여 함수에 겹치는 기능이 있는 경우에 사용할 함수를 결정할 수 있습니다.

간략한 이러한 함수의 차이점은 다음과 같습니다.

  • ML.GENERATE_TEXT는 10분 이하의 오디오 클립을 스크립트로 변환하는 데 적합하며 자연어 처리 (NLP) 작업을 실행하는 데도 사용할 수 있습니다. gemini-1.5-flash 모델을 사용하는 경우 ML.GENERATE_TEXT를 사용한 오디오 스크립트 작성은 ML.TRANSCRIBE를 사용한 것보다 비용이 적게 듭니다.

  • ML.TRANSCRIBE는 10분이 넘는 오디오 클립의 스크립트를 작성하는 데 적합합니다. 또한 ML.GENERATE_TEXT보다 더 다양한 언어를 지원합니다.

지원되는 모델

지원되는 모델은 다음과 같습니다.

  • ML.GENERATE_TEXT: Vertex AI Gemini 모델의 하위 집합을 사용하여 텍스트를 생성할 수 있습니다. 지원되는 모델에 대한 자세한 내용은 ML.GENERATE_TEXT 구문을 참고하세요.
  • ML.TRANSCRIBE: Speech-to-Text API 기본 모델을 사용합니다. Document AI API를 사용하면 Chirp 음성 모델을 사용하여 스크립트를 작성할 수 있습니다.

지원되는 태스크

지원되는 태스크는 다음과 같습니다.

  • ML.GENERATE_TEXT: 오디오 스크립트 작성 및 자연어 처리 (NLP) 작업을 실행할 수 있습니다.
  • ML.TRANSCRIBE: 오디오 스크립트 작성을 실행할 수 있습니다.

가격 책정

가격은 다음과 같습니다.

감독하에 조정

지도 조정 지원은 다음과 같습니다.

  • ML.GENERATE_TEXT: 일부 모델에서 지도 조정이 지원됩니다.
  • ML.TRANSCRIBE: 지도 조정이 지원되지 않습니다.

분당 쿼리 수(QPM) 한도

QPM 한도는 다음과 같습니다.

  • ML.GENERATE_TEXT: gemini-1.5-pro 모델의 경우 기본 us-central1 리전에서 QPM 60개, gemini-1.5-flash 모델의 경우 기본 us-central1 리전에서 QPM 200개 자세한 내용은 Vertex AI의 생성형 AI 할당량을 참고하세요.
  • ML.TRANSCRIBE: 프로젝트당 900QPM 자세한 내용은 할당량 및 한도를 참조하세요.

할당량을 늘리려면 할당량 상향 요청을 참고하세요.

토큰 한도

토큰 한도는 다음과 같습니다.

  • ML.GENERATE_TEXT: 입력 토큰 700개, 출력 토큰 8,196개 이 출력 토큰 제한은 ML.GENERATE_TEXT의 개별 오디오 클립이 약 39분으로 제한된다는 것을 의미합니다.
  • ML.TRANSCRIBE: 토큰 한도가 없습니다. 하지만 이 함수에는 개별 오디오 클립에 대한 한도가 480분으로 적용됩니다.

지원 언어

지원되는 언어는 다음과 같습니다.

사용 가능한 리전

사용 가능한 리전은 다음과 같습니다.

  • ML.GENERATE_TEXT: 모든 Vertex AI용 생성형 AI 리전에서 사용할 수 있습니다.
  • ML.TRANSCRIBE: 모든 음성 인식기의 EUUS 멀티 리전에서 사용할 수 있습니다.