할당량 및 한도

이 문서에서는 현재 Speech-to-Text 사용 시 적용되는 API 제한사항 및 사용량 한도에 관한 내용을 다룹니다. 제한사항 및 사용량 한도에 변경사항이 있으면 이 페이지에 업데이트됩니다. Google은 이와 같은 한도를 변경할 권한을 가집니다.

필요한 경우 할당량 상향 조정을 요청할 수 있습니다. 할당량 보기 및 관리에 대한 자세한 내용은 Google Cloud 할당량 페이지를 참고하세요.

요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.

콘텐츠 한도

동기식 요청

동기식 인식 요청(Recognize 메서드 사용)은 요청의 content 필드에 있는 인라인 또는 요청의 uri 필드에 있는 Cloud Storage URI로 오디오 데이터를 허용합니다. 동기식 요청으로 전송된 오디오는 10MB 또는 1분의 오디오 시간으로 제한됩니다(둘 중 먼저 도달하는 경우). 동기식 인식에 대한 자세한 내용은 동기식 인식 개요를 참조하세요.

스트리밍 요청

스트리밍 인식 요청(StreamingRecognize 메서드 사용)은 요청의 audio 필드에서 인라인 오디오만 허용합니다. 스트림의 각 요청은 25KB 오디오로 제한됩니다. 스트림은 최대 5분 동안 열어 둘 수 있으며, 오디오는 실시간에 가까운 속도로 전송되어야 합니다. 콘텐츠를 5분 넘게 스트리밍해야 하는 경우 지속적인 스트리밍 튜토리얼을 참조하세요. 스트리밍 인식에 대한 자세한 내용은 스트리밍 인식 개요를 참조하세요.

일괄 요청

일괄 인식 요청(BatchRecognize 메서드 사용)은 요청의 uri 필드에서 오디오만 Cloud Storage URI로 허용합니다. BatchRecognizeRequest에는 텍스트 변환을 위해 최대 15개의 files를 포함할 수 있습니다. 각 파일의 최대 길이는 8시간입니다. 비동기식 인식에 대한 자세한 내용은 일괄 인식 개요를 참조하세요.

여러 언어 인식

다국어 인식은 전역, 미국, EU Speech-to-Text 엔드포인트에서만 사용할 수 있습니다.

적응

모든 요청 내에서 PhraseSet 및 CustomClass 리소스를 제공할 수도 있습니다. 이러한 리소스에 적용되는 한도는 다음과 같습니다.

음성 적응 한도	값
허용되는 최대 구문 부스트 값	20
PhraseSet의 구문	1,200
요청당 구문 수	5,000
구문당 문자 수(영문 기준)	100
요청당 총 문자 수(영문 기준)	100,000
CustomClass의 최대 항목 수	500
CustomClass 항목당 최대 문자 수	500
SpeechAdaptation당 최대 PhraseSet 수	20
SpeechAdaptation당 최대 CustomClass 수	20

리소스 한도

현재 Speech-to-Text에 적용되는 API 리소스 한도는 다음과 같으며 변경될 수 있습니다.

한도 유형	사용량 한도
인식기 수(리전별)	5,000
커스텀 클래스 수(리전별)	5,000
구문 집합 수(리전별)	5,000

요청 한도

현재 Speech-to-Text에 적용되는 API 사용량 한도는 다음과 같으며 변경될 수 있습니다.

한도 유형	사용량 한도
60초당 리소스 요청(리전별)	100
60초당 작업 요청 수(리전별)	150
60초당 동기 인식 요청 수(리전별)	300
60초당 스트리밍 인식 요청 수(리전별) *	3,000
5분당 스트리밍 인식 세션(리전별) *	300
60초당 일괄 인식 요청 수(리전별)	150

* 스트리밍 인식에는 5분당 300개의 동시 세션 할당량과 모든 동시 세션에 함께 적용되는 분당 3,000개의 요청 한도가 있습니다. 세션의 초기 구성 요청은 요청 할당량에 포함되지 않습니다.

이러한 한도는 각각의 Speech-to-Text 개발자 프로젝트에 적용되며, 특정 개발자 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.