Text-to-Speech 가격 책정

Text-to-Speech 가격은 서비스로 전송되어 오디오로 합성되는 문자 수(영문 기준)를 기준으로 매월 책정됩니다. Text-to-Speech를 사용하려면 결제를 사용 설정해야 하며 사용량이 월별 무료 문자 수를 초과하면 자동으로 청구됩니다. 총 문자 수를 집계하는 방법은 API 사용량 모니터링을 참조하세요. 가격은 문자 수를 기준으로 계산됩니다.

공백 및 줄바꿈 문자를 포함한 입력 문자열의 총 문자 수가 계산되어 청구됩니다. 모든 음성 합성 마크업 언어 (SSML) 태그 (<mark> 태그 제외)도 문자 수에 포함됩니다.

가격표

Gemini-TTS

텍스트 기반 프롬프트를 사용하여 생성된 오디오를 세밀하게 제어할 수 있는 Text-to-Speech 기술의 최신 버전입니다.

모델

무료 사용량 한도

무료 사용량 한도 소진 이후 가격

Gemini 2.5 Flash TTS

사용 불가

입력 토큰: 텍스트 토큰 100만 개당 $0.50

(sku: 242A-EA16-C1EC)

출력 토큰: 오디오 토큰 100만 개당 $10.00*

(sku: 9228-79EF-B162)

Gemini 2.5 Pro TTS

사용 불가

입력 토큰: 텍스트 토큰 100만 개당 $1.00

(sku: 8FF1-7E5B-5BB7)

출력 토큰: 오디오 토큰 100만 개당 $20.00*

(sku: DCF3-CB17-8262)


* 오디오 토큰은 오디오 초당 25개의 토큰에 해당합니다.

최신 TTS 모델

최첨단 LLM을 기반으로 하는 Google의 최신 TTS 모델은 모든 사용 사례에 대해 즉시 사용할 수 있는 타의 추종을 불허하는 수준의 사실감과 감정적 공감을 제공합니다.

모델


무료 사용량 한도

무료 사용량 한도 소진 이후 가격

Chirp 3: HD 음성

(sku:F977-2280-6F1B)

0~100만 자

문자당 US$0.00003 (영문 기준 100만 자당 US$30)

즉석 커스텀 음성

(sku:A247-37D7-C094)

사용 불가

문자당 US$0.00006 (영문 기준 100만 자당 US$60)


기존 TTS 모델

모델

무료 사용량 한도

무료 사용량 한도 소진 이후 가격

WaveNet 음성

(sku:9D01-5995-B545)

0~400만 자

문자당 US$0.000004 (영문 기준 100만 자당 US$4)

Studio 음성

(sku:84AB-48C0-F9C3)

0~100만 자

문자당 US$0.00016 (영문 기준 100만 자당 US$160)

표준 음성

(sku:9D01-5995-B545)

0~400만 자

문자당 US$0.000004(영문 기준 100만 자당 US$4)

Neural2 음성

(sku:FEBD-04B6-769B)

0~100만 자

문자당 US$0.000016(영문 기준 100만 자당 US$16)

Polyglot(프리뷰) 음성

(sku:FEBD-04B6-769B)

0~100만 자

문자당 US$0.000016(영문 기준 100만 자당 US$16)

참고: WaveNet 및 표준 음성의 경우 문자 수는 텍스트가 나타내는 바이트 수와 동일하거나 이보다 작습니다. 영숫자 문자, 구두점, 공백이 포함됩니다. 일부 문자 집합은 문자당 2바이트 이상을 사용합니다. 예를 들어 UTF-8 형식의 일본어(ja-JP) 문자에는 일반적으로 각각 2바이트 이상이 필요합니다. 이 경우 멀티바이트가 아닌 문자 1개당 요금만 청구됩니다.

Google Cloud 가격 책정

Google App Engine 인스턴스 등 다른 Google Cloud 리소스를 Text-to-Speech와 함께 사용하면 해당 서비스 사용에 따른 요금도 부과됩니다. 현재 요금을 기준으로 제반 비용을 확인하려면 Google Cloud 가격 계산기를 사용해 보세요.

다음 단계

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.




Google Cloud