Cloud Text-to-Speech

머신러닝 기반의 텍스트 음성 변환

무료로 사용해 보기 문서 보기

고음질 음성 합성

Google Cloud Text-to-Speech는 텍스트를 20여 개의 언어 및 방언이 지원되는 100여 개가 넘는 음성으로 변환해 줍니다. 음성 합성(WaveNet)의 획기적인 연구 성과와 Google의 강력한 신경망을 적용하여 최상의 음질을 제공합니다. 사용이 간편한 API로 사용자와 실제 대화하는 듯한 상호작용이 가능해 고객 서비스, 기기 상호작용, 기타 애플리케이션의 혁신적인 변화가 가능해집니다.

고음질 음성 합성

지금 바로 텍스트를 음성으로 변환해보세요.

원하는 내용을 입력하고 언어를 선택한 다음 '음성 변환'을 클릭하세요.

Google 머신러닝 활용

고급 딥 러닝 신경망 알고리즘이 텍스트를 다양한 음성 및 언어로 합성합니다. Google의 신경망은 Google의 음성 합성 전문 기술을 기반으로 제작되었습니다.

Google의 머신러닝

100개 이상의 음성 중에서 선택 가능

Google Cloud Text-to-Speech는 20여 개의 언어 및 방언으로 된 100개 이상의 목소리 옵션을 제공하여 개발자가 애플리케이션에 가장 적합한 음성을 선택할 수 있습니다.

100개 이상의 음성 중에서 선택 가능

WaveNet 기술 독점 액세스 기능 포함

DeepMind는 인간의 목소리와 소리를 흉내 내는 음성 머신러닝 모델에 대한 연구에서 획기적인 성과를 달성하여 실제 인간 음성과의 차이를 70%까지 줄였습니다. Cloud Text-to-Speech는 50개가 넘는 WaveNet 목소리에 대한 독점 액세스 기능을 제공하며 앞으로 더 많은 목소리가 추가될 예정입니다.

DeepMind의 WaveNet 음성

기존 애플리케이션 및 기기와 손쉽게 통합

Cloud Text-to-Speech는 스마트폰, PC, 태블릿, IoT 기기(예: 자동차, TV, 스피커) 등 REST 또는 gRPC 요청을 전송할 수 있는 모든 애플리케이션과 기기를 지원합니다.

기존 애플리케이션 및 기기와 손쉽게 통합

다양한 상황에도 활용 가능

Google Cloud Text-to-Speech는 사용하기 쉬운 API로 다양한 경우에 실제 상황과 유사한 경험을 제공하는 유연한 솔루션입니다. 일반적인 사용 사례로는 콜센터 자동화, IoT 기기의 대화식 응답 또는 텍스트를 오디오로 변환하여 사용하는 경우가 있습니다.

다양한 사례에도 활용 가능
텍스트 음성 변환 기호

Cloud Text-to-Speech 특징

다국어 지원
20개 이상의 언어 및 방언을 지원하는 100여 개의 목소리를 제공하며 앞으로 더 다양한 음성이 추가될 예정입니다.
WaveNet 음성
가장 자연스러운 음성을 제공하는 DeepMind WaveNet 음성에 독점적인 다국어 액세스가 가능합니다.
텍스트 및 SSML 지원
끊어 읽을 지점, 숫자, 날짜, 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.
말하기 속도 조정
말하기 속도를 일반 속도보다 4배 빠르거나 느리게 맞춤설정할 수 있습니다.
높낮이 조정
선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다.
볼륨 제어
출력 볼륨을 최대 16db까지 높이거나 -96db까지 줄일 수 있습니다.
오디오 형식 유연성
mp3, Linear16, Ogg Opus를 포함한 다양한 오디오 형식 중에서 선택할 수 있습니다.
오디오 프로필
헤드폰 또는 전화 회선과 같이 음성 재생에 사용할 스피커 유형에 맞게 최적화할 수 있습니다.

Cloud Text-to-Speech 가격 책정

고음질 음성 합성

Cloud Text-to-Speech는 무료 등급 1백만 자가 소진된 후부터 처리되는 텍스트에 1백만 자 단위로 가격이 책정됩니다. 자세한 내용은 가격 책정 가이드를 참조하세요.

기능 무료 등급 월별 사용량 유료 사용량
WaveNet 외의 표준 음성 0~4백만 자 1백만 자당 $4.00(USD)
WaveNet 음성 0~1백만 자 1백만 자당 $16.00(USD)
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
Text To Speech 로고
이 페이지에 나열된 제품이나 기능은 베타 버전입니다. 제품 출시 단계에 대한 자세한 내용은 여기에서 확인하세요.
Cloud AI 제품은 여기에 명시된 SLA 정책을 준수하며 다른 Google Cloud 서비스에서 보장하는 지연 시간이나 가용성과는 다를 수 있습니다.

다음에 대한 의견 보내기...

Cloud Text-to-Speech API
도움이 필요하시나요? 지원 페이지를 방문하세요.