Next '21에서 독점적으로 공개되는 최신 Text-to-Speech 기능의 작동 방식을 살펴보세요. 무료로 등록하기

바로 이동

Text-to-Speech

Google의 AI 기술을 기반으로 한 API를 사용하여 텍스트를 자연스러운 음성으로 변환합니다.
  • action/check_circle_24px Sketch로 작성되었습니다.

    생동감 있는 지능형 응답으로 고객 상호작용 개선하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    기기 및 애플리케이션의 음성 사용자 인터페이스로 사용자 참여 유도하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    사용자가 원하는 음성 및 언어를 사용하여 커뮤니케이션 맞춤설정하기

이점

고품질 음성

Google의 획기적인 기술을 배포하여 인간과 같은 억양을 가진 음성을 생성합니다. DeepMind의 음성 합성 전문 기술을 기반으로 제작되어 API가 인간과 흡사한 수준의 음성을 제공합니다.

가장 광범위한 음성 선택 옵션

북경어, 힌디어, 스페인어, 아랍어, 러시아어 등 40개 이상의 언어 및 방언을 지원하는 220여 개의 음성 조합 중에서 선택할 수 있습니다. 사용자와 애플리케이션에 가장 적합한 음성을 선택해 보세요.

단 하나의 음성

다른 조직과 공유해서 사용하는 흔한 음성 대신 자사 브랜드를 상징하는 특별한 음성을 제작해 모든 고객 터치포인트에서 활용할 수 있도록 지원합니다.

데모

Text-to-Speech 활용

원하는 내용을 입력하고 언어를 선택한 다음 '음성 변환(Speak It)'을 클릭하여 들어보세요.

주요 특징

주요 특징

Custom Voice(베타)

자체 오디오 녹음 파일로 커스텀 음성 모델을 학습시켜 조직에 맞는 특별하면서 보다 자연스러운 음성을 만드세요. 조직에 맞는 음성 프로필을 정의하고 선택한 후, 필요한 음성이 바뀔 시 새 구문을 녹음할 필요 없이 빠르게 조정할 수 있습니다.

WaveNet 음성

DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와의 격차를 대폭 축소하는 음성을 생성합니다.

음성 조정

선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다. 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 조정할 수 있습니다.

텍스트 및 SSML 지원

끊어 읽을 지점, 숫자, 날짜 및 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.

모든 특징 보기

새로운 소식

새로운 소식

Google Cloud 뉴스레터를 신청하여 제품 업데이트, 행사 정보, 특별 이벤트 등의 소식을 받아보세요.

문서

문서

Google Cloud 기본사항
Text-to-Speech 기본사항

Text-to-Speech API 사용에 관한 기본 개념을 설명하는 가이드입니다.

빠른 시작
빠른 시작: 명령줄 사용

Google Cloud 프로젝트 및 승인을 설정하고 Text-to-Speech에 요청을 전송하여 텍스트에서 오디오를 만듭니다.

Google Cloud 기본사항
지원되는 음성 및 언어

이 제품의 가이드 및 리소스 찾아보기

Google Cloud 기본사항
Custom Voice(베타) 개요

자체 스튜디오 품질 오디오 녹음을 사용하여 Custom Voice로 특별하면서 보다 자연스러운 음성을 만드는 방법을 알아보세요.

튜토리얼
WaveNet 및 기타 합성 음성

프리미엄 WaveNet 음성을 포함하여 Text-to-Speech에서 사용할 수 있는 다양한 합성 음성에 대해 알아봅니다.

튜토리얼
SSML로 주소 말하기

이 튜토리얼에서는 음성 합성 마크업 언어(SSML)를 사용하여 주소 텍스트 파일을 말하는 방법을 보여줍니다.

사용 사례

사용 사례

사용 사례
고객 센터의 음성 봇

사전 녹음된 정적인 오디오를 재생하는 대신 Dialogflow의 음성 봇을 통해 음성을 동적으로 생성하여 고객 서비스에 더 나은 음성 경험을 제공합니다. 고품질 합성 음성을 통해 발신자에게 친밀감과 맞춤화된 경험을 제공합니다.

고객 센터의 음성 봇 참조 아키텍처
사용 사례
기기에서 음성 생성

기기가 텍스트를 읽을 때 인간과 비슷한 음성을 사용하도록 지원하여 사용자와 자연스러운 커뮤니케이션을 할 수 있습니다. Speech-to-TextNatural Language를 사용하여 엔드 투 엔드 음성 사용자 인터페이스를 빌드하고 간편하고 적극적인 상호작용을 통해 사용자 경험을 개선합니다.

기기에서 음성 생성 참조 아키텍처
사용 사례
액세스 가능한 EPG(전자 프로그램 가이드)

손쉽게 EPG에서 텍스트를 소리 내 읽을 수 있도록 하여 고객에게 더욱 우수한 사용자 환경을 제공하고 서비스와 애플리케이션의 접근성 요구사항을 충족할 수 있습니다. EPG 데모를 사용해 보세요.

EPG에서 텍스트 음성 변환 기능을 손쉽게 구현하여 고객에게 더욱 우수한 사용자 환경을 제공하고 서비스와 애플리케이션의 접근성 요구사항을 충족할 수 있습니다.

TTS API로 접근성이 우수한 EPG를 만드는 방법을 보여주는 참조 아키텍처

모든 특징

모든 특징

Custom Voice(베타) 자체 오디오 녹음 파일로 커스텀 음성 합성 모델을 학습시켜 조직에 맞는 특별하면서 보다 자연스러운 음성을 만드세요. 조직에 맞는 음성 프로필을 정의하고 선택한 후, 필요한 음성이 바뀔 시 새 구문을 녹음할 필요 없이 빠르게 조정할 수 있습니다. 자세히 알아보기
음성 및 언어 선택 40개 이상의 언어 및 방언을 지원하는 220여 개의 광범위한 음성 중에서 선택할 수 있으며 앞으로 더 많은 음성이 추가될 예정입니다.
WaveNet 음성 DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와의 격차를 대폭 축소하는 음성을 생성합니다.
텍스트 및 SSML 지원 끊어 읽을 지점, 숫자, 날짜, 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.
높낮이 조정 선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다.
말하기 속도 조정 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 맞춤설정할 수 있습니다.
볼륨 제어 출력 볼륨을 최대 16db까지 높이거나 -96db까지 줄일 수 있습니다.
통합된 REST 및 gRPC API 스마트폰, PC, 태블릿, IoT 기기(예: 자동차, TV, 스피커) 등 REST 또는 gRPC 요청을 전송할 수 있는 모든 애플리케이션 및 기기와 손쉽게 통합할 수 있습니다.
오디오 형식 유연성 텍스트를 MP3, Linear16, OGG Opus 및 기타 다양한 오디오 형식으로 변환할 수 있습니다.
오디오 프로필 헤드폰 또는 전화 회선과 같이 음성 재생에 사용할 스피커 유형에 맞게 최적화할 수 있습니다.

가격 책정

가격 책정

Text-to-Speech 가격은 서비스로 전송되어 오디오로 합성되는 문자 수(영문 기준)를 기준으로 매월 책정됩니다. 매월 WaveNet 음성의 1백만 문자가 무료로 제공됩니다. 표준(비 WaveNet) 음성의 경우 매월 4백만 문자가 무료로 제공됩니다. Text-to-Speech는 무료 등급 할당량에 도달한 후부터 처리되는 텍스트에 대해 1백만 문자 단위로 가격이 책정됩니다.

USD 외의 통화로 지불하는 경우 Google Cloud SKU에 해당 통화로 표기된 가격이 적용됩니다.