Text-to-Speech

Google의 AI 기술을 기반으로 한 API를 사용하여 텍스트를 자연스러운 음성으로 변환합니다.

무료로 사용해 보기
  • action/check_circle_24px Sketch로 작성되었습니다.

    생동감 있는 지능형 응답으로 고객 상호작용 개선하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    기기 및 애플리케이션의 음성 사용자 인터페이스로 사용자 참여 유도하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    사용자가 원하는 음성 및 언어를 사용하여 커뮤니케이션 맞춤설정하기

이점

고음질 음성

Google의 획기적인 기술을 배포하여 인간과 같은 억양을 가진 음성을 생성합니다. DeepMind의 음성 합성 전문 기술을 기반으로 제작되어 API가 인간과 흡사한 수준의 음성을 제공합니다.

가장 광범위한 음성 선택 옵션

40개가 넘는 언어 및 방언을 지원하는 220여 개의 음성 조합 중에서 선택할 수 있습니다. 사용자 및 애플리케이션에 가장 적합한 음성을 선택해 보세요.

단 하나의 음성

다른 조직과 공유해서 사용하는 흔한 음성 대신 자사 브랜드를 상징하는 특별한 음성을 제작해 모든 고객 터치포인트에서 활용할 수 있도록 지원합니다.

데모

Text-to-Speech 실행하기

원하는 내용을 입력하고 언어를 선택한 다음 '음성 변환(Speak It)'을 클릭하여 들어보세요.

주요 특징

주요 특징

Custom Voice(베타)

나만의 오디오 녹음 파일을 통해 커스텀 음성 합성 모델을 학습하여 조직에 맞는 특별하면서 보다 자연스러운 음성을 만드세요. 조직에 맞는 음성 프로필을 정의 및 선택한 후 새 구문을 녹음할 필요 없이 필요한 음성이 변하면 빠르게 변경할 수 있습니다. 자세히 알아보기

WaveNet 음성

DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와의 격차를 대폭 축소하는 음성을 생성합니다.

음성 조정하기

선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다. 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 조정할 수 있습니다.

텍스트 및 SSML 지원

끊어 읽을 지점, 숫자, 날짜 및 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.

모든 특징 보기

새로운 소식

새로운 소식

Google Cloud 뉴스레터를 신청하여 제품 업데이트, 행사 정보, 특별 이벤트 등의 소식을 받아보세요.

문서

문서

Google Cloud 기본사항
Text-to-Speech 기본사항

Text-to-Speech API 사용에 관한 기본 개념을 설명하는 가이드입니다.

빠른 시작
빠른 시작: 명령줄 사용

Google Cloud 프로젝트 및 승인을 설정하고 Text-to-Speech를 요청하여 텍스트에서 오디오를 만듭니다.

Google Cloud 기본사항
지원되는 음성 및 언어

Text-to-Speech에서 어떤 언어를 지원하는지 알아보고 각각에 대해 사용 가능한 음성을 들어보세요.

Google Cloud 기본사항
Custom Voice(베타) 개요

나만의 스튜디오 품질 오디오 녹음을 통해 Custom Voice를 사용하여 특별하면서 보다 자연스러운 음성을 만드는 방법을 알아보세요.

가이드
WaveNet 및 기타 합성 음성

프리미엄 WaveNet 음성을 포함하여 Text-to-Speech에서 사용할 수 있는 다양한 합성 음성에 대해 알아봅니다.

가이드
SSML로 주소 말하기

이 가이드에서는 음성 합성 마크업 언어(SSML)를 사용하여 주소 텍스트 파일을 말하는 방법을 보여줍니다.

사용 사례

사용 사례

사용 사례
고객센터의 음성 봇

사전 녹음된 정적인 오디오를 재생하는 대신 음성을 동적으로 생성하여 고객 서비스에 더 나은 음성 경험을 제공합니다. 고품질 합성 음성을 통해 발신자에게 친밀감과 맞춤화의 경험을 제공합니다.

고객 센터의 음성 봇 참조 아키텍처
사용 사례
기기에서 음성 생성

기기에 인간과 비슷한 음성을 지원하여 사용자와 자연스러운 커뮤니케이션을 할 수 있습니다. Speech-to-Text를 사용하여 엔드 투 엔드 음성 사용자 인터페이스를 빌드하고 간편하고 적극적인 상호작용을 통해 사용자 경험을 개선합니다.

기기에서 음성 생성 참조 아키텍처
사용 사례
액세스 가능한 EPG(전자 프로그램 가이드)

EPG에서 텍스트 음성 변환 기능을 간단하게 구현하여 고객에게 더욱 우수한 사용자 환경을 제공하고 서비스 및 애플리케이션의 접근성 요구사항을 충족할 수 있습니다. 데모 사용해 보기

모든 특징

모든 특징

Custom Voice(베타) 나만의 오디오 녹음 파일을 통해 커스텀 음성 합성 모델을 학습하여 조직에 맞는 특별하면서 보다 자연스러운 음성을 만드세요. 조직에 맞는 음성 프로필을 정의 및 선택한 후 새 구문을 녹음할 필요 없이 필요한 음성이 변하면 빠르게 변경할 수 있습니다. 자세히 알아보기
음성 및 언어 선택 40개 이상의 언어 및 방언을 지원하는 220여 개의 광범위한 음성에서 선택할 수 있으며 앞으로 더 많은 음성이 추가될 예정입니다.
WaveNet 음성 DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와의 격차를 대폭 축소하는 음성을 생성합니다.
텍스트 및 SSML 지원 끊어 읽을 지점, 숫자, 날짜 및 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.
높낮이 조정 선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다.
말하기 속도 조정 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 조정할 수 있습니다.
볼륨 제어 출력 볼륨을 최대 16db까지 높이거나 -96db까지 줄일 수 있습니다.
통합된 REST 및 gRPC API 스마트폰, PC, 태블릿, IoT 기기(예: 자동차, TV, 스피커) 등 REST 또는 gRPC 요청을 전송할 수 있는 모든 애플리케이션 및 기기와 손쉽게 통합할 수 있습니다.
오디오 형식 유연성 MP3, Linear16, Ogg Opus를 포함한 다양한 오디오 형식 중에서 선택할 수 있습니다.
오디오 프로필 헤드폰 또는 전화 회선과 같이 음성 재생에 사용할 스피커 유형에 맞게 최적화할 수 있습니다.

가격 책정

가격 책정

Text-to-Speech는 무료 등급 이후 처리되는 텍스트에 100만 자(영문 기준) 단위로 가격이 책정됩니다.

USD 외의 통화로 지불하는 경우 Google Cloud SKU에 해당 통화로 표기된 가격이 적용됩니다.