텍스트 음성 변환

Google의 AI 기술을 기반으로 한 API를 사용하여 텍스트를 자연스러운 음성으로 변환합니다.

무료로 사용해 보기
  • action/check_circle_24px Sketch로 작성되었습니다.

    생동감 있는 지능형 응답으로 고객 상호작용 개선하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    기기 및 애플리케이션의 음성 사용자 인터페이스로 사용자 참여 유도하기

  • action/check_circle_24px Sketch로 작성되었습니다.

    사용자가 원하는 음성 및 언어를 사용하여 커뮤니케이션 맞춤설정하기

고음질 음성

Google의 획기적인 기술을 배포하여 인간과 같은 억양을 가진 음성을 생성합니다. DeepMind의 음성 합성 전문 기술을 기반으로 제작되어 API가 인간과 흡사한 수준의 음성을 제공합니다.

가장 광범위한 음성 선택 옵션

40개가 넘는 언어 및 방언을 사용한 220여 개의 음성 조합 중에서 선택할 수 있습니다. 사용자 및 애플리케이션에 가장 적합한 음성을 선택해 보세요.

가속화된 혁신

번역음성 텍스트 변환 분야에서 Google 최고의 기술들을 결합하여 다국어 오디오 콘텐츠 및 음성 봇과 같은 사용 사례를 지원합니다.

텍스트 음성 변환 실행하기

원하는 내용을 입력하고 언어를 선택한 다음 '음성 변환'을 클릭하여 들어보세요.

주요 특징

WaveNet 음성

DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와 격차를 대폭 해소하는 음성을 생성합니다.

음성 조정하기

선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다. 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 조정할 수 있습니다.

텍스트 및 SSML 지원

끊어 읽을 지점, 숫자, 날짜 및 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.

모든 특징 보기

새로운 소식

Google Cloud 뉴스레터를 신청하여 제품 업데이트, 행사 정보, 특별 이벤트 등의 소식을 받아보세요.

문서

Google Cloud 기본사항
텍스트 음성 변환 기본사항

텍스트 음성 변환 API 사용에 관한 기본 개념을 설명하는 가이드입니다.

빠른 시작
빠른 시작: 명령줄 사용

Google Cloud 프로젝트 및 승인을 설정하고 텍스트 음성 변환 요청을 수행하여 텍스트에서 오디오를 만듭니다.

Google Cloud 기본사항
지원되는 음성 및 언어

텍스트 음성 변환에서 어떤 언어를 지원하는지 알아보고 각각에 대해 사용 가능한 음성을 들어보세요.

가이드
WaveNet 및 기타 합성 음성

프리미엄 WaveNet 음성을 포함하여 텍스트 음성 변환에서 사용할 수 있는 다양한 합성 음성에 대해 알아봅니다.

가이드
SSML로 주소 말하기

이 가이드에서는 음성 합성 마크업 언어(SSML)를 사용하여 주소 텍스트 파일을 말하는 방법을 보여줍니다.

사용 사례

사용 사례
고객센터의 음성 봇

사전 녹음된 정적인 오디오 대신 동적으로 음성을 생성하여 고객 서비스에 더 나은 음성 경험을 제공합니다. 고품질 합성 음성을 통해 발신자에게 친밀감과 맞춤화의 경험을 제공합니다.

고객 센터의 음성 봇 참조 아키텍처
사용 사례
기기에서 음성 생성

기기에 인간과 비슷한 음성을 지원하여 사용자와 자연스러운 커뮤니케이션을 할 수 있습니다. 음성 텍스트 변환을 사용하여 엔드 투 엔드 음성 사용자 인터페이스를 빌드하고 간편하고 적극적인 상호작용을 통해 사용자 경험을 개선합니다.

기기에서 음성 생성 참조 아키텍처

모든 특징

음성 및 언어 선택 40개 이상의 언어 및 방언을 사용하는 220여 개의 광범위한 음성에서 선택할 수 있으며 앞으로 더 많은 음성이 추가될 예정입니다.
WaveNet 음성 DeepMind의 혁신적인 연구를 기반으로 빌드된 90여 개의 WaveNet 음성을 활용하여 사람 목소리와 격차를 대폭 해소하는 음성을 생성합니다.
텍스트 및 SSML 지원 끊어 읽을 지점, 숫자, 날짜 및 시간 형식, 기타 발음 지침을 추가할 수 있는 SSML 태그로 음성을 맞춤설정할 수 있습니다.
높낮이 조정 선택한 음성의 높낮이를 기본 출력보다 최대 20반음까지 높거나 낮게 맞춤설정할 수 있습니다.
말하기 속도 조정 말하기 속도를 일반 속도보다 4배 빠르거나 느리게 맞춤설정할 수 있습니다.
볼륨 제어 출력 볼륨을 최대 16db까지 높이거나 -96db까지 줄일 수 있습니다.
통합된 REST 및 gRPC API 스마트폰, PC, 태블릿, IoT 기기(예: 자동차, TV, 스피커) 등 REST 또는 gRPC 요청을 전송할 수 있는 모든 애플리케이션 및 기기와 손쉽게 통합할 수 있습니다.
오디오 형식 유연성 mp3, Linear16, Ogg Opus를 포함한 다양한 오디오 형식 중에서 선택할 수 있습니다.
오디오 프로필 헤드폰 또는 전화 회선과 같이 음성 재생에 사용할 스피커 유형에 맞게 최적화할 수 있습니다.

가격 책정

텍스트 음성 변환은 무료 등급 이후 처리되는 텍스트에 100만 자(영문 기준) 단위로 가격이 책정됩니다.

USD 외의 통화로 지불하는 경우 Google Cloud SKU에 해당 통화로 표기된 가격이 적용됩니다.