Text-to-Speech

透過採用 Google AI 技術的 API,將文字轉換為自然流暢的語音。

免費試用
  • action/check_circle_24pxCreated with Sketch.

    以自然流暢的智慧型回應改善客戶互動

  • action/check_circle_24pxCreated with Sketch.

    在您的裝置和應用程式中為使用者提供語音使用者介面

  • action/check_circle_24pxCreated with Sketch.

    依據使用者偏好的語音和語言提供個人化的訊息

高傳真語音

部署 Google 的創新技術來產生近似人類聲調的語音。這個 API 是以 DeepMind 的語音合成專業知識為基礎建立而成,可提供擬真的語音。

最豐富的語音選項

支援 40 多種語言和方言,並提供超過 220 種語音選項,讓您自由搭配使用。您可以挑選最適合使用者和應用程式的語音。

革新速度更快

結合 Google 頂尖的 TranslationSpeech-to-Text 技術,可應用於多語言音訊內容和語音機器人等用途。

實際運用 Text-to-Speech

自由輸入內容、選取所需語言,然後按一下 [Speak It] 即可聆聽。

主要功能與特色

WaveNet 語音

運用以 DeepMind 創新研究為基礎而建立的 90 多種 WaveNet 音訊,產生極為擬真的語音。

語音微調

自訂所選語音的音調,最多可以比預設音調增加或減少 20 個半音。您可以將誦讀速度調整為比正常速度快或慢 4 倍。

文字與 SSML 支援

您可以使用 SSML 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。

查看所有功能與特色

最新資訊

訂閱 Google Cloud 電子報,掌握產品動態、活動資訊和特價優惠等最新消息。

說明文件

Google Cloud 基本資訊
Text-to-Speech 基本資訊

使用 Text-to-Speech API 的基本概念指南。

快速入門導覽課程
快速入門導覽課程:使用指令列

設定您的 Google Cloud 專案與授權,並要求 Text-to-Speech 依據文字產生音訊。

Google Cloud 基本資訊
支援的語音和語言

瞭解 Text-to-Speech 支援哪些語言,並聆聽各種語言的語音範例。

教學課程
WaveNet 和其他合成語音

瞭解可在 Text-to-Speech 中使用的不同合成語音,包括優質的 WaveNet 語音。

教學課程
以 SSML 朗讀地址

這個教學課程會示範如何使用語音合成標記語言 (SSML) 朗讀地址文字檔案。

用途

用途
客服中心內的語音機器人

動態產生語音而非播放預先錄製的靜態語音,藉此提供更優質的客戶服務語音體驗。以高品質的合成語音產生互動,讓來電者享有熟悉且個人化的服務。

客服中心語音機器人的參考架構
用途
在裝置中產生語音

讓您的裝置發出擬真語音,與使用者自然地互動。搭配使用 Speech-to-Text 來建立端對端語音使用者介面,以引人入勝的輕鬆互動改善使用者體驗。

在裝置中產生語音的參考架構

所有功能與特色

語音和語言選項 支援 40 多種語言和方言,提供超過 220 種語音選項。不久後還會推出更多種類,供您自由選擇。
WaveNet 語音 運用以 DeepMind 創新研究為基礎而建立的 90 多種 WaveNet 音訊,產生極為擬真的語音。
文字與 SSML 支援 您可以使用 SSML 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。
音調微調 自訂所選語音的音調,最多可以比預設音調增加或減少 20 個半音。
誦讀速度微調 您可以將誦讀速度調整為比正常速度快或慢 4 倍。
音量增益控制 輸出音量最多可以提高 16db 或降低 96db。
經過整合的 REST 和 gRPC API 輕鬆整合可傳送 REST 或 gRPC 要求的任何應用程式或裝置,包括手機、桌上型電腦、平板電腦和 IoT 裝置 (例如汽車、電視與喇叭)。
多種音訊格式 多種音訊格式任您選擇,包括 mp3、Linear16 和 Ogg Opus。
音訊設定檔 可針對用來播放語音的喇叭類型進行最佳化處理,例如耳罩式耳機或電話聽筒。

定價

免費方案到期之後,系統會依據 Text-to-Speech 處理的文字量向您收費 (計費單位為 100 萬個字元)。

如果您使用美元以外的貨幣付費,系統將按照 Google Cloud SKU 頁面上列出的相應貨幣價格來計費。