跳至
Text-to-Speech

Text-to-Speech AI

透過採用 Google AI 技術精華的 API,將文字轉換為自然流暢的語音。

新客戶最高可獲得 $300 美元的免費抵免額,開始使用 Text-to-Speech 和其他 Google Cloud 產品。

  • 以自然流暢的智慧型回應改善客戶互動

  • 在您的裝置和應用程式中提供語音使用者介面,方便使用者參與互動

  • 依據使用者偏好的語音和語言提供個人化的訊息

優點

高傳真語音

部署 Google 的創新技術,產生語調宛如真人的語音。以 DeepMind 的語音合成專業知識為基礎所打造的 API,可提供擬真的語音。

最豐富的語音選項

提供超過 380 種語音選項,支援 50 多種語言和方言,包括中文、北印度文、西班牙文、阿拉伯文、俄文等。您可以挑選最適合使用者和應用程式的語音。

獨一無二的語音

創造獨特的語音,讓您在所有客戶接觸點上呈現自己的品牌特色,而不是與其他機構共用相同的語音。

示範

實際運用 Text-to-Speech

自由輸入內容、選取所需語言,然後按一下「Speak It」即可聆聽。

主要功能與特色

主要功能與特色

Journey 語音 (預先發布版)

打造互動性高的虛擬服務專員,運用以 AudioLM 為基礎的最新自然對話語音提供服務。這些語音提供高品質音訊、低延遲串流,並加入準確語調及仿真人不順暢的語流,打造自然的語音。

Studio 語音

使用專業人員在錄音室等級的環境中錄製的講述內容,讓聽眾為之驚艷。戴上耳機聽,效果更出色。

您現在可以生成多位說話者的對話,打造互動性最高的情境。

Neural2 語音

Neural2 語音採用 Custom Voice 幕後的最新研究,且立即可用,可讓您打造出國際化的語音體驗。

Custom Voice

用自己錄製的音訊訓練自訂語音模型,為機構打造聽起來更自然的獨特語音。您可以定義及選擇適合貴機構的語音設定檔,並因應語音需求變化迅速調整,完全不需要錄製新的詞組。

文字與 SSML 支援

您可以使用語音合成標記語言 (SSML) 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。

查看所有功能與特色

說明文件

說明文件

Google Cloud Basics

Text-to-Speech 基本知識

使用 Text-to-Speech API 的基本概念指南。
Quickstart

快速入門導覽課程:使用指令列

設定您的 Google Cloud 專案與授權,並要求 Text-to-Speech 依據文字產生音訊。
Google Cloud Basics

支援的語音和語言

瀏覽這項產品的指南和資源。
Google Cloud Basics

Custom Voice (Beta 版) 總覽

瞭解如何透過 Custom Voice 功能,用自己錄製的錄音室等級音訊,創造聽起來更自然的獨特語音。
Tutorial

WaveNet 和其他合成語音

瞭解可在 Text-to-Speech 中使用的不同合成語音,包括優質的 WaveNet 語音。
Tutorial

使用 SSML 來朗讀地址

這個教學課程會示範如何使用語音合成標記語言 (SSML) 來朗讀地址文字檔案。

找不到所需資訊嗎?

使用案例

使用案例

用途
客服中心內的語音機器人

Dialogflow 的語音機器人可動態產生語音,而非播放預先錄製的靜態語音,能提供更優質的客戶服務語音體驗。以高品質的合成語音進行互動,讓來電者享有親切熟悉的個人化服務。

客服中心語音機器人的參考架構
用途
在裝置中產生語音

將您的裝置當做文字閱讀器使用,讓裝置發出擬真語音,與使用者自然地溝通。搭配使用 Speech-to-TextNatural Language 來建立端對端語音使用者介面,以輕鬆而吸引人的互動來改善使用者體驗。

在裝置中產生語音的參考架構
用途
無障礙電子節目表

輕鬆讓系統讀出電子節目表的文字內容,藉此為客戶提供更優質的使用者體驗,並讓您的服務和應用程式符合無障礙需求。試試電子節目表示範

輕鬆將文字轉語音功能導入電子節目表,為客戶提供更優質的使用者體驗,並讓服務和應用程式符合無障礙需求。

展示 Text-to-Speech API 如何建立無障礙電子節目表的參考架構

所有功能與特色

所有功能與特色

Custom Voice
用自己錄製的音訊訓練自訂語音合成模型,為機構打造獨特而自然的語音。您可以定義及選擇適合貴機構的語音設定檔,並且能因應語音需求的變化而快速調整,完全不用錄製新的詞組。瞭解詳情
長音訊合成功能
使用 長音訊合成功能,以非同步的方式合成最多 100 萬個位元組的輸入內容。
語音和語言選項
針對 40 多種語言和方言提供超過 220 種語音,而且即將推出更多選項。
WaveNet 語音
運用以 DeepMind 突破性研究為基礎而建立的 90 多種 WaveNet 語音,產生與真人更加相似的語音內容。
文字與 SSML 支援
您可以使用語音合成標記語言 (SSML) 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。
音調微調
自訂所選語音的音調,最多可以比預設音調升高或降低 20 個半音。
誦讀速度微調
您可以將誦讀速度調整為比正常速度快或慢 4 倍。
音量增益控制
輸出音量最多可以提高 16 db 或降低 96 db。
整合 REST 和 gRPC API

輕鬆整合可傳送 REST 或 gRPC 要求的任何應用程式或裝置,包括手機、電腦、平板電腦和 IoT 裝置 (例如汽車、電視與喇叭)。

多種音訊格式
將文字轉換為 MP3、Linear16、OGG Opus 和其他多種音訊格式
音訊設定檔
可針對用來播放語音的喇叭類型進行最佳化處理,例如耳罩式耳機或電話聽筒。

定價

定價

系統每月計算 Text-to-Speech 的費用時,會按照傳送至這項服務進行音訊合成的字元數計費。WaveNet 語音每月前 100 萬個字元免費。如果是標準 (非 WaveNet) 語音,則每月前 400 萬個字元免費。免費方案的額度用完後,系統會依據 Text-to-Speech 處理的文字量向您收費 (計費單位為 100 萬個字元)。

如果使用美元以外的貨幣付費,系統將按照 Google Cloud SKU 頁面上列出的相應貨幣價格計費。

展開下一步行動

新客戶可獲得 $300 美元的免費抵免額,開始使用 Text-to-Speech 和其他 Google Cloud 產品。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
控制台