透過採用 Google AI 技術精華的 API,將文字轉換為自然流暢的語音。
新客戶最高可獲得 $300 美元的免費抵免額,開始使用 Text-to-Speech 和其他 Google Cloud 產品。
以自然流暢的智慧型回應改善客戶互動
在您的裝置和應用程式中提供語音使用者介面,方便使用者參與互動
依據使用者偏好的語音和語言提供個人化的訊息
優點
部署 Google 的創新技術,產生語調宛如真人的語音。以 DeepMind 的語音合成專業知識為基礎所打造的 API,可提供擬真的語音。
提供超過 380 種語音選項,支援 50 多種語言和方言,包括中文、北印度文、西班牙文、阿拉伯文、俄文等。您可以挑選最適合使用者和應用程式的語音。
創造獨特的語音,讓您在所有客戶接觸點上呈現自己的品牌特色,而不是與其他機構共用相同的語音。
示範
自由輸入內容、選取所需語言,然後按一下「Speak It」即可聆聽。
主要功能與特色
打造互動性高的虛擬服務專員,運用以 AudioLM 為基礎的最新自然對話語音提供服務。這些語音提供高品質音訊、低延遲串流,並加入準確語調及仿真人不順暢的語流,打造自然的語音。
使用專業人員在錄音室等級的環境中錄製的講述內容,讓聽眾為之驚艷。戴上耳機聽,效果更出色。
您現在可以生成多位說話者的對話,打造互動性最高的情境。
Neural2 語音採用 Custom Voice 幕後的最新研究,且立即可用,可讓您打造出國際化的語音體驗。
用自己錄製的音訊訓練自訂語音模型,為機構打造聽起來更自然的獨特語音。您可以定義及選擇適合貴機構的語音設定檔,並因應語音需求變化迅速調整,完全不需要錄製新的詞組。
您可以使用語音合成標記語言 (SSML) 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。
說明文件
使用案例
將您的裝置當做文字閱讀器使用,讓裝置發出擬真語音,與使用者自然地溝通。搭配使用 Speech-to-Text 和 Natural Language 來建立端對端語音使用者介面,以輕鬆而吸引人的互動來改善使用者體驗。
輕鬆讓系統讀出電子節目表的文字內容,藉此為客戶提供更優質的使用者體驗,並讓您的服務和應用程式符合無障礙需求。試試電子節目表示範。
輕鬆將文字轉語音功能導入電子節目表,為客戶提供更優質的使用者體驗,並讓服務和應用程式符合無障礙需求。
所有功能與特色
Custom Voice | 用自己錄製的音訊訓練自訂語音合成模型,為機構打造獨特而自然的語音。您可以定義及選擇適合貴機構的語音設定檔,並且能因應語音需求的變化而快速調整,完全不用錄製新的詞組。瞭解詳情。 |
長音訊合成功能 | 使用 長音訊合成功能,以非同步的方式合成最多 100 萬個位元組的輸入內容。 |
語音和語言選項 | 針對 40 多種語言和方言提供超過 220 種語音,而且即將推出更多選項。 |
WaveNet 語音 | 運用以 DeepMind 突破性研究為基礎而建立的 90 多種 WaveNet 語音,產生與真人更加相似的語音內容。 |
文字與 SSML 支援 | 您可以使用語音合成標記語言 (SSML) 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。 |
音調微調 | 自訂所選語音的音調,最多可以比預設音調升高或降低 20 個半音。 |
誦讀速度微調 | 您可以將誦讀速度調整為比正常速度快或慢 4 倍。 |
音量增益控制 | 輸出音量最多可以提高 16 db 或降低 96 db。 |
整合 REST 和 gRPC API | 輕鬆整合可傳送 REST 或 gRPC 要求的任何應用程式或裝置,包括手機、電腦、平板電腦和 IoT 裝置 (例如汽車、電視與喇叭)。 |
多種音訊格式 | 將文字轉換為 MP3、Linear16、OGG Opus 和其他多種音訊格式。 |
音訊設定檔 | 可針對用來播放語音的喇叭類型進行最佳化處理,例如耳罩式耳機或電話聽筒。 |
定價
系統每月計算 Text-to-Speech 的費用時,會按照傳送至這項服務進行音訊合成的字元數計費。WaveNet 語音每月前 100 萬個字元免費。如果是標準 (非 WaveNet) 語音,則每月前 400 萬個字元免費。免費方案的額度用完後,系統會依據 Text-to-Speech 處理的文字量向您收費 (計費單位為 100 萬個字元)。
如果使用美元以外的貨幣付費,系統將按照 Google Cloud SKU 頁面上列出的相應貨幣價格計費。